Контекстное окно Gemini 1.5 Pro 2M, возможности выполнения кода и Gemma 2 теперь доступны. Узнать больше

Эта страница переведена с помощью Cloud Translation API.

Gemini

1.5 искры

Наша самая быстрая и экономичная мультимодальная модель с отличной производительностью для высокочастотных задач.

Вводите аудио, изображения, видео и текст, получайте текстовые ответы.
Генерируйте код, извлекайте данные, редактируйте текст и многое другое.
Лучше всего подходит для узких, высокочастотных задач.

1.5 Про

Наша самая эффективная мультимодальная модель с функциями для широкого спектра задач рассуждения.

Вводите аудио, изображения, видео и текст, получайте текстовые ответы.
Генерируйте код, извлекайте данные, редактируйте текст и многое другое.
Когда вам нужно повысить производительность

Варианты модели

Gemini API предлагает различные модели, оптимизированные для конкретных случаев использования. Вот краткий обзор доступных вариантов Gemini:

Вариант модели	Вход(ы)	Выход	Оптимизирован для
Близнецы 1.5 Про `gemini-1.5-pro`	Аудио, изображения, видео и текст	Текст	Сложные задачи рассуждения, такие как генерация кода и текста, редактирование текста, решение проблем, извлечение и генерация данных.
Близнецы 1.5 Флэш `gemini-1.5-flash`	Аудио, изображения, видео и текст	Текст	Быстрая и универсальная производительность при выполнении широкого спектра задач.
Близнецы 1.0 Про `gemini-1.0-pro`	Текст	Текст	Задачи на естественном языке, многоходовой текстовый и кодовый чат, а также генерация кода
Встраивание текста `text-embedding-004`	Текст	Встраивание текста	Измерение связанности текстовых строк
АКА `aqa`	Текст	Текст	Предоставление обоснованных ответов на вопросы

В следующей таблице описаны атрибуты моделей Gemini, общие для всех вариантов модели:

Атрибут	Описание
Данные обучения	Крайний срок получения информации для Близнецов — ноябрь 2023 года. Знания о событиях после этого времени ограничены.
Поддерживаемые языки	Посмотреть доступные языки
Настраиваемые параметры модели	Топ р Топ к Температура Остановить последовательность Максимальная длина вывода Количество кандидатов на ответ

Информацию о каждом из этих параметров см. в разделе «Параметры модели» руководства по генеративным моделям.

Близнецы 1.5 Флэш

Gemini 1.5 Flash — быстрая и универсальная мультимодальная модель для масштабирования под самые разнообразные задачи.

Попробуйте в AI Studio

Детали модели

Свойство	Описание
Код модели	`models/gemini-1.5-flash`
Поддерживаемые типы данных	Входы Аудио, изображения, видео и текст Выход Текст
Лимиты токенов ^[*]	Лимит входных токенов 1 048 576 Лимит выходных токенов 8,192
Аудио/видео характеристики	Максимальное количество изображений в запросе 3600 Максимальная длина видео 1 час Максимальная длина звука Примерно 9,5 часов
Ограничения скорости ^[**]	Бесплатно: 15 об/мин 1 миллион транзакций в минуту 1500 РПД Плати как сможешь: 1000 об/мин 2 миллиона транзакций в минуту
Возможности	Системные инструкции Поддерживается JSON-режим Поддерживается Схема JSON Не поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Поддерживается Тюнинг Поддерживается Вызов функции Поддерживается Конфигурация вызова функции Поддерживается Выполнение кода Поддерживается
версии	Последний: `gemini-1.5-flash-latest` Последняя стабильная версия: `gemini-1.5-flash` Стабильно: `gemini-1.5-flash-001`
Последнее обновление	май 2024 г.

Близнецы 1.5 Про

Gemini 1.5 Pro — это мультимодальная модель среднего размера, оптимизированная для широкого спектра задач рассуждения. 1.5 Pro может обрабатывать большие объемы данных одновременно, включая 2 часа видео, 19 часов аудио, кодовые базы с 60 000 строк кода или 2000 страниц текста.

Попробуйте в AI Studio

Детали модели

Свойство	Описание
Код модели	`models/gemini-1.5-pro`
Поддерживаемые типы данных	Входы Аудио, изображения, видео и текст Выход Текст
Лимиты токенов ^[*]	Лимит входных токенов 2 097 152 Лимит выходных токенов 8,192
Аудио/видео характеристики	Максимальное количество изображений в запросе 7200 Максимальная длина видео 2 часа Максимальная длина звука Примерно 19 часов
Ограничения скорости ^[**]	Бесплатно: 2 об/мин 32 000 транзакций в минуту 50 РПД Плати как сможешь: 360 об/мин 2 миллиона транзакций в минуту 10 000 РПД
Возможности	Системные инструкции Поддерживается JSON-режим Поддерживается Схема JSON Поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Поддерживается Тюнинг Не поддерживается Вызов функции Поддерживается Конфигурация вызова функции Поддерживается Выполнение кода Поддерживается
версии	Последний: `gemini-1.5-pro-latest` Последняя стабильная версия: `gemini-1.5-pro` Стабильно: `gemini-1.5-pro-001` Экспериментальный: `gemini-1.5-pro-exp-0801`
Последнее обновление	май 2024 г.

Близнецы 1.0 Про

Gemini 1.0 Pro — это модель НЛП, которая решает такие задачи, как многоходовой текстовый и кодовый чат, а также генерация кода.

Попробуйте в AI Studio

Детали модели

Свойство	Описание
Код модели	`models/gemini-1.0-pro`
Поддерживаемые типы данных	Вход Текст Выход Текст
Ограничения скорости ^[**]	Бесплатно: 15 об/мин 32 000 транзакций в минуту 1500 РПД Плати как сможешь: 360 об/мин 120 000 транзакций в минуту 30 000 РПД
Возможности	Системные инструкции Не поддерживается JSON-режим Не поддерживается Схема JSON Не поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Не поддерживается Тюнинг Поддерживается Вызов функции Поддерживается Конфигурация вызова функции Не поддерживается Выполнение кода Не поддерживается
версии	Последний: `gemini-1.0-pro-latest` Последняя стабильная версия: `gemini-1.0-pro` Стабильная версия: `gemini-1.0-pro-001`
Последнее обновление	февраль 2024 г.

Примечание. gemini-pro — это псевдоним gemini-1.0-pro .

Встраивание текста и встраивание

Встраивание текста

Встраивание текста используется для измерения связанности строк и широко используется во многих приложениях искусственного интеллекта.

text-embedding-004 обеспечивает более высокую производительность поиска и превосходит существующие модели сопоставимых размеров по стандартным тестам встраивания MTEB.

Детали модели

Свойство	Описание
Код модели	Близнецы API `models/text-embedding-004`
Поддерживаемые типы данных	Вход Текст Выход Встраивание текста
Лимиты токенов ^[*]	Лимит входных токенов 2048 Размер выходного размера 768
Ограничения скорости ^[**]	1500 запросов в минуту
Регулируемые настройки безопасности	Не поддерживается
Последнее обновление	апрель 2024 г.

Встраивание

Вы можете использовать модель внедрения для создания внедрений текста для входного текста.

Модель внедрения оптимизирована для создания внедрений с 768 измерениями для текста длиной до 2048 токенов.

Встраивание деталей модели

Свойство	Описание
Код модели	`models/embedding-001`
Поддерживаемые типы данных	Вход Текст Выход Встраивание текста
Лимиты токенов ^[*]	Лимит входных токенов 2048 Размер выходного размера 768
Ограничения скорости ^[**]	1500 запросов в минуту
Регулируемые настройки безопасности	Не поддерживается
Последнее обновление	декабрь 2023 г.

АКА

Вы можете использовать модель AQA для выполнения задач, связанных с атрибутивными вопросами-ответами (AQA), над документом, корпусом или набором отрывков. Модель AQA возвращает ответы на вопросы, основанные на предоставленных источниках, а также оценивает вероятность ответа.

Детали модели

Свойство	Описание
Код модели	`models/aqa`
Поддерживаемые типы данных	Вход Текст Выход Текст
Поддерживаемый язык	Английский
Лимиты токенов ^[*]	Лимит входных токенов 7,168 Лимит выходных токенов 1024
Ограничения скорости ^[**]	1500 запросов в минуту
Регулируемые настройки безопасности	Поддерживается
Последнее обновление	декабрь 2023 г.

Посмотрите примеры , чтобы изучить возможности этих вариантов модели.

[*] Токен эквивалентен примерно 4 символам для моделей Gemini. 100 токенов — это примерно 60-80 английских слов.

[**] Число запросов в минуту: количество запросов в минуту.
TPM: токенов в минуту
RPD: запросов в день
TPD: токенов в день

Из-за ограничений емкости указанные ограничения максимальной скорости не гарантируются.

Шаблоны названий версий моделей

Модели Gemini доступны в предварительной или стабильной версиях. В своем коде вы можете использовать один из следующих форматов имени модели, чтобы указать, какую модель и версию вы хотите использовать.

Последняя: указывает на новейшую версию модели для указанного поколения и модификации. Базовая модель регулярно обновляется и может представлять собой предварительную версию. Этот псевдоним следует использовать только в приложениях и прототипах исследовательского тестирования.
Чтобы указать последнюю версию, используйте следующий шаблон: <model>-<generation>-<variation>-latest . Например, gemini-1.0-pro-latest .
Последняя стабильная версия: указывает на самую последнюю стабильную версию, выпущенную для указанного поколения и варианта модели.
Чтобы указать последнюю стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation> . Например, gemini-1.0-pro .
Стабильная: указывает на конкретную стабильную модель. Стабильные модели не меняются. Большинство производственных приложений должны использовать определенную стабильную модель.
Чтобы указать стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation>-<version> . Например, gemini-1.0-pro-001 .

Доступные языки

Модели Gemini обучены работе со следующими языками:

арабский ( ar )
Бенгальский ( bn )
Болгарский ( bg )
Китайский упрощенный и традиционный ( zh )
Хорватский ( hr )
Чешский ( cs )
датский ( da )
голландский ( nl )
английский ( en )
Эстонский ( et )
финский ( fi )
французский ( fr .)
немецкий ( de )
Греческий ( el )
Иврит ( iw )
Хинди ( hi )
венгерский ( hu )
Индонезийский ( id )
Итальянский ( it )
японский ( ja )
Корейский ( ko )
Латышский ( lv .)
Литовский ( lt )
Норвежский ( no )
польский ( pl )
Португальский ( pt )
Румынский ( ro )
Русский ( ru )
Сербский ( sr )
словацкий ( sk )
Словенский ( sl )
Испанский ( es )
Суахили ( sw .)
Шведский ( sv )
тайский ( th )
турецкий ( tr )
Украинский ( uk )
Вьетнамский ( vi )