Gemini

Варианты модели

Gemini API предлагает различные модели, оптимизированные для конкретных случаев использования. Вот краткий обзор доступных вариантов Gemini:

Вариант модели Вход(ы) Выход Оптимизирован для
Близнецы 1.5 Про
gemini-1.5-pro
Аудио, изображения, видео и текст Текст Сложные задачи рассуждения, такие как генерация кода и текста, редактирование текста, решение проблем, извлечение и генерация данных.
Близнецы 1.5 Флэш
gemini-1.5-flash
Аудио, изображения, видео и текст Текст Быстрая и универсальная производительность при выполнении широкого спектра задач.
Близнецы 1.0 Про
gemini-1.0-pro
Текст Текст Задачи на естественном языке, многоходовой текстовый и кодовый чат, а также генерация кода
Встраивание текста
text-embedding-004
Текст Встраивание текста Измерение связанности текстовых строк
АКА
aqa
Текст Текст Предоставление обоснованных ответов на вопросы

В следующей таблице описаны атрибуты моделей Gemini, общие для всех вариантов модели:

Атрибут Описание
Данные обучения Крайний срок получения информации для Близнецов — ноябрь 2023 года. Знания о событиях после этого времени ограничены.
Поддерживаемые языки Посмотреть доступные языки
Настраиваемые параметры модели
  • Топ р
  • Топ к
  • Температура
  • Остановить последовательность
  • Максимальная длина вывода
  • Количество кандидатов на ответ

Информацию о каждом из этих параметров см. в разделе «Параметры модели» руководства по генеративным моделям.

Близнецы 1.5 Флэш

Gemini 1.5 Flash — быстрая и универсальная мультимодальная модель для масштабирования под самые разнообразные задачи.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-flash
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

1 048 576

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

3600

Максимальная длина видео

1 час

Максимальная длина звука

Примерно 9,5 часов

Ограничения скорости [**]
Бесплатно:
  • 15 об/мин
  • 1 миллион транзакций в минуту
  • 1500 РПД
Плати как сможешь:
  • 1000 об/мин
  • 2 миллиона транзакций в минуту
Возможности

Системные инструкции

Поддерживается

JSON-режим

Поддерживается

Схема JSON

Не поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Поддерживается

Выполнение кода

Поддерживается

версии
  • Последний: gemini-1.5-flash-latest
  • Последняя стабильная версия: gemini-1.5-flash
  • Стабильно: gemini-1.5-flash-001
Последнее обновление май 2024 г.

Близнецы 1.5 Про

Gemini 1.5 Pro — это мультимодальная модель среднего размера, оптимизированная для широкого спектра задач рассуждения. 1.5 Pro может обрабатывать большие объемы данных одновременно, включая 2 часа видео, 19 часов аудио, кодовые базы с 60 000 строк кода или 2000 страниц текста.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-pro
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

2 097 152

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

7200

Максимальная длина видео

2 часа

Максимальная длина звука

Примерно 19 часов

Ограничения скорости [**]
Бесплатно:
  • 2 об/мин
  • 32 000 транзакций в минуту
  • 50 РПД
Плати как сможешь:
  • 360 об/мин
  • 2 миллиона транзакций в минуту
  • 10 000 РПД
Возможности

Системные инструкции

Поддерживается

JSON-режим

Поддерживается

Схема JSON

Поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Не поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Поддерживается

Выполнение кода

Поддерживается

версии
  • Последний: gemini-1.5-pro-latest
  • Последняя стабильная версия: gemini-1.5-pro
  • Стабильно: gemini-1.5-pro-001
  • Экспериментальный: gemini-1.5-pro-exp-0801
Последнее обновление май 2024 г.

Близнецы 1.0 Про

Gemini 1.0 Pro — это модель НЛП, которая решает такие задачи, как многоходовой текстовый и кодовый чат, а также генерация кода.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.0-pro
Поддерживаемые типы данных

Вход

Текст

Выход

Текст

Ограничения скорости [**]
Бесплатно:
  • 15 об/мин
  • 32 000 транзакций в минуту
  • 1500 РПД
Плати как сможешь:
  • 360 об/мин
  • 120 000 транзакций в минуту
  • 30 000 РПД
Возможности

Системные инструкции

Не поддерживается

JSON-режим

Не поддерживается

Схема JSON

Не поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Не поддерживается

Тюнинг

Поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Не поддерживается

Выполнение кода

Не поддерживается

версии
  • Последний: gemini-1.0-pro-latest
  • Последняя стабильная версия: gemini-1.0-pro
  • Стабильная версия: gemini-1.0-pro-001
Последнее обновление февраль 2024 г.

Встраивание текста и встраивание

Встраивание текста

Встраивание текста используется для измерения связанности строк и широко используется во многих приложениях искусственного интеллекта.

text-embedding-004 обеспечивает более высокую производительность поиска и превосходит существующие модели сопоставимых размеров по стандартным тестам встраивания MTEB.

Детали модели
Свойство Описание
Код модели

Близнецы API

models/text-embedding-004

Поддерживаемые типы данных

Вход

Текст

Выход

Встраивание текста

Лимиты токенов [*]

Лимит входных токенов

2048

Размер выходного размера

768

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Не поддерживается
Последнее обновление апрель 2024 г.

Встраивание

Вы можете использовать модель внедрения для создания внедрений текста для входного текста.

Модель внедрения оптимизирована для создания внедрений с 768 измерениями для текста длиной до 2048 токенов.

Встраивание деталей модели
Свойство Описание
Код модели models/embedding-001
Поддерживаемые типы данных

Вход

Текст

Выход

Встраивание текста

Лимиты токенов [*]

Лимит входных токенов

2048

Размер выходного размера

768

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Не поддерживается
Последнее обновление декабрь 2023 г.

АКА

Вы можете использовать модель AQA для выполнения задач, связанных с атрибутивными вопросами-ответами (AQA), над документом, корпусом или набором отрывков. Модель AQA возвращает ответы на вопросы, основанные на предоставленных источниках, а также оценивает вероятность ответа.

Детали модели

Свойство Описание
Код модели models/aqa
Поддерживаемые типы данных

Вход

Текст

Выход

Текст

Поддерживаемый язык Английский
Лимиты токенов [*]

Лимит входных токенов

7,168

Лимит выходных токенов

1024

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Поддерживается
Последнее обновление декабрь 2023 г.

Посмотрите примеры , чтобы изучить возможности этих вариантов модели.

[*] Токен эквивалентен примерно 4 символам для моделей Gemini. 100 токенов — это примерно 60-80 английских слов.

[**] Число запросов в минуту: количество запросов в минуту.
TPM: токенов в минуту
RPD: запросов в день
TPD: токенов в день

Из-за ограничений емкости указанные ограничения максимальной скорости не гарантируются.

Шаблоны названий версий моделей

Модели Gemini доступны в предварительной или стабильной версиях. В своем коде вы можете использовать один из следующих форматов имени модели, чтобы указать, какую модель и версию вы хотите использовать.

  • Последняя: указывает на новейшую версию модели для указанного поколения и модификации. Базовая модель регулярно обновляется и может представлять собой предварительную версию. Этот псевдоним следует использовать только в приложениях и прототипах исследовательского тестирования.

    Чтобы указать последнюю версию, используйте следующий шаблон: <model>-<generation>-<variation>-latest . Например, gemini-1.0-pro-latest .

  • Последняя стабильная версия: указывает на самую последнюю стабильную версию, выпущенную для указанного поколения и варианта модели.

    Чтобы указать последнюю стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation> . Например, gemini-1.0-pro .

  • Стабильная: указывает на конкретную стабильную модель. Стабильные модели не меняются. Большинство производственных приложений должны использовать определенную стабильную модель.

    Чтобы указать стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation>-<version> . Например, gemini-1.0-pro-001 .

Доступные языки

Модели Gemini обучены работе со следующими языками:

  • арабский ( ar )
  • Бенгальский ( bn )
  • Болгарский ( bg )
  • Китайский упрощенный и традиционный ( zh )
  • Хорватский ( hr )
  • Чешский ( cs )
  • датский ( da )
  • голландский ( nl )
  • английский ( en )
  • Эстонский ( et )
  • финский ( fi )
  • французский ( fr .)
  • немецкий ( de )
  • Греческий ( el )
  • Иврит ( iw )
  • Хинди ( hi )
  • венгерский ( hu )
  • Индонезийский ( id )
  • Итальянский ( it )
  • японский ( ja )
  • Корейский ( ko )
  • Латышский ( lv .)
  • Литовский ( lt )
  • Норвежский ( no )
  • польский ( pl )
  • Португальский ( pt )
  • Румынский ( ro )
  • Русский ( ru )
  • Сербский ( sr )
  • словацкий ( sk )
  • Словенский ( sl )
  • Испанский ( es )
  • Суахили ( sw .)
  • Шведский ( sv )
  • тайский ( th )
  • турецкий ( tr )
  • Украинский ( uk )
  • Вьетнамский ( vi )