Google представил новую линейку моделей искусственного интеллекта Gemini

6 февраля 10:02

Компания Google объявила о масштабном обновлении своей флагманской системы искусственного интеллекта, представив сразу несколько новых версий Gemini 2.0. Каждая модель имеет свои уникальные особенности и назначение, сообщает Коммерсант украинский.

Gemini 2.0 Flash: новое обновление для общего пользования

Gemini 2.0 Flash, впервые представленная на I/O 2024, стала популярной среди разработчиков как мощная рабочая модель. Она оптимизирована для выполнения задач с большим объемом данных и высокой частотой запросов.

Модель может обрабатывать различные типы данных благодаря мультимодальному подходу и имеет впечатляющее контекстное окно размером в 1 миллион токенов. Это позволяет ей анализировать и понимать огромные объемы информации.

Вскоре модель получит дополнительные возможности, включая генерацию изображений и преобразование текста в речь. Уже сейчас она доступна через API в Google AI Studio и Vertex AI, а также в приложении Gemini.

Gemini 2.0 Pro Experimental: самая мощная версия для сложных задач

Новая экспериментальная версия Gemini 2.0 Pro создана на основе отзывов разработчиков и является самой мощной моделью Google для программирования и сложных запросов. Она демонстрирует лучшие результаты в понимании и анализе мировых знаний.

Ключевой особенностью модели является самое большое контекстное окно размером в 2 миллиона токенов. Это позволяет ей всесторонне анализировать и понимать гораздо большие объемы информации, чем предыдущие версии.

Модель также получила возможность использовать дополнительные инструменты, такие как Google Search и выполнение кода. Она доступна разработчикам через Google AI Studio и Vertex AI, а также пользователям Gemini Advanced.

Gemini 2.0 Flash-Lite: экономичная версия для массового использования

В ответ на положительные отзывы о цене и скорости модели 1.5 Flash, Google представила новую версию 2.0 Flash-Lite. Эта модель обеспечивает лучшее качество, чем предшественница, сохраняя при этом ту же скорость и стоимость.

Как и полная версия Flash, она имеет контекстное окно в 1 миллион токенов и поддерживает мультимодальный ввод. Google приводит впечатляющий пример ее эффективности: модель может сгенерировать релевантные подписи для примерно 40 000 уникальных фотографий, потратив меньше доллара в платной версии Google AI Studio.

Новая модель уже доступна для публичного тестирования в Google AI Studio и Vertex AI, демонстрируя лучшие результаты, чем 1.5 Flash, в большинстве тестов производительности.

Google представил следующую таблицу со сравнительными характеристиками моделей:

Безопасность и ответственность

Google подчеркивает свое внимание к безопасности в новых моделях Gemini 2.0. Вся линейка использует новые методы обучения с подкреплением, где сама модель оценивает качество своих ответов.

Компания также внедрила автоматизированное тестирование для оценки рисков безопасности. Особое внимание уделяется защите от косвенных атак через введение вредоносных инструкций в данные, которые может обрабатывать AI-система.

Все новые модели поддерживают мультимодальный ввод с текстовым выводом, а дополнительные модальности станут доступны для всеобщего использования в ближайшие месяцы.

Как писал , ИИ от Google предположительно можно будет «расцензурить» для выдачи особого контента.

Дзвенислава Карплюк
Редактор