Google представила Gemini, искусственный интеллект, призванный конкурировать с ChatGPT. Разработанный для превосходства над GPT-4 в большинстве тестов, Gemini является значительным шагом в развитии ИИ, согласно заявлениям генерального директора Google Сундара Пичаи. Он предназначен для влияния на всю линейку продуктов Google и будет доступен для публичного использования с 13 декабря.
Разнообразные предложения: Gemini Nano, Pro и Ultra
Под общим названием Gemini Google представила несколько моделей искусственного интеллекта. Gemini Nano, предназначенный для устройств Android, предшествует ожидаемому выпуску Gemini Pro, который будет использоваться в различных сервисах Google, в том числе в чат-боте Bard. Самая мощная модель, Gemini Ultra, заявлена как крупнейшая модель LLM от Google и, вероятно, предназначена для центров обработки данных и корпоративных приложений.
Детали выпуска и доступ
13 декабря будут запущены Gemini, Pro и Nano. Доступ к модели Pro будет предоставлен через чат-бота Bard, а разработчики и корпоративные клиенты смогут использовать Google Generative AI Studio или Vertex AI в облаке Google. Стоит отметить, что версия Bard, работающая на базе Pro, пока не будет доступна в Великобритании и Швейцарии из-за задержек в согласовании выпуска с местными регуляторами. Что касается Ultra, она все еще находится в стадии тестирования и появится только в 2024 году.
Расширение и интеграция
Изначально доступная только на английском языке, Gemini планирует поддерживать другие языки в ближайшее время. По словам Пичаи, его окончательная цель — интеграция в поисковую систему Google, рекламные продукты, браузер Chrome и другие приложения.
Мультимодальные возможности и производительность
Gemini является мультимодальной моделью, способной обрабатывать текст, аудио, изображения, видео и код. Тестирование Google по сравнению с GPT-4 показало, что Ultra превосходит его в 30 из 32 тестов производительности, включая рассуждения и распознавание изображений. Кроме того, модель Pro превзошла GPT-3.5 в шести из восьми тестов.
Достижения и будущие разработки
Ultra достигла значимого успеха, превзойдя людей в многофункциональном тесте MMLU, охватывающем 57 предметов, таких как математика, физика, право, медицина и этика. Её интеграция в инструмент AlphaCode2, который, по заявлению Google, превосходит 85% программистов-людей в тестах, является важным достижением.
Преимущества и перспективы
Основное преимущество Gemini заключается в его мультимодальности; в отличие от отдельных моделей для распознавания голоса и изображений, Google создала единую модель с самого начала. Обещая непрерывные улучшения в восприятии, Google стремится к тому, чтобы Gemini развивался в сторону более глубокого понимания и точности, что подтверждается словами генерального директора DeepMind Демиса Хассабиса.