Компания объявила о запуске новой продвинутой модели ИИ под названием Gemini. Впервые его анонсировали несколько месяцев назад в рамках мероприятия Google I/O 2023, но внедрение Gemini начинается только сейчас.
Это продвинутая языковая модель, которая будет запущена в трех версиях — Nano, Pro и Ultra. Самая простая версия Gemini Nano предназначена для автономной работы на устройствах с Android, включая телефон Pixel 8 Pro. Gemini Pro станет основной для сервисов Google AI и она же будет встроена в чат-бот Bard. Версия Gemini Ultra является самой крупной моделью LLM, когда-либо созданной Google, она предназначена для корпоративного сегмента и центров обработки данных.
Gemini должен стать основным оружием Google в борьбе с GPT-4 от OpenAI. Согласно специализированным тестам, включая многозадачное понимание и генерирование кода для Python, ИИ Gemini уверенно превосходит конкурента. Особенностью Gemini является способность понимать не только текст, но изображение, видео и звук. Если OpenAI создает отдельные ИИ, включая DALL-E и Whisper, под разные задачи, то нейросеть Google изначально создавалась и тренировалась как универсальная мультимодальная модель. Однако пока базовая модель Gemini поддерживает лишь ввод и вывод текста, а Gemini Ultra уже может работать с изображениями, видео и аудио. Со временем Gemini станет еще лучше, обретет больше «чувств» и станет лучше понимать мир.
Интересно, что для обучения нейросети использовались тензорные процессоры Google, то есть компания обошлась без ускорителей Nvidia. Одновременно объявлено о запуске новых ускорителей Google TPU v5p для ИИ. Эти чипы будут использоваться в серверных кластерных системах для обучения ИИ.
Источник:
The Verge