Компанія оголосила про запуск нової просунутої моделі ШІ під назвою Gemini. Вперше її анонсували кілька місяців тому в рамках заходу Google I/O 2023, але впровадження Gemini починається лише зараз.
Це просунута мовна модель, яка буде запущена у трьох версіях — Nano, Pro та Ultra. Найпростіша версія Gemini Nano призначена для автономної роботи на пристроях з Android, включаючи телефон Pixel 8 Pro. Gemini Pro стане основною для сервісів Google AI та буде вбудована в чат-бот Bard. Версія Gemini Ultra є найбільшою моделлю LLM, коли-небудь створеною Google, вона призначена для корпоративного сегмента та центрів обробки даних.
Gemini має стати основною зброєю Google у боротьбі з GPT-4 від OpenAI. Згідно з даними спеціалізованих тестів, включаючи багатозадачне розуміння та генерування коду для Python, ШІ Gemini впевнено обходить конкурента. Особливістю Gemini є здатність розуміти не лише текст, але зображення, відео та звук. Якщо OpenAI створює окремі ШІ, включаючи DALL-E та Whisper, під різні завдання, то нейромережа Google відразу створювалася та тренувалася як універсальна мультимодальна модель. Але базова модель Gemini поки що підтримує лише введення та виведення тексту, а Gemini Ultra вже може працювати із зображеннями, відео та аудіо. Згодом Gemini стане ще краще, здобуде більше «почуттів» і краще розумітиме світ.
Цікаво, що для навчання нейромережі використовувалися тензорні процесори Google, тобто компанія обійшлася без прискорювачів Nvidia. Одночасно оголошено про запуск нових прискорювачів Google TPU v5p для ШІ. Ці чипи будуть використовуватися в серверних кластерних системах для навчання ШІ.
Джерело:
The Verge