Кілька місяців тому компанія OpenAI представила потужну модель штучного інтелекту o1, яка здатна до міркування. Нещодавно доступ до неї включено до складу нового платного тарифу ChatGPT Pro вартістю $200 на місяць. А тепер компанія анонсувала вже нове покоління ШІ o3. Ця модель є прямим наступником o1, але ще кращою та потужнішою. Цікаво, що від назви o2 творці відмовилися, щоб уникнути можливих юридичних проблем з однойменним британським оператором зв'язку.

Нова модель o3 використовує механізм перевірки власних тверджень, що зменшує ймовірність так званих «галюцинацій ШІ», але вимагає додаткових ресурсів. Не випадково, минула версія цієї моделі призвела до введення дорогого тарифу. Для ШІ використовувався метод навчання з підкріпленням (reinforcement learning). Модель здатна на міркування і планування, найкраще проявляючи себе в складних дисциплінах, наприклад, у науці або в програмуванні.

Згідно з наявними спеціалізованими тестами o3 помітно перевершує всі інші моделі ШІ та  подекуди наближається до так званого загального штучного інтелекту AGI (Artificial general intelligence), який можна буде порівняти з живою людиною. У тесті ARC-AGI, розробленому для оцінки того, чи може система ШІ ефективно набувати нових навичок за межами своєї бази знань, модель o3 набрала 87,5% і втричі обійшла o1. У тесті SWE-Bench Verified, який орієнтований на завдання програмування, o3 краща за o1 майже на 23%. У тестах AIME 2024 і GPQA Diamond різниця між моделями ще менша.

Але в математичному тесті EpochAI Frontier Math новий ШІ виконав 25,2% завдань, тоді як інші моделі показали результати до 2%.

Основним недоліком нової моделі є необхідність у великих обчислювальних ресурсах. Тому деякі фахівці вважають, що розвиток «моделей міркування» не найкращий шлях. ШІ доступний у стандартній версії o3 та в спрощеній версії o3-mini. Їхнє навчання ще триває, і навіть приблизної дати запуску публічного доступу немає. Очевидно, що це станеться наступного року.

Джерело:
TechCrunch