OpenAI анонсувала ШІ нового покоління o3

Кілька місяців тому компанія OpenAI представила потужну модель штучного інтелекту o1, яка здатна до міркування. Нещодавно доступ до неї включено до складу нового платного тарифу ChatGPT Pro вартістю $200 на місяць. А тепер компанія анонсувала вже нове покоління ШІ o3. Ця модель є прямим наступником o1, але ще кращою та потужнішою. Цікаво, що від назви o2 творці відмовилися, щоб уникнути можливих юридичних проблем з однойменним британським оператором зв'язку.

Нова модель o3 використовує механізм перевірки власних тверджень, що зменшує ймовірність так званих «галюцинацій ШІ», але вимагає додаткових ресурсів. Не випадково, минула версія цієї моделі призвела до введення дорогого тарифу. Для ШІ використовувався метод навчання з підкріпленням (reinforcement learning). Модель здатна на міркування і планування, найкраще проявляючи себе в складних дисциплінах, наприклад, у науці або в програмуванні.

Згідно з наявними спеціалізованими тестами o3 помітно перевершує всі інші моделі ШІ та подекуди наближається до так званого загального штучного інтелекту AGI (Artificial general intelligence), який можна буде порівняти з живою людиною. У тесті ARC-AGI, розробленому для оцінки того, чи може система ШІ ефективно набувати нових навичок за межами своєї бази знань, модель o3 набрала 87,5% і втричі обійшла o1. У тесті SWE-Bench Verified, який орієнтований на завдання програмування, o3 краща за o1 майже на 23%. У тестах AIME 2024 і GPQA Diamond різниця між моделями ще менша.

Але в математичному тесті EpochAI Frontier Math новий ШІ виконав 25,2% завдань, тоді як інші моделі показали результати до 2%.

Основним недоліком нової моделі є необхідність у великих обчислювальних ресурсах. Тому деякі фахівці вважають, що розвиток «моделей міркування» не найкращий шлях. ШІ доступний у стандартній версії o3 та в спрощеній версії o3-mini. Їхнє навчання ще триває, і навіть приблизної дати запуску публічного доступу немає. Очевидно, що це станеться наступного року.

Джерело:
TechCrunch

Ще новини:

Acer представила ігрові монітори Predator X27U X1 та Predator X32 X2 з технологією QD-OLED

Масові поставки процесорів Intel Panther Lake почнуться тільки наступного року

Новий трейлер Elden Ring Nightreign демонструє клас Ironeye

Останні огляди:

Огляд та тестування відеокарти ASUS TUF Gaming GeForce RTX 5090 32GB OC Edition. Порівняння з GeForce RTX 4090 та іншими опонентами

Огляд та тестування процесора Intel Core Ultra 7 265K та платформи LGA 1851. Черговий «плиточний» представник

Огляд 14″ хромбука-трансформера Acer Chromebook Plus Spin 514