Днями компанія Anthropic запустила нову модель ШІ Claude 3.7 Sonnet зі здатністю до гібридних міркувань. Цей ШІ може давати як швидкі відповіді, так і довші виважені відповіді після внутрішніх міркувань над питанням. Розробники та користувачі активно експериментують із Claude 3.7 Sonnet, тестуючи можливості ШІ. Як експеримент творці запустили трансляцію на Twicth, в якій нова модель грає в стару гру Pokemon Red. Claude 3.7 Sonnet використовує свої здібності до міркувань для розв'язання завдань та ігрових ситуацій у грі. Відбуватиметься це зі змінним успіхом, кожен крок вимагає серйозних «розумових» зусиль. Наприклад, на кілька годин ШІ застопорився в проходженні, коли натрапив на стіну і не міг її пройти. Також ШІ заплутався в моменті, коли треба було знайти професора, але на локації були інші NPC.

ШІ Claude 3.7 Sonnet проходить Pokemon на Twitch

Проходження супроводжується демонстрацією роботи ШІ в реальному часі. Ліворуч від гри виводиться опис процесу «мислення» у формі природної мови. Можна почитати, як ШІ сприймає завдання, намагається їх усвідомити та виконати. Очевидно, поки це лише кумедний експеримент для демонстрації сучасних технологій. При цьому Claude 3.7 Sonnet справляється з грою краще за попередню версію 3.5, яка не змогла пройти початковий етап, не знайшовши вихід із будинку гравця.

Це не перший випадок, коли дослідники використовують ігри для тестування моделей ШІ. Понад десять років тому Pokemon ставала об'єктом соціального експерименту Twitch Plays Pokemon, коли глядачі намагалися колективно пройти гру, керуючи героєм через чат. І це підштовхнуло різних дослідників до експериментів із навчання ШІ в цій грі.

Джерело:
TechCrunch