ШІ Claude 3.7 Sonnet проходить Pokemon на Twitch

Днями компанія Anthropic запустила нову модель ШІ Claude 3.7 Sonnet зі здатністю до гібридних міркувань. Цей ШІ може давати як швидкі відповіді, так і довші виважені відповіді після внутрішніх міркувань над питанням. Розробники та користувачі активно експериментують із Claude 3.7 Sonnet, тестуючи можливості ШІ. Як експеримент творці запустили трансляцію на Twicth, в якій нова модель грає в стару гру Pokemon Red. Claude 3.7 Sonnet використовує свої здібності до міркувань для розв'язання завдань та ігрових ситуацій у грі. Відбуватиметься це зі змінним успіхом, кожен крок вимагає серйозних «розумових» зусиль. Наприклад, на кілька годин ШІ застопорився в проходженні, коли натрапив на стіну і не міг її пройти. Також ШІ заплутався в моменті, коли треба було знайти професора, але на локації були інші NPC.

Проходження супроводжується демонстрацією роботи ШІ в реальному часі. Ліворуч від гри виводиться опис процесу «мислення» у формі природної мови. Можна почитати, як ШІ сприймає завдання, намагається їх усвідомити та виконати. Очевидно, поки це лише кумедний експеримент для демонстрації сучасних технологій. При цьому Claude 3.7 Sonnet справляється з грою краще за попередню версію 3.5, яка не змогла пройти початковий етап, не знайшовши вихід із будинку гравця.

Це не перший випадок, коли дослідники використовують ігри для тестування моделей ШІ. Понад десять років тому Pokemon ставала об'єктом соціального експерименту Twitch Plays Pokemon, коли глядачі намагалися колективно пройти гру, керуючи героєм через чат. І це підштовхнуло різних дослідників до експериментів із навчання ШІ в цій грі.

Джерело:
TechCrunch

Ще новини:

Популярність чат-ботів із ШІ зростає, але за трафіком вони поступаються пошуковим системам у 34 рази

Noctua підготувала кріплення для встановлення кулера NH-D15 G2 зі зміщенням на процесори Intel LGA1851

Гра Alien: Rogue Incursion отримає версію не для VR і вийде у вересні

Останні огляди:

Огляд гарнітури HATOR Hypergang 3 USB

Огляд і тестування «титанового» блока живлення MSI MEG Ai1600T PCIE5 потужністю 1600 Вт і стандарту ATX 3.1

Огляд та тестування ігрового 16″ ноутбука Acer Nitro V 16 на базі процесора AMD Ryzen 5 8645HS та відеокарти Nvidia GeForce RTX 4060