Модель штучного інтелекту Claude від компанії Anthropic у 20 разів перевершила людей-інженерів в управлінні робособакою

Новий етап експерименту Project Fetch від Anthropic продемонстрував вражаючий прорив в автономності штучного інтелекту. Модель Claude Opus 4.7 виконала повний цикл налаштування та керування чотириногим роботом у 20 разів швидше, ніж це зробили б найкращі команди інженерів-людей, які працювали з попередніми версіями ШІ.
Еволюція автономності: від помічника до оператора
У серпні 2024 року співробітники Anthropic без досвіду в робототехніці намагалися запрограмувати робособаку за підтримки ШІ. Тоді нейромережа виступала лише в ролі радника. У новій фазі тестування Claude Opus 4.7 діяла практично повністю самостійно, під мінімальним наглядом дослідника. Модель самостійно виконала такі ключові завдання:
- підключилася до датчиків відео та лідару;
- написала програму для ручного керування;
- створила систему моніторингу шляху робота;
- налаштувала алгоритм розпізнавання предметів.
Ключовий показник ефективності — швидкість. Opus 4.7 виявилася у 18 разів швидшою за команду, яка використовувала старі версії ШІ, та у 37 разів швидшою за людей, які працювали без допомоги чат-бота. При цьому нейромережа писала код, який виявився у 10 разів компактнішим, ніж у людських команд, що свідчить про глибше розуміння архітектури системи.
Побічний ефект масштабування
Автори проєкту зазначають, що цей прорив не став результатом впровадження спеціалізованих алгоритмів для керування «залізом». Прогрес у робототехніці виявився побічним ефектом загального масштабування мовних моделей. Це підтверджує гіпотезу про те, що універсальні ШІ-системи здатні освоювати фізичні завдання без додаткового навчання, просто за рахунок покращення базових когнітивних здібностей.
Обмеження: фізика поки не піддається
Незважаючи на вражаючі результати, Claude все ще відчуває серйозні труднощі з точними фізичними діями в реальному часі. Модель змогла довести робота до цілі, але не впоралася із завданням акуратно підштовхнути м'яч у потрібну точку. Для таких операцій потрібен складний зворотний зв'язок сенсорів і моторики, де люди поки зберігають перевагу. Як влучно зауважили в Anthropic, «робособака так і не змогла принести пляжний м'яч».
В Anthropic впевнені, що індустрія вступає в еру «фізичних ШІ-агентів». У найближчому майбутньому нейромережі зможуть використовувати стандартні інструменти та обладнання так само ефективно, як зараз вони працюють із програмним кодом. Нагадаю, що 13 червня компанія була змушена зупинити доступ до моделей Fable 5 та Mythos 5 через директиву уряду США в рамках експортного контролю, що підкреслює зростаючу геополітичну значущість цих технологій.
Експертний коментар Cryptalist: Цей експеримент — яскрава демонстрація того, що ми рухаємося до точки, де ШІ зможе не лише аналізувати дані, а й самостійно керувати фізичними системами. Однак провал із м'ячем нагадує: від програмування до реальної взаємодії зі світом — дистанція величезного розміру. Інвесторам варто стежити за компаніями, які вирішують проблему «тактильного зворотного зв'язку» — це буде наступним великим рубежем.