Ринок ШІ: долар, а не токен — ось справжній мірило сили
Управляючий партнер Dragonfly Хасіб Куреші виступив із різкою критикою поточного підходу до аналізу ринку ШІ-моделей. Його головний тезис: частка спожитих токенів — вкрай ненадійний і такий, що вводить в оману, показник. Порівнювати моделі потрібно виключно за витраченими доларами, а не за обсягом згенерованих токенів. Цей тезис я вважаю принципово важливим для розуміння реальної динаміки індустрії.
Чотири пастки токенової метрики
Перша проблема — субсидії. Китайські лабораторії регулярно запускають нові моделі з агресивними знижками або навіть безкоштовним доступом. Це приваблює користувачів, які мігрують між безкоштовними моделями, роздуваючи споживання токенів, але не витрачаючи реальних грошей. Графіки «частки ринку» в такому випадку малюють хибну картину.
Друга проблема — різний розмір моделей. Невелика модель на кшталт Qwen 3.5-27B коштує приблизно в сто разів дешевше за токен, ніж флагманський Claude Opus. Зростання використання Qwen може виглядати як різкий стрибок частки ринку, хоча економічно це — крапля в морі. Аналізувати потрібно всередині вагових категорій.
Третя проблема — мультиагентні системи. Однакову суму можна витратити на складну систему на базі DeepSeek або GLM 5.2 і на одну передову модель на кшталт Opus або GPT-5.5 Pro. Але мультиагентна конфігурація «спалить» набагато більше токенів за ті ж гроші. Як точно зауважив Куреші: якщо 5% використання Opus перетече в таку систему з чотириразовою витратою токенів, графік покаже ~18% втрати частки Opus, хоча реальні витрати змістяться лише на 5%. Такі графіки перебільшують значення дешевих токенів.
Четверта проблема — вибірка OpenRouter. Великі компанії, визначившись з однією передовою лабораторією, вважають за краще працювати безпосередньо з Anthropic або OpenAI, уникаючи націнки OpenRouter. На графіках це виглядає як зниження частки США, хоча токени просто йдуть за межі платформи. Висновок: OpenRouter корисний для оцінки частки всередині відкритих моделей, але не годиться для порівняння відкритих і закритих.
Майбутнє — за дешевими моделями?
Схожу думку розвинув засновник SageRoad Research Тревор Норен, пов'язавши її з ціновим тиском на індустрію. Він навів оцінку JPMorgan: багато токенів у майбутньому споживатимуться не передовими, а невеликими відкритими моделями, яких достатньо для конкретних завдань. Amazon вже пропонує близько півсотні відкритих моделей за ціною, що становить частку від вартості передових, а Nvidia разом із Dell, Lenovo та HP створює комп'ютери під ШІ-агентів.
Особливо наочний приклад вартості. Запуск набору завдань Artificial Analysis Intelligence Index на Claude Opus 4.8 обходиться в $3 700 при результаті 56 балів, тоді як DeepSeek V4 Pro набирає 44 бали всього за $186 — це приблизно в 20 разів дешевше. Висновок: передовий рівень інтелекту потрібен не для всього, а там, де він необхідний, GLM 5.2 від Z.ai виглядає порівнянним із топовими моделями Anthropic та OpenAI.
Норен вважає, що комодитизація моделей прийде не лише від конкуренції передових лабораторій, а й від компаній, які шукають контроль над витратами через дешевші вузькоспеціалізовані моделі. Обидві позиції сходяться в одному: вимірювати ринок штучного інтелекту потрібно за грошима, а не за токенами, і під тиском цін перевага все частіше зміщується до дешевих моделей.
Мій висновок: ринок ШІ вступає у фазу зрілості, де метрики «голого обсягу» поступаються місцем економічній ефективності. Інвестори та аналітики, які не перебудуються на доларову оцінку, ризикують пропустити тектонічний зсув у бік прагматичного вибору моделей. Китайські лабораторії вже захопили «ефективний кордон» у сегменті невеликих моделей, і це змінює правила гри.