Долари, а не токени: чому частка ринку ШІ-моделей — небезпечна ілюзія
Управляючий партнер Dragonfly Хасіб Куреші виступив із різкою критикою поточного підходу до оцінки ринку ШІ-моделей. На його думку, аналіз на основі споживання токенів — особливо на платформі OpenRouter — веде до фундаментально помилкових висновків. Справжній показник — долари, витрачені користувачами, а не обсяг сирих токенів.
Проблема, на думку Куреші, криється в кількох ключових викривленнях. Перше — це субсидії. Китайські лабораторії регулярно запускають моделі з агресивними знижками або взагалі безкоштовним доступом. Це приваблює потік користувачів, які перескакують з однієї безкоштовної моделі на іншу, роздуваючи токенну статистику, але не приносячи реального виторгу. Другий фактор — величезний розкид у вартості токена залежно від розміру моделі. Невелика модель на кшталт Qwen 3.5-27B може бути в сто разів дешевшою за токен, ніж флагманський Claude Opus. Різкий стрибок частки Qwen на графіку OpenRouter виглядає вражаюче, але економічно це може бути краплею в морі. Коректний аналіз, підкреслює Куреші, можливий лише всередині вагових категорій.
Системи-пожирачі токенів і «сліпа» статистика OpenRouter
Третя пастка — багатоагентні системи. Можна витратити однакову суму на складну архітектуру на базі DeepSeek або GLM 5.2 і на один запит до топової моделі на кшталт Opus. При порівнянній продуктивності багатоагентна конфігурація спалюватиме в рази більше токенів за ті самі гроші. «Якщо 5% використання Opus перейде в таку систему з чотириразовою витратою токенів, графік покаже втрату 18% частки Opus, хоча реальні витрати змістяться лише на 5%», — пояснює Куреші. Це драматично перебільшує значення дешевих токенів.
Четвертий нюанс — сам вибір OpenRouter як джерела даних. Якщо компанія вже визначилася з постачальником (Anthropic або OpenAI), їй вигідніше працювати напряму, оминаючи націнку платформи. На графіках OpenRouter це виглядає як зниження частки американських моделей, хоча реальне споживання просто йде за межі платформи. Висновок Куреші безкомпромісний: OpenRouter корисний лише для порівняння всередині сегмента відкритих моделей, але абсолютно непридатний для зіставлення відкритих і закритих екосистем.
Тиск ціни: майбутнє за дешевими моделями?
Цю логіку розвиває засновник SageRoad Research Тревор Норен. Він наводить дані JPMorgan: багато майбутніх токенів споживатимуться не передовими, а невеликими відкритими моделями, достатніми для конкретних завдань. Amazon уже пропонує близько півтисячі відкритих моделей за ціною в частки від вартості флагманів, а Nvidia разом із Dell, Lenovo та HP створює комп'ютери для ШІ-агентів. При цьому власні міні-моделі американських гігантів (Claude Haiku, GPT-5.4-mini) поки неконкурентоспроможні на «ефективному кордоні», де зараз домінують китайські розробники: DeepSeek, MiniMax, Xiaomi та Alibaba.
Особливо показовий приклад вартості. Запуск набору завдань Artificial Analysis Intelligence Index на Claude Opus 4.8 обходиться в $3 700 при результаті 56 балів. DeepSeek V4 Pro набирає 44 бали всього за $186 — це приблизно в 20 разів дешевше. Висновок очевидний: передовий інтелект потрібен не для всього, а там, де він необхідний, GLM 5.2 від Z.ai вже можна порівняти з топовими моделями Anthropic та OpenAI.
Думка експерта: Аргументи Куреші та Норена — це не просто академічна суперечка. Для криптоіндустрії, де метрики «on-chain» часто сприймаються як абсолютна істина, це важливе нагадування: сирі дані без контексту монетизації можуть вводити в оману. Ринок ШІ рухається до комодитизації, і реальна битва точитиметься не за токени, а за долари корпоративних бюджетів, які шукають максимальну ефективність. Перемога китайських моделей у сегменті «ціна-якість» — це не просто тренд, а довгостроковий структурний зсув.