Ринок ШІ: метрика успіху — долар, а не токен
Керуючий партнер венчурної фірми Dragonfly Хасіб Куреші виступив із різкою критикою поточної практики оцінки ринку ШІ-моделей. Його головний тезис: частка споживання токенів — це оманливий і часто помилковий показник. Єдино правильний спосіб порівняння, на його думку, — це аналіз грошових витрат, а не сирі дані про кількість токенів.
Чотири проблеми токенової метрики
Куреші виділяє чотири системні викривлення, які роблять аналіз на основі токенів на платформі OpenRouter практично марним для оцінки реального ринкового становища.
1. Субсидії та «безкоштовний сир». Китайські лабораторії регулярно запускають нові моделі з агресивними знижками або безкоштовним доступом. Це приваблює користувачів, які мігрують з однієї безкоштовної моделі на іншу, створюючи ілюзію бурхливого зростання споживання токенів, але не приносячи при цьому реальної грошової виручки.
2. Розмір моделі. Невеликі моделі, такі як Qwen 3.5-27B, приблизно в сто разів дешевші за токен, ніж флагманські Claude Opus або GPT-5.5 Pro. Зростання їх використання може виглядати як різкий стрибок частки на графіку, хоча економічно це абсолютно незначна величина. Аналізувати ринок, на думку Куреші, потрібно суворо всередині вагових категорій за розміром моделі.
3. Багатоагентні системи. На одну й ту саму суму можна запустити складну багатоагентну архітектуру на базі DeepSeek, яка «спалить» у рази більше токенів, ніж один запит до преміальної моделі Opus. Куреші наводить наочний приклад: якщо 5% використання Opus перейде в таку систему з чотириразовою витратою токенів, графік покаже втрату частки Opus у 18%, тоді як реальні витрати клієнта змістяться лише на 5%. Це грубе викривлення картини.
4. Вибірка платформи. OpenRouter — не універсальний репрезентативний зріз ринку. Великі компанії, визначившись із лабораторією, вважають за краще працювати безпосередньо з Anthropic або OpenAI, оминаючи націнку платформи. На графіку це виглядає як падіння частки американських моделей, хоча токени просто йдуть за межі платформи. OpenRouter корисний для аналізу частки всередині сегменту відкритих моделей, але абсолютно не підходить для порівняння відкритих і закритих.
Ціновий тиск і майбутнє за дешевими моделями
Цю точку зору розвиває засновник SageRoad Research Тревор Норен, пов'язуючи її з жорстким ціновим тиском на індустрію. Він наводить оцінку JPMorgan, згідно з якою Amazon вже пропонує близько половини відкритих моделей за ціною, що становить лише частку від вартості флагманських. Nvidia спільно з Dell, Lenovo та HP створює комп'ютери під ШІ-агентів, що також сприяє зміщенню попиту.
Найяскравіший приклад — співвідношення ціни та якості. Запуск набору завдань Artificial Analysis Intelligence Index на Claude Opus 4.8 обходиться в $3,700 при результаті 56 балів. DeepSeek V4 Pro набирає 44 бали всього за $186 — приблизно в 20 разів дешевше. Висновок Норена однозначний: топовий інтелект потрібен не для всього. Для переважної більшості корпоративних завдань достатньо дешевих, вузькоспеціалізованих моделей, і контроль над витратами буде головним драйвером цього зміщення.
Думка експерта: Аргументи Куреші та Норена б'ють прямо в ціль. Ринок ШІ перегрітий метриками марнославства (vanity metrics). Інвестори та аналітики, які продовжують дивитися на «сирі» токени, ризикують пропустити тектонічний зсув у бік ефективності та економії. Реальна битва в ШІ буде йти не за кращий бенчмарк, а за кращий price-to-performance ratio. Китайські лабораторії DeepSeek та Alibaba вже виграють цю війну, і західним гігантам доведеться або радикально знижувати ціни, або здавати позиції в корпоративному сегменті.