Ринок ШІ: чому метрика «токени» вводить в оману, а рахувати потрібно в доларах
Останнім часом в індустрії штучного інтелекту стало модно порівнювати моделі за обсягом споживаних токенів. Однак, як показують останні дискусії серед провідних аналітиків, такий підхід фундаментально помилковий. Керуючий партнер венчурної фірми Dragonfly Хасіб Куреші справедливо вказує, що частка токенів — це вкрай ненадійний показник для оцінки ринку ШІ-моделей. Реальну картину ринкової сили та затребуваності дають лише витрачені долари, а не сире споживання.
Чому ж метрика токенів так спотворює реальність? Куреші виділяє кілька ключових проблем. Перша — це субсидії. Китайські лабораторії регулярно запускають нові моделі з агресивними знижками або навіть безкоштовним доступом. Це штучно надуває обсяги споживання токенів, оскільки користувачі мігрують від однієї безкоштовної моделі до іншої, не витрачаючи жодного цента. Графіки показують бурхливе зростання, а реальної монетизації за цим не стоїть.
Розмір має значення: ціна за токен
Друга проблема криється в різному розмірі моделей. Невеликі моделі, такі як Qwen 3.5-27B, можуть бути в сто разів дешевшими за токен, ніж флагманські рішення на кшталт Claude Opus. Різкий стрибок частки споживання Qwen на графіках OpenRouter виглядає як тріумф відкритих моделей, але в економічному вираженні це мізерна величина. Коректний аналіз, на моє глибоке переконання, можливий лише всередині вагових категорій — порівнювати моделі потрібно в одному класі за розміром.
Третя проблема — це багатоагентні системи. Ви можете витратити одну й ту саму суму на складну конфігурацію на базі DeepSeek або GLM 5.2 і на один запит до передової моделі Opus. Однак багатоагентна архітектура «спалить» в рази більше токенів за ті самі гроші. Куреші наводить наочний приклад: якщо 5% використання Opus мігрує в таку систему з чотириразовою витратою токенів, графік покаже втрату частки Opus у 18%, хоча реальні витрати змістилися лише на 5%. Це класичний приклад того, як метрика токенів перебільшує значення дешевих токенів.
OpenRouter: спотворене дзеркало ринку
Четверта проблема пов'язана з вибором самої платформи OpenRouter. Великі компанії, визначившись з однією передовою лабораторією, надають перевагу роботі з Anthropic або OpenAI безпосередньо, оминаючи націнку OpenRouter. На графіку це виглядає як зниження частки США, хоча токени просто йдуть за межі платформи. Висновок очевидний: OpenRouter корисний для оцінки частки всередині відкритих моделей, але абсолютно не підходить для порівняння відкритих і закритих систем.
Цю позицію розвиває і засновник SageRoad Research Тревор Норен, пов'язуючи її з ціновим тиском на індустрію. Дані JPMorgan показують, що багато токенів у майбутньому споживатимуться не передовими, а невеликими відкритими моделями, достатніми для конкретних завдань. Amazon вже пропонує близько півсотні відкритих моделей за ціною, що становить частку від вартості передових.
Особливо показові цифри від JPMorgan: запуск набору завдань Artificial Analysis Intelligence Index на Claude Opus 4.8 обходиться в $3,700 при результаті 56 балів, тоді як DeepSeek V4 Pro набирає 44 бали всього за $186 — це приблизно в 20 разів дешевше. За даними банку, власні невеликі моделі Claude Haiku та GPT-5.4-mini поки неконкурентоспроможні на «ефективному кордоні», який зараз домінують китайські розробники — DeepSeek, MiniMax, Xiaomi та Alibaba.
Мій аналіз як експерта: Ми спостерігаємо тектонічний зсув. Комодитизація моделей неминуча, і вона прийде не лише від конкуренції передових лабораторій, але й від корпорацій, які шукають контроль над витратами через дешевші вузькоспеціалізовані рішення. Обидві позиції сходяться в одному: вимірювати ринок ШІ потрібно за грошима, а не за токенами. Під тиском цін перевага все частіше зміщується до дешевих моделей, і інвесторам, які стежать за крипто- та ШІ-сектором, варто переглянути свої KPI. Традиційні метрики споживання токенів застаріли — майбутнє за доларовою ефективністю.