Новини криптоміра

26.06.2026
18:35

Ринок ШІ: токени обманюють, рахуйте долари

Управляючий партнер венчурної фірми Dragonfly Хасіб Куреші зробив важливу заяву: частка споживання токенів — вкрай ненадійний показник для оцінки ринку ШІ-моделей. На його думку, ринок необхідно вимірювати в доларах, а не в токенах. Аналіз на основі сирого споживання токенів на платформі OpenRouter, впевнений Куреші, веде до фундаментально помилкових висновків.

Чотири пастки токенової метрики

Першу проблему експерт пов'язує з субсидіями. Китайські лабораторії регулярно запускають нові моделі з великими знижками або взагалі безкоштовним доступом. Це приваблює користувачів, які мігрують з однієї безкоштовної моделі на іншу, штучно роздуваючи споживання токенів без відповідного зростання реальних грошових витрат.

Друга проблема — різний розмір моделей. Невеликі моделі, такі як Qwen 3.5-27B, коштують приблизно в сто разів дешевше за токен, ніж флагманський Claude Opus. Зростання використання Qwen може виглядати на графіку як різкий стрибок частки відкритих моделей, хоча в економічному вираженні це незначна величина. Аналізувати, на думку Куреші, потрібно всередині вагових категорій за розміром моделі.

Третя проблема — багатоагентні системи. Можна витратити однакову суму на складну багатоагентну архітектуру на базі DeepSeek і на одну передову модель на кшталт Opus. Однак багатоагентна конфігурація спалює набагато більше токенів за ті ж гроші. Як зазначає Куреші, якщо 5% використання Opus мігрує в таку систему з чотириразовою витратою токенів, графік покаже втрату частки Opus приблизно на 18%, хоча реальні витрати змістяться лише на 5%. Такі графіки перебільшують значення низькоцінних токенів.

Четверта проблема — у самій вибірці OpenRouter. Якщо компанія визначилася з однією передовою лабораторією, їй вигідніше звертатися до Anthropic або OpenAI безпосередньо, минаючи націнку платформи. На графіку це виглядає як зниження частки американських моделей, хоча токени просто йдуть за межі платформи. Висновок Куреші: OpenRouter корисний для оцінки частки всередині відкритих моделей, але не підходить для порівняння відкритих і закритих.

Тиск цін зміщує ринок у бік дешевих моделей

Схожу думку розвиває засновник SageRoad Research Тревор Норен, пов'язуючи її з ціновим тиском на індустрію. Він наводить оцінку JPMorgan: багато токенів у майбутньому можуть споживатися не передовими, а невеликими відкритими моделями, яких достатньо для конкретних завдань.

За даними JPMorgan, Amazon вже пропонує близько півдюжини відкритих моделей за ціною, що становить частку від вартості передових, а Nvidia спільно з Dell, Lenovo та HP створює комп'ютери під ШІ-агентів. У банку зазначають, що власні невеликі моделі Claude Haiku та GPT-5.4-mini поки неконкурентоспроможні на «ефективному кордоні», який зараз домінують китайські розробники — DeepSeek, MiniMax, Xiaomi та Alibaba.

Особливо показовий приклад вартості. Запуск набору завдань Artificial Analysis Intelligence Index на Claude Opus 4.8 обходиться в $3 700 при результаті 56 балів, тоді як DeepSeek V4 Pro набирає 44 бали всього за $186 — це приблизно в 20 разів дешевше. Висновок: передовий рівень інтелекту потрібен не для всього, а там, де він необхідний, GLM 5.2 від Z.ai виглядає порівнянним з топовими моделями Anthropic та OpenAI.

Норен вважає, що комодитизація моделей прийде не лише від конкуренції передових лабораторій, а й від компаній, які шукають контроль над витратами через дешевші вузькоспеціалізовані моделі. Корпоративні витрати залишаються найбільш життєздатним шляхом для хмарних гігантів окупити інвестиції в ШІ, але компанії витрачатимуть якомога менше.

Думка експерта: Обидві позиції сходяться в одному: вимірювати ринок ШІ потрібно за грошима, а не за токенами. Під тиском цін перевага все частіше зміщується до дешевих моделей. Це фундаментальний зсув, який інвесторам та аналітикам варто враховувати при оцінці реальної динаміки ринку.