<p>Coinbase вдвічі скоротила витрати на ШІ при вибуховому зростанні споживання токенів: секрет не в лімітах</p> - 28.06.2026

28.06.2026

15:56

Coinbase вдвічі скоротила витрати на ШІ при вибуховому зростанні споживання токенів: секрет не в лімітах

Генеральний директор Coinbase Браян Армстронг поділився деталями того, як біржі вдалося скоротити витрати на штучний інтелект майже вдвічі, незважаючи на експоненційне зростання споживання токенів. Ключ до успіху — не в жорстких обмеженнях і бюджетних лімітах, а в розумному налаштуванні інфраструктури.

Армстронг прямо заявив: інженери Coinbase можуть обирати будь-яку модель ШІ, але вирішальне значення мають налаштування за замовчуванням. Компанія експериментує з тим, щоб за замовчуванням використовувати дешевші моделі з відкритою вагою, такі як GLM 5.2 та Kimi 2.7, через внутрішній шлюз. Примітно, що 91% співробітників ніколи не впиралися у встановлені ліміти, тому в Coinbase пішли шляхом оптимізації параметрів за замовчуванням, а не зниження квот. Це дозволило не лише стримати зростання витрат, але й повернути його назад.

Маршрутизація, кешування та економія контексту

У власних системах Coinbase запити попередньо обробляються та спрямовуються до найбільш підходящої моделі на основі ймовірності потрапляння в кеш та вартості. Наприклад, передова модель необхідна для планування, але надлишкова для рутинного виконання. Армстронг підкреслює, що вибір моделі в кінцевому підсумку повинен автоматизувати сам ШІ, а не людина.

Особлива увага приділяється кешуванню. Промахи повз збережені дані — найпростіший спосіб збільшити витрати. У Coinbase всі запити налаштовані на повторне використання вже обробленої інформації. У сервісі LibreChat частка потраплянь у кеш зросла з 5% до 60% після правильного налаштування.

Також критично важлива економія контексту. Армстронг радить починати нові сесії при зміні завдань, вузько обмежувати контекст файлів та вимикати невикористовувані інструменти. Мета — не витрачати менше токенів, а мінімізувати їхнє марне витрачання. Саме цей комплексний підхід і дозволив Coinbase скоротити витрати на ШІ майже вдвічі на тлі триваючого зростання споживання.

Стратегія «штанги» від Дойчера: 10-80-10

Аналітик Майлз Дойчер описує аналогічний підхід, називаючи його ерою «інженерії токенів». Він пропонує стратегію «штанги» для скорочення витрат на ШІ на 50% і більше. Перші 10% роботи (планування проєкту) він рекомендує довіряти найрозумнішим моделям на кшталт Opus або GPT, оскільки це найважливіший етап.

Основні 80% рутинної роботи, на його думку, варто виконувати дешевшою моделлю з відкритим вихідним кодом. Фінальні 10% та перевірку результату він знову доручає моделям високого рівня. Дойчер стверджує, що застосовує цю схему вже кілька місяців і вважає її найкращим способом знизити надмірні витрати на ШІ.

Аналітика Cryptalist: Досвід Coinbase — це наочний підручник для всієї індустрії. Ми переходимо від епохи «просто використовуй найпотужнішу модель» до епохи «використовуй правильну модель для правильного завдання». Розумна маршрутизація та агресивне кешування — це не просто економія, це новий стандарт ефективності. Компанії, які не впровадять подібні практики, ризикують просто спалити капітал на неконтрольованому споживанні ШІ.

Новини криптоміра

Coinbase вдвічі скоротила витрати на ШІ при вибуховому зростанні споживання токенів: секрет не в лімітах

Маршрутизація, кешування та економія контексту

Стратегія «штанги» від Дойчера: 10-80-10