Новини криптоміра

18.06.2026
07:35

GLM-5.2: Реальний конкурент Claude чи просто гучний маркетинговий хід?

У світі штучного інтелекту назріває серйозна інтрига. Нова модель GLM-5.2 від китайської компанії Z.ai стрімко ввірвалася в топ обговорень, і багато хто вже охрестив її «вбивцею» флагманського продукту Anthropic — Claude. Давайте розберемося, наскільки ці заяви обґрунтовані і що насправді являє собою ця нейромережа.

Архітектура та ключові особливості

GLM-5.2 — це не просто чергове оновлення, а флагманська модель, створена для тривалих і складних робочих сесій. Головна її відмінність від попередниці GLM-5.1 — це гігантський стрибок в обсязі контекстного вікна. Якщо раніше воно становило 200 тисяч токенів, то тепер — 1 мільйон. Це означає, що модель здатна утримувати в полі зору та аналізувати величезні обсяги коду і тексту без втрати якості протягом тривалих проєктів.

Ключові параметри моделі:

  • Контекст в 1 млн токенів: Не деградує при наддовгих сесіях, дозволяючи працювати з цілою кодовою базою в одному циклі міркувань.
  • Два рівні міркувань: Режим «High» для балансу продуктивності та витрати токенів, і режим «Max» для максимальної глибини аналізу, що потребує більше ресурсів.
  • Відкрита ліцензія MIT: Повна свобода дій — від self-hosting на власному обладнанні до комерційного використання без регіональних обмежень.
  • Ціна API: Вартість звернення залишилася на рівні попередньої версії GLM-5.1, що робить її привабливою для розробників.

Модель вже доступна на HuggingFace та ModelScope, а також через підписку GLM Coding Plan, десктопний агент ZCode та середовища Claude Code і OpenCode.

Цифри та бенчмарки: що показує реальна продуктивність?

За власними тестами Z.ai, GLM-5.2 позиціонується як найсильніша відкрита модель на ринку. Однак до лідера — Anthropic Claude Opus 4.8 — вона в більшості сценаріїв все ж не дотягує. Давайте подивимося на сухі цифри в режимі максимального міркування:

БенчмаркGLM-5.2GLM-5.1Opus 4.8GPT-5.5Gemini 3.1 Pro
SWE-bench Pro62,158,469,258,654,2
Terminal-Bench 2.181,063,585,084,074,0
NL2Repo48,942,769,750,733,4
DeepSWE46,218,058,070,010,0
ProgramBench63,750,971,970,839,5
MCP-Atlas76,871,877,875,369,2
Tool-Decathlon48,240,759,955,648,8

Як видно, GLM-5.2 демонструє вражаюче зростання відносно своєї попередньої версії, особливо на тестах Terminal-Bench 2.1 (81,0 проти 63,5) та DeepSWE (46,2 проти 18,0). Вона впевнено обходить Gemini 3.1 Pro та GPT-5.5 за низкою показників, але все ще поступається Opus 4.8. На тесті тривалих проєктів FrontierSWE відставання від лідера становить лише 1%, що свідчить про колосальний прогрес у роботі з довгими сценаріями.

Ціна питання: дешево, але не завжди стабільно

Підписка GLM Coding Plan пропонує три тарифи з 30% знижкою при річній оплаті: Lite за $12,6/міс, Pro за $50,4/міс та Max за $112/міс. Витрата квоти залежить від навантаження: коефіцієнт 3x у години пік (з 14:00 до 18:00 за пекінським часом) та 2x поза піком. До кінця вересня діє акція, де позапікове використання тарифікується як 1x.

Користувачі зазначають, що модель розкривається лише в режимі Max, який споживає значно більше токенів. При цьому хмарна інфраструктура критикується як вкрай слабка, а підтримка — недостатня. Багато розробників скаржаться, що простіше заплатити за Claude або GPT, ніж миритися з нестабільністю сервісу Z.ai.

Реальні відгуки: ентузіазм vs. розчарування

Думки користувачів розділилися. Сильні сторони моделі:

  • Найкраща відкрита модель для програмування та автономних завдань на даний момент.
  • Базова логіка помітно покращена порівняно з версією 5.1.
  • Здатність самостійно виконувати складні завдання через допоміжних агентів та пропонувати виправлення.
  • Наполегливість у досягненні мети, незважаючи на повільність та дорожнечу.

Критика стосується насамперед сервісу та стабільності:

  • Слабка хмарна інфраструктура при хорошій математичній моделі.
  • Висока вартість тарифікації та слабка підтримка.
  • Схильність застрягати в нескінченних циклах та ігнорувати команди користувача.
  • Підозра, що модель «заточена» виключно під бенчмарки.

Вердикт аналітика: вбивця чи ні?

Однозначної відповіді немає. GLM-5.2 — безумовно, найсильніша відкрита модель на сьогоднішній день. Вона впритул наблизилася до флагмана Anthropic в окремих сценаріях, особливо в тривалих проєктах. Відкрита ліцензія MIT, можливість self-hosting та низький поріг входу роблять її помітним гравцем на ринку.

Однак називати її «вбивцею» Claude передчасно. За більшістю тестів Z.ai сама ставить свою модель нижче Opus 4.8. До того ж, сира та нестабільна інфраструктура, висока витрата токенів та слабка підтримка зводять нанівець багато переваг. Поки що GLM-5.2 — це багатообіцяючий, але не завершений продукт, який скорочує розрив з лідерами, але не перевершує їх.

Моя професійна думка: GLM-5.2 — це важливий крок для індустрії відкритих ШІ-моделей, що демонструє, що конкуренція з закритими гігантами можлива. Однак для масового прийняття розробникам Z.ai належить вирішити проблеми з інфраструктурою та стабільністю. Поки ж це інструмент для ентузіастів і тих, хто готовий миритися з недосконалостями заради доступу до передової відкритої архітектури.