GLM-5.2: Китайський «вбивця» Claude чи черговий гучний хайп? Розбір від Cryptalist
У криптоспільноті та AI-сфері знову спалахнув ажіотаж. Нова нейромережа GLM-5.2 від компанії Z.ai стрімко набирає популярності, і багато хто вже охрестив її «вбивцею» Claude від Anthropic. Чи справді китайська розробка здатна кинути виклик визнаному лідеру? Давайте розберемося без зайвого хайпу, спираючись на факти та бенчмарки.
Що пропонує GLM-5.2?
Z.ai позиціонує свою модель як флагманську, заточену під тривалі та складні робочі сесії. Головне нововведення — стабільне контекстне вікно на 1 мільйон токенів. Це в п'ять разів більше, ніж у попередника GLM-5.1. Такий обсяг дозволяє моделі обробляти цілі кодові бази без втрати якості. Крім того, модель пропонує два рівні посилення міркувань: High — для балансу продуктивності та витрати токенів, і Max — для максимальної глибини аналізу, але з відповідним зростанням витрат. Ключова перевага — відкрита ліцензія MIT, що дозволяє запускати модель на власному обладнанні (self-hosting) без будь-яких регіональних обмежень.
Бенчмарки: правда проти маркетингу
За власними тестами Z.ai, GLM-5.2 дійсно є найсильнішою відкритою моделлю на ринку. Однак до флагмана Anthropic — Claude Opus 4.8 — вона в більшості сценаріїв не дотягує. Давайте подивимося на цифри в режимі Max:
Порівняння ключових бенчмарків (режим Max):
- Terminal-Bench 2.1: GLM-5.2 (81.0) vs Opus 4.8 (85.0) vs GPT-5.5 (84.0). Тут модель впритул наблизилася до лідерів, обігнавши Gemini 3.1 Pro (74.0).
- SWE-bench Pro: GLM-5.2 (62.1) vs Opus 4.8 (69.2) vs GPT-5.5 (58.6). Відставання від Claude становить ~7 пунктів, але модель впевнено обходить GPT та Gemini.
- DeepSWE: GLM-5.2 (46.2) vs Opus 4.8 (58.0) vs GPT-5.5 (70.0). Тут відставання від лідерів більш суттєве, хоча модель демонструє колосальний стрибок порівняно з GLM-5.1 (18.0).
- FrontierSWE (тривалі завдання): Відставання від Opus 4.8 становить лише 1%, що свідчить про вражаючу здатність моделі до утримання контексту.
Ціна питання та «підводні камені»
Підписка GLM Coding Plan стартує від $12.6 на місяць (тариф Lite при річній оплаті). Pro коштує $50.4, а Max — $112. Здавалося б, ціни привабливі, але користувачі скаржаться на нестабільну хмарну інфраструктуру та високу витрату токенів у режимі Max. За відгуками, модель «розкривається» лише на максимальних налаштуваннях, що робить її дорогою в експлуатації. Багато хто зазначає, що простіше та дешевше платити за Claude або GPT, ніж розбиратися з квотами та піковими годинами Z.ai.
Вердикт аналітика:
GLM-5.2 — це, безсумнівно, прорив для відкритих моделей. Вона демонструє, що китайські розробники можуть створювати продукти, порівнянні з найкращими світовими аналогами. Назва «вбивця Claude» — це радше гучний заголовок, ніж реальність. Модель місцями впритул наближається до Opus 4.8, але за сукупністю тестів поки поступається. Тим не менш, відкрита ліцензія та низький поріг входу роблять її потужним інструментом для розробників, які хочуть отримати високу якість без прив'язки до пропрієтарних рішень. Однак, якщо вам потрібна стабільність та передбачуваність «з коробки», Claude та GPT поки залишаються більш надійним вибором. GLM-5.2 — це виклик статус-кво, але не його повалення.