Новини криптоміра

18.06.2026
00:07

GLM-5.2: Реальна загроза для Claude чи черговий китайський хайп?

Китайський AI-сектор знову заявляє про себе голосно та зухвало. Нова модель GLM-5.2 від компанії Z.ai, на думку багатьох ентузіастів, здатна кинути виклик флагманським продуктам Anthropic. Але наскільки обґрунтовані ці заяви? Давайте розберемося в сухих цифрах та реальному користувацькому досвіді.

Розробники позиціонують GLM-5.2 як флагманську модель, оптимізовану для тривалих робочих сесій. Ключове покращення порівняно з версією 5.1 — це стабільне контекстне вікно на 1 мільйон токенів, що в п'ять разів більше за попередній показник. Це дозволяє моделі утримувати в полі зору цілі кодові бази, не втрачаючи якості на наддовгих завданнях.

Модель пропонує два рівні міркувань: High для балансу продуктивності та витрати токенів, і Max для досягнення максимальних результатів, але з підвищеним споживанням ресурсів. Важливо, що GLM-5.2 поширюється за відкритою ліцензією MIT, що дозволяє запускати її на власному обладнанні без регіональних обмежень.

Цифри та бенчмарки: прорив чи маркетинг?

Власні тести Z.ai дійсно вражають. На ключових бенчмарках GLM-5.2 демонструє значний стрибок порівняно з попередником. Наприклад, на Terminal-Bench 2.1 результат зріс з 63,5 до 81,0, що майже впритул наближається до показника Claude Opus 4.8 (85,0) і обходить Gemini 3.1 Pro (74,0).

На SWE-bench Pro модель набрала 62,1 бала проти 58,4 у GLM-5.1, хоча у Opus 4.8 тут 69,2. У довгострокових сценаріях, таких як FrontierSWE, відставання від лідера Anthropic становить лише 1%, що є видатним результатом для відкритої моделі. Однак на таких тестах, як NL2Repo та DeepSWE, розрив з Opus 4.8 більш суттєвий — 20% та 12% відповідно.

Практика vs. Теорія: що говорять користувачі

Незважаючи на вражаючі цифри в бенчмарках, реальний користувацький досвід малює більш складну картину. Багато розробників зазначають, що GLM-5.2 — це дійсно найсильніша відкрита модель на даний момент. Її базова логіка помітно покращилася, а в програмуванні вона порівнянна з GPT-5.5 на високому рівні міркувань.

Однак критика в основному стосується інфраструктури та стабільності. Користувачі скаржаться на слабку хмарну підтримку, високу вартість тарифів та схильність моделі «зациклюватися» в нескінченних циклах, ігноруючи команди. Багато хто зазначає, що модель розкривається лише в режимі Max, який витрачає в рази більше токенів, ніж High. У підсумку, на думку частини спільноти, простіше та дешевше платити за Claude або GPT.

Експертна думка Cryptalist: GLM-5.2 — це, безумовно, важливий крок вперед для open-source AI. Вона скорочує розрив з пропрієтарними гігантами, особливо в ніші програмування та автономних агентів. Однак називати її «вбивцею Claude» поки що передчасно. Проблеми з інфраструктурою, стабільністю та висока витрата токенів — це ті «дитячі хвороби», які Z.ai належить вирішити, щоб модель стала реальною альтернативою, а не просто яскравим спалахом на радарах індустрії. Поки що це скоріше «китайський виклик», ніж «вбивця».