Новини криптоміра

18.06.2026
05:02

GLM-5.2 від Z.ai: Чи справді ця китайська модель стала «вбивцею» Claude? Аналіз експерта

У світі штучного інтелекту назріває сенсація. Нова відкрита модель GLM-5.2 від компанії Z.ai, на думку багатьох ентузіастів, кидає серйозний виклик флагманським продуктам Anthropic — моделям сімейства Claude. Дехто вже поспішив назвати її «китайським убивцею» Claude, і для цього є вагомі підстави.

Давайте розберемося, що ж являє собою GLM-5.2 і наскільки справедливі такі гучні заяви. Це не просто чергове оновлення. Головна новинка — розширене контекстне вікно на 1 мільйон токенів, що в п'ять разів більше, ніж у попередника GLM-5.1. Це дозволяє моделі утримувати в полі зору цілі кодові бази та вести тривалі, складні сесії без втрати якості. Крім того, модель пропонує два режими «посилення міркувань»: High для балансу продуктивності та витрати токенів, і Max — для максимальної точності, але з підвищеним споживанням ресурсів.

Ключова перевага — відкрита ліцензія MIT, яка знімає регіональні обмеження та дозволяє запускати модель на власному обладнанні (self-hosting). Це робить GLM-5.2 неймовірно привабливою для розробників і компаній, які дбають про конфіденційність даних.

Бенчмарки: Цифри не брешуть, але є нюанси

За даними внутрішніх тестів Z.ai, GLM-5.2 дійсно демонструє вражаючі результати, особливо в задачах програмування. На тесті Terminal-Bench 2.1 вона показала 81,0 бала, що практично впритул наближається до показника Claude Opus 4.8 (85,0) і значно перевершує Gemini 3.1 Pro (74,0). На SWE-bench Pro результат 62,1 проти 58,4 у GLM-5.1, хоча до показника Opus 4.8 (69,2) ще далеко.

Однак, якщо подивитися на інші бенчмарки, картина стає складнішою. На NL2Repo, який оцінює генерацію цілого проекту за текстовим описом, GLM-5.2 (48,9) серйозно поступається Opus 4.8 (69,7). На DeepSWE розрив ще більш значний: 46,2 проти 58,0. Тобто, у ряді складних, комплексних сценаріїв китайська модель поки не дотягує до лідера.

Тим не менш, на тривалих завданнях (long-horizon), таких як FrontierSWE, де модель повинна вести проект десятками годин, GLM-5.2 відстає від Opus 4.8 всього на 1%, випереджаючи при цьому GPT-5.5 і попередню версію Opus 4.7. Це свідчить про те, що новинка чудово справляється з підтримкою контексту та послідовністю в тривалих сесіях.

Ціна та реальний досвід користувачів

Вартість підписки GLM Coding Plan починається від $12.6 на місяць за тариф Lite (при річній оплаті), що дійсно в рази дешевше підписок на Claude або GPT. Max-тариф обійдеться в $112 на місяць. Однак, як зазначають користувачі, «диявол криється в деталях». Режим Max, у якому модель розкриває свій потенціал, витрачає значно більше токенів, що при активному використанні може швидко «з'їсти» ліміт.

Відгуки користувачів розділилися. З одного боку, хвалять базову логіку, яка стала помітно кращою, і здатність автономно вирішувати складні завдання, пропонуючи виправлення. З іншого — критикують нестабільну хмарну інфраструктуру, високу вартість режиму Max і схильність моделі «зациклюватися» в нескінченних циклах міркувань, ігноруючи команди користувача. Багато хто зазначає, що GLM-5.2 «заточена» під бенчмарки, а в реальній роботі з кодом поводиться як модель «бюджетного плану».

Мій вердикт: Називати GLM-5.2 «убивцею» Claude поки передчасно. Це, безсумнівно, найсильніша відкрита модель на сьогоднішній день, яка скорочує розрив з лідерами ринку та пропонує унікальні переваги у вигляді відкритої ліцензії та величезного контекстного вікна. Для розробників, які цінують конфіденційність і готові миритися з деякими «дитячими хворобами» інфраструктури, це чудовий та економічно вигідний інструмент. Однак, для безкомпромісної якості та стабільності, флагмани Anthropic і OpenAI поки залишаються поза конкуренцією. Ринок ШІ стає все більш конкурентним, і це, безсумнівно, йде на користь усім нам.