GLM-5.2 від Z.ai: Реальний конкурент Claude чи просто хайп на бенчмарках?
У світі ШІ розгоряється новий ажіотаж. Китайська компанія Z.ai випустила модель GLM-5.2, яку в мережі вже охрестили «вбивцею» флагманського Claude від Anthropic. Виставу підігрівають заяви про десятикратну перевагу при ціні в десять разів нижчій. Але чи це насправді так, чи ми знову маємо справу з умілим маркетингом, а не реальним проривом?
Технічні характеристики та позиціонування
GLM-5.2 — це флагманська відкрита модель, заточена під тривалі робочі сесії. Її ключова перевага — стабільне контекстне вікно на 1 мільйон токенів (проти 200 тисяч у попередника GLM-5.1). Це означає, що модель здатна утримувати в полі зору величезні обсяги коду або тексту без втрати якості протягом годин. Модель пропонує два рівні посилення міркувань: High (баланс продуктивності та витрати токенів) і Max (максимальна глибина, але зі значно більшим споживанням ресурсів).
Важливо: GLM-5.2 поширюється за відкритою ліцензією MIT без регіональних обмежень, що дозволяє запускати її на власному обладнанні (self-hosting). Це кардинально відрізняє її від закритих рішень Anthropic.
Бенчмарки: Цифри не брешуть, але...
Згідно з власними тестами Z.ai, GLM-5.2 дійсно демонструє вражаючі результати на стандартних бенчмарках. Наприклад, на Terminal-Bench 2.1 вона набрала 81,0 бала, що лише на 4 пункти нижче показника Opus 4.8 (85,0) і вище Gemini 3.1 Pro (74,0). На SWE-bench Pro — 62,1 бала, що майже наздоганяє GPT-5.5 (58,6) та Gemini (54,2).
Однак на складніших і триваліших завданнях (long-horizon) розрив з лідером стає помітним: на SWE-Marathon відставання від Opus 4.8 становить 13%. Це свідчить про те, що модель чудово справляється з ізольованими завданнями, але в умовах масштабного рефакторингу або створення складних систем з нуля все ще поступається топовим продуктам.
Ціна vs. Якість: Головний козир чи ілюзія?
Вартість підписки GLM Coding Plan дійсно приваблива: від $12,6 на місяць (Lite) до $112 (Max) при річній оплаті. Однак, як зазначають користувачі, модель розкривається лише в режимі Max, який «спалює» токени в рази швидше, ніж High. Це нівелює перевагу в ціні — при інтенсивній роботі витрати можуть виявитися порівнянними з Claude або GPT.
Основні скарги користувачів стосуються нестабільної хмарної інфраструктури, схильності моделі до нескінченних циклів та ігнорування команд. Багато хто зазначає, що GLM-5.2 «заточена» під бенчмарки, а в реальній розробці поводиться як «бюджетний ШІ».
Вердикт аналітика
GLM-5.2 — це, безсумнівно, сильний крок вперед для відкритих моделей. Вона демонструє, що Китай здатен створювати конкурентоспроможні рішення, які впритул наближаються до лідерів ринку за рядом показників. Однак називати її «вбивцею» Claude передчасно. Так, вона дешевша і доступніша, але за реальним user experience, стабільністю та глибиною аналізу складних проєктів вона поки що поступається.
Моя думка: GLM-5.2 — чудовий інструмент для тих, хто готовий пожертвувати зручністю заради економії та має можливість розгорнути модель локально. Але для завдань, де критична надійність і передбачуваність результату, Claude Opus 4.8 або GPT-5.5 залишаються безпечнішим вибором. Ринок ШІ стає все більш фрагментованим, і «вбивця» — це радше клікбейт, ніж реальність.