OpenAI представляє нове сімейство моделей GPT-5.6: Sol, Terra та Luna — архітектурна революція чи маркетинговий хід?
Компанія OpenAI зробила важливий крок у розвитку своїх мовних моделей, анонсувавши сімейство GPT-5.6, що включає три спеціалізовані моделі: Sol, Terra та Luna. Наразі доступ до них відкрито лише для обмеженого кола довірених партнерів через API та Codex, причому цей прев'ю-режим було узгоджено з урядом США.
Архітектура лінійки та цінова політика
У новій лінійці чітко простежується сегментація за продуктивністю та вартістю. Флагманська модель Sol позиціонується як найпотужніша в історії компанії. Terra є збалансованим рішенням для повсякденних завдань, а Luna — це бюджетний варіант із високою швидкістю роботи. Примітно, що Terra, за заявами розробників, демонструє продуктивність на рівні GPT-5.5, але коштує вдвічі дешевше. Ціноутворення виглядає наступним чином: за 1 млн вхідних токенів для Sol — $5, для Terra — $2,50, для Luna — $1. Вартість генерації (вихідні токени) вища: $30, $15 та $6 відповідно.
Технічні інновації та бенчмарки
Найбільший інтерес викликає впровадження нових режимів міркування. У моделі Sol з'явився режим max, який виділяє додатковий час на глибокий аналіз завдань, та режим ultra, що використовує субагентів для прискорення складних обчислень. Це вказує на еволюцію в бік більш гнучких архітектур, здатних адаптувати обчислювальні ресурси під складність запиту.
Результати тестування вражають. Sol встановила новий рекорд у Terminal-Bench 2.1 для завдань командного рядка. На GeneBench v1 модель показала результати, що перевершують GPT-5.5, при меншому споживанні токенів. Особливої уваги заслуговує ExploitBench, де Sol виявилася конкурентоспроможною з Mythos Preview, використовуючи при цьому лише третину вихідних токенів. Це свідчить про значне підвищення ефективності.
Безпека: новий стандарт чи превентивні заходи?
OpenAI заявляє, що сімейство GPT-5.6 отримало найпотужніший стек безпеки. Компанія провела масштабний редтимінг, задіявши понад 700 000 GPU-годин (в еквіваленті A100) для пошуку вразливостей. Результати показують, що Sol не перетинає поріг Cyber Critical у рамках Preparedness Framework. Хоча модель здатна знаходити баги та примітиви експлуатації в тестах із Chromium та Firefox, вона не змогла автономно створити повноцінний робочий експлойт. На етапі прев'ю введено багаторівневі обмеження, включаючи перевірки в реальному часі та моніторинг на рівні акаунта.
Плани та стратегічний контекст
У липні OpenAI планує запустити GPT-5.6 Sol на платформі Cerebras із потенційною швидкістю до 750 токенів на секунду, хоча доступ знову буде обмежено. Варто зазначити, що компанія нещодавно подала конфіденційну заявку на IPO, що може пояснювати підвищену увагу до питань безпеки та регулювання.
Мій експертний аналіз: Виділення трьох моделей — це не просто маркетинг, а усвідомлена стратегія створення екосистеми. Sol — це інструмент для досліджень та складних завдань, Terra — корпоративний стандарт, Luna — масовий продукт. Однак обмежений доступ та узгодження з владою США натякають на те, що ми стоїмо на порозі ери, де можливості ШІ регулюватимуться так само жорстко, як ядерні технології. Інвесторам варто уважно стежити за тим, як ці заходи вплинуть на темпи впровадження та монетизації.