OpenAI відкриває обмежений доступ до GPT-5.6 Sol, Terra та Luna: аналіз нового сімейства моделей

OpenAI зробила важливий крок у розвитку своїх технологій, відкривши обмежений доступ до нового сімейства моделей GPT-5.6 Sol, Terra та Luna. Доступ надано через API та Codex для вузького кола довірених партнерів. Це попереднє ознайомлення, як зазначається, було ініційоване на запит влади США, що підкреслює зростаючу роль регуляторного контролю у сфері ШІ.
Планується, що найближчими тижнями моделі стануть загальнодоступними. Однак на початковому етапі OpenAI заздалегідь узгодила з урядом США плани та можливості моделей, а також передала інформацію про партнерів. Компанія підкреслює, що не розглядає такий порядок як довгострокову норму, що свідчить про пошук балансу між інноваціями та безпекою.
Лінійка та продуктивність
Sol позиціонується як флагманська модель, Terra — як «робоча конячка» для повсякденних завдань, а Luna — як швидкий та економний варіант. За оцінками OpenAI, Terra демонструє продуктивність, порівнянну з GPT-5.5, але при цьому коштує вдвічі дешевше. Luna, своєю чергою, є найдоступнішою моделлю в лінійці.
GPT-5.6 Sol — найпотужніша модель компанії на даний момент. Вона оснащена режимом міркування max, який надає більше часу для глибокого опрацювання складних завдань, та режимом ultra, що використовує субагентів для прискорення комплексної роботи. Це дозволяє Sol вирішувати завдання, які потребують як глибокого аналізу, так і високої швидкості обробки.
Тести та безпека
За даними OpenAI, Sol встановила новий рекорд у бенчмарку Terminal-Bench 2.1 для завдань командного рядка. На GeneBench v1 модель показала результати вищі, ніж GPT-5.5, при меншій кількості токенів. У тестах ExploitBench Sol виявилася конкурентоспроможною з Mythos Preview, використовуючи приблизно одну третину вихідних токенів. На тестах ExploitGym усі три моделі покращували результати в кіберзавданнях у міру збільшення глибини міркування.
Безпека — ключовий аспект. OpenAI заявляє, що GPT-5.6 Sol, Terra та Luna отримали найсильніший стек безпеки в лінійці. Sol не перевищує поріг Cyber Critical у рамках Preparedness Framework. У тестах з Chromium та Firefox модель знаходила баги та примітиви експлуатації вразливостей, але не змогла автономно створити повноцінний робочий експлойт. Для перевірки захисту було задіяно понад 700 000 GPU-годин в еквіваленті A100 на автоматизований редтимінг. На етапі попереднього ознайомлення діють багаторівневі заходи, включаючи обмеження на рівні моделі, перевірки в реальному часі та моніторинг.
Ціни та плани
Нова схема найменування: число позначає покоління, а Sol, Terra та Luna — рівні можливостей. Ціна за 1 млн токенів становить: для Sol — $5 на вході та $30 на виході, Terra — $2,50 та $15, Luna — $1 та $6.
У липні OpenAI планує запустити GPT-5.6 Sol на платформі Cerebras зі швидкістю до 750 токенів на секунду. Доступ на цьому етапі також буде обмежений для окремих клієнтів, поки компанія розширює потужності.
Мій аналіз: Запуск GPT-5.6 Sol, Terra та Luna — це не просто чергове оновлення, а стратегічний крок OpenAI із сегментації ринку ШІ. Розподіл на флагманську, робочу та бюджетну моделі дозволяє компанії охопити різні сегменти користувачів, від великих корпорацій до невеликих розробників. Однак обмежений доступ на запит влади США сигналізує про те, що навіть лідери галузі змушені враховувати регуляторні ризики. Найближчими місяцями ми, ймовірно, побачимо, як ці моделі вплинуть на конкурентне середовище, особливо у сфері кібербезпеки та автоматизації завдань.