OpenAI запускає GPT-5.5-Cyber: новий виток гонки ШІ-безпеки на тлі обмежень Anthropic
22 червня OpenAI офіційно представила повну версію своєї спеціалізованої моделі GPT-5.5-Cyber, призначеної для професійного пошуку, верифікації та усунення вразливостей. Цей крок став прямою відповіддю на посилення регуляторних обмежень щодо Anthropic, що створило унікальне ринкове вікно для OpenAI.
Модель є ключовим елементом програми Daybreak і не призначена для масового користувача. Доступ до GPT-5.5-Cyber отримають лише верифіковані фахівці з кібербезпеки, яким потрібні розширені можливості для проведення авторизованих захисних робіт.
Контекст: як обмеження Anthropic відкрили шлях
9 червня Anthropic запустила дві версії моделей Claude — Fable 5 та Mythos 5. Однак уже 12 червня, після директиви уряду США в рамках експортного контролю, компанія була змушена відключити ці моделі. Це рішення викликало хвилю проблем: 23 червня юридична компанія Legion подала позов проти уряду США, заявивши, що втрата доступу до моделей Anthropic порушила роботу їхніх інструментів для підготовки документів.
На цьому тлі OpenAI обрала більш прагматичний шлях. Компанія заздалегідь узгодила перевірки з федеральними структурами США та відкрила доступ до GPT-5.5-Cyber виключно для перевірених користувачів, мінімізуючи регуляторні ризики.
Технічні показники: що показує GPT-5.5-Cyber
За даними OpenAI, нова модель демонструє вражаючі результати на профільних бенчмарках. На тесті CyberGym GPT-5.5-Cyber набрала 85,6% проти 81,8% у стандартної GPT-5.5. На ExploitGym — 39,5% проти 25,95%, а на SEC-bench Pro — 69,8% проти 63,1%.
Однак картина не така однозначна. UK AI Security Institute (AISI) провів незалежні тести: GPT-5.5 пройшла 32-крокову симуляцію корпоративної атаки The Last Ones у 2 з 10 спроб, тоді як Mythos Preview — у 3 з 10. У пізнішому оновленні AISI показав, що нова версія Mythos Preview впоралася з цим сценарієм уже в 6 з 10 спроб, вперше завершивши й другий сценарій Cooling Tower.
Стратегія доступу та партнерства
OpenAI чітко позначила, що GPT-5.5-Cyber — інструмент для обраних. Для більшості клієнтів, як і раніше, рекомендується GPT-5.5 з Trusted Access for Cyber та Codex Security. Компанія також запустила програму Daybreak Cyber Partner Program, до якої увійшли такі гіганти, як Akamai, Check Point, Cisco, CrowdStrike, IBM, Palo Alto Networks та інші.
Окремої уваги заслуговує ініціатива Patch the Planet для open-source-проєктів, створена спільно з Trail of Bits. Серед перших учасників — cURL, Go, Python, Sigstore та pyca/cryptography. З березня хмарна версія Codex Security уже просканувала понад 30 млн комітів у більш ніж 30 000 кодових базах, а людські рев'юери відзначили понад 70 000 знахідок як виправлені.
Мій експертний коментар: Ринок ІІ-безпеки переходить у нову фазу — від демонстрації можливостей до практичного застосування. Однак розрив між тестовими показниками та реальними сценаріями атак (як показали дані AISI) залишається значним. Ключове питання не в тому, хто набере більше балів на бенчмарках, а в тому, чиї моделі зможуть ефективно працювати в умовах реальних корпоративних інфраструктур з мінімальною кількістю хибних спрацьовувань. OpenAI зробила ставку на контрольований доступ та партнерства, що виглядає більш зрілим підходом, ніж спроба Anthropic випустити "приватні" моделі без належної регуляторної підготовки.