OpenAI представляє GPT-5.5-Cyber на тлі регуляторного тиску на Anthropic

22 червня OpenAI офіційно запустила повну версію своєї спеціалізованої моделі GPT-5.5-Cyber, призначеної для пошуку, верифікації та виправлення програмних вразливостей. Цей реліз відбувається в надзвичайно показовий момент — одразу після того, як уряд США запровадив експортні обмеження, які змусили Anthropic відкликати свої передові моделі Claude Fable 5 та Mythos 5.
GPT-5.5-Cyber є ключовим компонентом ініціативи Daybreak — комплексної програми кіберзахисту OpenAI, яка також включає інструмент Codex Security та партнерства з провідними компаніями у сфері безпеки. Модель не призначена для масового використання; доступ до неї отримають лише перевірені фахівці з кібербезпеки для виконання авторизованих захисних операцій.
Стратегічне вікно можливостей
Ситуація на ринку ШІ-безпеки кардинально змінилася після того, як 9 червня Anthropic відкрила доступ до двох версій сімейства Claude. Вже 12 червня компанія була змушена відключити ці моделі на вимогу уряду США в рамках експортного контролю. Це спричинило серйозні наслідки: 23 червня юридична фірма Legion подала позов проти уряду США, заявивши, що втрата доступу до моделей Anthropic порушила роботу їхніх інструментів для підготовки юридичних документів.
OpenAI обрала принципово інший підхід. Компанія заздалегідь скоординувала всі перевірки з федеральними структурами США та відкрила GPT-5.5-Cyper лише для верифікованих користувачів. Це дозволило їм уникнути регуляторних ризиків та зайняти нішу, що звільнилася.
Технічні характеристики та бенчмарки
За даними OpenAI, GPT-5.5-Cyber демонструє вражаючі результати на спеціалізованих тестах. На бенчмарку CyberGym модель показала 85,6% проти 81,8% у стандартної GPT-5.5. Ще більш значний розрив спостерігається на ExploitGym: 39,5% проти 25,95%. На тесті SEC-bench Pro результати склали 69,8% проти 63,1%.
Однак важливо розуміти контекст цих цифр. CyberGym фокусується на відтворенні відомих вразливостей у контрольованих середовищах, що не охоплює весь спектр реальних атак. Більше того, за даними UK AI Security Institute, у складних багатокрокових сценаріях, таких як симуляція корпоративної атаки The Last Ones, GPT-5.5-Cyber пройшла тест у 2 з 10 спроб, тоді як оновлена версія Mythos Preview від Anthropic впоралася у 6 з 10 спроб.
Порівняння з конкурентами
Пряме порівняння з відкликаною моделлю Anthropic Mythos 5 показує, що GPT-5.5-Cyber перевершила її на CyberGym: 85,6% проти 83,8%. Однак за складнішими тестами, такими як The Last Ones, картина неоднозначна. Це свідчить про те, що хоча спеціалізована модель OpenAI сильна у вузьких задачах відтворення вразливостей, у комплексних сценаріях реальних атак Anthropic зберігає перевагу.
Екосистема та обмеження доступу
OpenAI також запустила Daybreak Cyber Partner Program, до якої увійшли такі гіганти, як Akamai, Check Point, Cisco, CrowdStrike, IBM, Palo Alto Networks та інші. Додатково було анонсовано ініціативу Patch the Planet для open-source-проєктів, створену спільно з Trail of Bits за участю HackerOne. Серед перших учасників — cURL, Go, Python та pyca/cryptography.
Мій аналіз ситуації показує, що OpenAI стратегічно точно обрала момент для запуску, заповнивши вакуум, що утворився після відходу Anthropic. Однак гонка ШІ-озброєнь у кібербезпеці тільки починається. Поки GPT-5.5-Cyber демонструє перевагу у вузьких бенчмарках, реальні сценарії атак залишаються за Anthropic. Питання в тому, чи зможе OpenAI наздогнати конкурента у комплексних задачах до того, як регуляторні обмеження знову змінять правила гри.