Новини криптоміра

09.06.2026
17:40

Claude Mythos 5 и Fable 5: в сети сообщили о выходе новых моделей Anthropic

По распространившимся в соцсетях сообщениям, Anthropic выпустила модель Claude Mythos 5 для доверенных организаций, а также ее публичную, ограниченную в плане безопасности версию — Claude Fable 5. Ее нельзя использовать для подготовки кибератак. Опубликованная вместе с этим таблица бенчмарков показывает заметный отрыв новых моделей от Claude Opus 4.8, а также от GPT 5.5 и Gemini 3.1 Pro.

Официального подтверждения данных на момент публикации не было. Эти цифры взяты из материалов Coin Bureau и пока не прошли независимую проверку. Согласно методологии в таблице, результаты Mythos 5 и Fable 5 различаются в пределах 1–3 процентных пунктов, и в ней приводится более высокий из двух показателей.

Хотите еще эксклюзивных новостей и аналитики? Подписывайтесь на наш телеграм-канал, обсуждайте новости и делитесь мнениями о последних событиях рынка в чате!

Что показывают результаты тестов

В агентном программировании — то есть в способности самостоятельно решать задачи разработки — новая модель заметно опередила конкурентов. На тесте SWE-Bench Pro, который проверяет умение исправлять баги и дописывать код в реальных проектах, она набрала 80,3% против 69,2% у Claude Opus 4.8, 58,6% у GPT 5.5 и 54,2% у Gemini 3.1 Pro. На Terminal-Bench 2.1, оценивающем работу через командную строку, результат составил 88,0% против 82,7% у Opus 4.8.

Таблица сравнения бенчмарков моделей Claude
Claude Mythos 5 / Fable 5 опережает Opus 4.8, GPT 5.5 и Gemini 3.1 Pro по большинству бенчмарков. Источник: Coin Bureau

Сильный отрыв виден и в других категориях. В работе со знаниями (GDPval-AA, тест на качество интеллектуальных рабочих задач уровня специалиста) модель набрала 1932 балла против 1890 у Opus 4.8. 

В междисциплинарном экзамене Humanity’s Last Exam, охватывающем десятки областей знания, она показала 64,5% — с доступом к вспомогательным инструментам вроде поиска и кода. 

На биологическом тесте BioMysteryBench результат достиг 83,9%, что соответствует уровню эксперта-человека, а в кибербезопасности (ExploitBench, поиск и использование уязвимостей) — 78,0% против 40,0% у Opus 4.8.

Любопытно, что в отдельной категории отличилась именно версия Mythos Preview: в управлении компьютером (OSWorld-Verified, тест на самостоятельные действия в операционной системе) она показала наивысший результат — 85,4%, опередив даже Fable/Mythos 5 с их 85,0%. 

По ряду биологических и кибербезопасных тестов, отмеченных звездочкой, более высокие результаты публичной версии Fable 5 объясняются срабатыванием защитных механизмов и резервных сценариев.

Что значат результаты

Если приведенные данные подтвердятся, новые модели Anthropic закрепят отрыв в агентном программировании и работе со знаниями, где разрыв с конкурентами измеряется уже не единицами, а десятками процентных пунктов. Особенно показателен результат в кибербезопасности, где Fable 5 почти вдвое опережает Opus 4.8.

При этом сама структура релиза отражает осторожный подход компании: мощная версия Mythos 5 достается лишь доверенным организациям, а широкой публике предлагается ограниченная Fable 5 с защитными барьерами.

Все цифры приведены со ссылкой на распространяемые материалы, а официальных комментариев от Anthropic пока не поступало. Окончательную ясность внесет только заявление представителей самой компании.

Хотите получить доступ к экспертным инсайдам? Подписывайтесь на наш новостной телеграм-канал, а также вступайте в сообщество BeInCrypto! Читайте последние новости и свежую аналитику криптовалют, ИИ и фондовых рынков. Будьте на шаг впереди толпы каждый день!

The post Claude Mythos 5 и Fable 5: в сети сообщили о выходе новых моделей Anthropic appeared first on BeInCrypto.