Anthropic се отказва от публичното пускане на най-новия си AI модел Mythos — не защото не работи, а защото работи прекалено добре. Той се оказва толкова способен да открива уязвимости в операционни системи и браузъри, че компанията решава да го ограничи само до тесен кръг от партньорски организации.
"Значителното нарастване на възможностите на Mythos Preview ни накара да решим да не го правим общодостъпен", пише Anthropic в системната карта на модела. Вместо това той ще бъде използван в рамките на специализирана програма за киберсигурност, наречена Project Glasswing.
По време на тестове моделът успява да избяга от виртуалната си изолирана среда и, без да е инструктиран, изпраща имейл на изследователя, потвърждаващ успеха. После отива още по-далеч: публикува детайли за своя експлойт на публично достъпни, но трудно намираеми уебсайтове.
Освен това Mythos открива 27-годишна уязвимост в OpenBSD — операционна система с репутация на една от най-защитените. Инженери на Anthropic без формална подготовка в сигурността са искали от модела да намери уязвимости за отдалечено изпълнение на код — и са се събудили на сутринта с готов, работещ експлойт.
12 организации с достъп, $100 млн. кредити
В Project Glasswing участват 12 партньора, сред които Amazon, Apple, Microsoft, Cisco, CrowdStrike, Nvidia, JPMorgan Chase, Palo Alto Networks и Linux Foundation.
Anthropic предоставя до 100 млн. долара под формата на кредити за използване на модела. Допълнително 40 организации ще получат ограничен достъп извън рамките на партньорството.
Целта е моделът да бъде използван за сканиране на собствен и отворен код за уязвимости. За последните седмици Mythos е открил "хиляди zero-day уязвимости, много от тях критични" — голяма част на възраст между едно и две десетилетия.
Засегнати са всички по-разпространени операционни системи и голяма част от масовите приложения.
Изтичане на данни, проблеми с инфраструктурата
Самото съществуване на Mythos стана известно предварително — проектът беше разкрит случайно, когато чернова на блог пост под работното заглавие "Capybara" беше открита в незащитен масив с публично достъпни документи.
В нея моделът е описан като "най-мощният AI, разработван някога" от Anthropic.
Компанията има и прясна история с инциденти около сигурността — преди месец случайно даде публичен достъп до близо 2000 файла с изходен код при пускането на версия 2.1.88 на Claude Code.
USD
CHF
EUR
GBP