AI компанията Anthropic обяви своя най-нов модел Claude Sonnet 4.5, който демонстрира безпрецедентна способност за автономна работа. По време на тестове той е работил непрекъснато 30 часа, създавайки чат приложение подобно на Slack или Teams с около 11 000 реда код, спирайки едва когато завърши задачата.

Това е драматично увеличение спрямо предишния Opus 4 модел, който работеше до седем часа, отбелязва The Verge.

За да няма дело: Автори на книги получават $1,5 милиарда от Anthropic

За да няма дело: Автори на книги получават $1,5 милиарда от AI гигант

Компанията е използвала пиратски копия на изданията, за да усъвършенства моделите си

Компанията позиционира Claude Sonnet 4.5 като "най-добрия модел в света за реални агенти, програмиране и компютърна употреба". Според AI изследователя от Anthropic Дейвид Хърши, моделът не само създава приложения, но и настройва бази данни, закупува домейни и извършва SOC 2 одити за сигурност - задачи далеч отвъд простото генериране на код.

Новият модел показва над три пъти по-добри резултати при навигация в браузър и компютърна употреба спрямо технологията на Anthropic от октомври миналата година. Дайан Пен, ръководител продуктово управление, споделя че усъвършенстванията са изненадали дори самия екип след месец интензивна работа с обратна връзка от клиенти като GitHub и Cursor.

Anthropic твърди, че моделът постига водещи резултати по различни програмни тестове, включително SWE-Bench Verified, въпреки че неотдавна GPT-5 на OpenAI разклати доминацията им в сектора.

Скот Уайт от Claude.ai описва модела като работещ на "ниво главен асистент" - може да координира календари между множество хора, анализира данни, създава отчети и други сложни задачи.