Claude Opus 4.5 бросает вызов ChatGPT и Gemini: дешевле, умнее, автономнее

Anthropic представила Claude Opus 4.5 — новую флагманскую модель, ориентированную на автономное программирование, многоуровневые агенты и сложные корпоративные задачи. В отличие от предшественников, Opus 4.5 сочетает высокую производительность с резко сниженной стоимостью, делая передовой ИИ доступным для повседневного использования в enterprise-средах.

Фокус на автономных агентах и кодинге

Opus 4.5 позиционируется как самый мощный инструмент Anthropic для работы с кодом, компьютером и продолжительными агентскими процессами. Модель способна самостоятельно выполнять многоэтапные проекты: от разработки и рефакторинга программного кода до создания презентаций и таблиц без постоянного контроля со стороны разработчиков. Уже сейчас она интегрирована в приложения Claude, API Anthropic, основные облачные платформы и даже в GitHub Copilot в режиме публичного превью.

Результаты тестов: выше человеческих

На внешних бенчмарках Opus 4.5 демонстрирует 80,9 % на SWE-bench Verified и 59,3 % на Terminal-bench 2.0, что ставит её в один ряд с лучшими мировыми моделями для практического программирования. В тестах общей интеллектуальной способности модель набирает 90,8 % на MMLU, 87,0 % на GPQA Diamond и 80,7 % на MMMU. Особое внимание привлекло внутреннее испытание Anthropic: за два часа Opus 4.5 решила инженерный экзамен лучше любого человека из числа кандидатов на работу в компании.

Гибкость, безопасность и контроль над затратами

В API появился новый параметр «усилие», позволяющий регулировать баланс между глубиной рассуждений, задержкой и стоимостью. При среднем значении Opus 4.5 достигает результатов Sonnet 4.5 на SWE-bench, используя на 76 % меньше токенов на вывод. Кроме того, модель демонстрирует сниженный уровень нежелательного поведения и повышенную устойчивость к атакам через инъекцию промптов — ключевой фактор для промышленного внедрения автономных систем.

Цены падают, доступность растёт

Стоимость использования Opus 4.5 снизилась с $15/$75 до $5/$25 за миллион входных и выходных токенов соответственно — почти втрое. При этом сохраняется 200-тысячный контекст и поддержка длительных рассуждений. Модель уже доступна через API, мобильные и веб-приложения Claude, а также на платформах Vertex AI и Microsoft Foundry. GitHub Copilot также начал внедрять Opus 4.5 для пользователей Pro, Pro+, Business и Enterprise.

Новый стандарт для enterprise-ИИ

По сравнению с Opus 4.1, новая версия сохраняет флагманские возможности, но радикально повышает эффективность. Opus 4.5 не просто улучшает бенчмарки — она превращает ранее редко используемую «модель для особых случаев» в повседневный инструмент для автоматизации бизнес-процессов. Если Anthropic реализует заявленный потенциал самоуправляемых агентов, это может изменить подход не только к разработке ПО, но и к самой структуре ИТ-команд.

Фокус на автономных агентах и кодинге

Результаты тестов: выше человеческих

Гибкость, безопасность и контроль над затратами

Цены падают, доступность растёт

Новый стандарт для enterprise-ИИ

Похожие записи