Ключевые выводы
- OpenAI выпустил десктопное приложение Codex для MacOS с поддержкой параллельной работы ИИ-агентов
- Новый GPT-5.2-Codex показывает лучшие результаты в TerminalBench, но конкуренты догоняют
- Разработчики получают гибкие настройки: от расписания задач до выбора "личности" агента
- Главное преимущество - сокращение времени разработки сложных проектов до нескольких часов
- Рынок инструментов ИИ-программирования переживает взрывной рост с появлением множества агентных систем
Пока разработчики спорят о будущем профессии, ИИ уже переписывает правила создания программного обеспечения. Заявка OpenAI на лидерство в этой гонке — приложение Codex для MacOS, объединяющее последние достижения в области агентных систем. Но сможет ли компания удержать позиции на стремительно меняющемся рынке?
Эра агентного программирования
Современная разработка ПО всё больше напоминает дирижирование оркестром. Только вместо музыкантов – рои ИИ-агентов, взявших на себя рутинные операции. За последний год этот подход стал стандартом в таких приложениях как Claude Code и Coworker. OpenAI заметно отставал, предлагая лишь командную строку Codex и веб-интерфейс.
Новый MacOS-клиент закрывает этот разрыв. Приложение позволяет одновременно запускать десятки специализированных агентов. Теперь можно параллельно: исправлять баги, оптимизировать код, писать документацию, и всё это – на фоновом выполнении.
"Сложные проекты требуют именно такого подхода, – объясняет идеологию продукта CEO OpenAI Сэм Альтман. – GPT-5.2 пока сильнейшая модель для программирования, но ей нужна правильная оболочка".
Под капотом Codex для MacOS
Чем действительно выделяется новое приложение:
- Фоновые автомations — установите расписание для рутинных задач, а результаты увидите в очереди на проверку
- Настройка характера агента — выбирайте между прагматичным "инженером" и эмпатичным "помощником"
- Поддержка кроссплатформенных скиллов — интеграция с агентскими модулями через agentskills.io
Но главный козырь – скорость. "От чистого листа до рабочего прототипа за время утреннего кофе, – приводит пример Альтман. – Ваши пальцы на клавиатуре становятся единственным ограничением".
Бенчмарки: правда за экраном тестов
OpenAI гордится лидерством GPT-5.2 в TerminalBench – тесте на командную разработку. Но результаты конкурентов:
- Gemini 3: погрешность в пределах 3%
- Claude Opus: сравнимые показатели для реальных проектов
- SWE-bench (исправление багов): явного преимущества ни у кого
"Тесты плохо отражают работу агентных систем, – признают в OpenAI. – Разработчик выбирает инструмент по UX, а не сухим цифрам".
Фактически, рынок разделился: любители скорости берут Codex, а ценители интерфейсов – решения Anthropic (Claude). Но границы стираются с каждым обновлением.
Что это значит для разработчиков
Агентные системы меняют не инструменты, а саму философию кодинга:
| Старая модель | Новая реальность |
| Пишем каждую строку | Ставим задачи рою агентов |
| Ручное тестирование | Автоматический аудит качества |
| Многочасовые коммиты | Непрерывная интеграция "на лету" |
Главный вызов теперь – научиться формулировать задачи для ИИ. "Программирование превращается в менеджмент умных сотрудников", – иронизируют в Twitter-сообществе разработчиков.
Планы OpenAI и будущее рынка
Запуск десктопного Codex – часть стратегии по захвату профессионального сегмента. В перспективе:
- Интеграция с популярными IDE (VS Code, JetBrains)
- Предзаказные конфигурации агентов для разных языков
- Система обучения агентов под стиль конкретного программиста
Но конкуренты не дремлют. Anthropic готовит обновление Claude 4.5 с упором на командную работу, а Google тестирует Gemini для корпоративного сегмента.
Справка: ключевые участники рынка
1. OpenAI
Исследовательская компания в области ИИ, основанная в 2015 году. Известна разработкой GPT-3, DALL-E и ChatGPT. Штаб-квартира в Сан-Франциско. Сотрудничает с Microsoft, которая инвестировала 13 миллиардов долларов в проект.
2. Сэм Альтман
CEO OpenAI с 2019 года. Ранее возглавлял стартап-инкубатор Y Combinator. В 24 года продал свою первую компанию Loopt за 43 млн долларов. Считается одним из главных идеологов современного ИИ.
3. Codex
Система ИИ для программирования, представленая OpenAI в 2021. Легла в основу GitHub Copilot. Способна генерировать код на 12 языках, включая Python и JavaScript. Обрабатывает до 14КБ контекста.
4. Claude Code
Продукт компании Anthropic, созданной бывшими сотрудниками OpenAI. Специализируется на "безопасном ИИ" с этическими ограничениями. Claude отличается длительной памятью (до 100К токенов) и минимальной модерацией выходных данных.
5. TerminalBench
Открытый бенчмарк для оценки ИИ-систем в командной разработке. Тестирует понимание контекста, последовательность выполнения задач и обработку ошибок. Используется как индустриальный стандарт с 2025 года.
Споры "люди против ИИ" уступают место новой реальности: симбиозу разработчика и роя интеллектуальных агентов. Десктопный Codex – не конечная точка, а лишь ступень к ПО, которое пишет само себя. Главный вопрос теперь – как сохранить контроль над системами, превосходящими человеческие возможности в узких задачах.








