Openai Обновила Agents Sdk: Sandbox И Harness — Новые Возможности Для Ваших Ии‑Агентов

Ключевые выводы

  • OpenAI добавила в Agents SDK sandbox‑режим, позволяющий запускать агентов в изолированных рабочем пространстве.
  • Новый in‑distribution harness упрощает работу с frontier‑моделями и тестирование инструментов внутри SDK.
  • Первые версии доступны для Python, поддержка TypeScript запланирована, а цены остаются стандартными API‑тарифами.
OpenAI усиливает безопасность и гибкость своих ИИ‑агентов, добавив sandbox и harness в SDK. Теперь компании могут разрабатывать «длинные» автономные сценарии без риска для основной инфраструктуры.

Что изменилось в Agents SDK?

OpenAI выпустила обновлённый набор инструментов для разработки агентов (Agents SDK). Основные нововведения — sandbox‑окружение и in‑distribution harness. Оба элемента направлены на то, чтобы разработчики могли создавать более безопасные и мощные помощники, работающие на самых новых моделях OpenAI.

Sandbox — это слой изоляции, который ограничивает доступ агента только теми файлами и кодом, которые нужны для конкретной задачи. Внутри «песочницы» агент работает в отдельном рабочем пространстве, а система за пределами неё остаётся защищённой.

In‑distribution harness — это набор вспомогательных компонентов, которые связывают модель‑ядро (frontier‑модель) с внешними инструментами и файлами. Он упрощает развертывание, тестирование и отладку агентов, использующих самые продвинутые модели.

Первый релиз ограничен Python‑SDK, но OpenAI уже анонсировала поддержку TypeScript в будущем. Все функции доступны через обычный API‑плейс‑принцип, без изменения цен.

Зачем нужен sandbox и как он работает?

Без изоляции агент может случайно изменить файлы, получить доступ к конфиденциальным данным или выполнить нежелательные команды. Sandbox решает эту проблему, предоставляя:

  • Контролируемый файловый доступ — агент видит только те файлы, которые явно разрешены.
  • Ограничения на исполнение кода — запуск скриптов происходит в безопасном контейнере, где нет доступа к системным ресурсам.
  • Логи действий — все операции фиксируются, что упрощает аудит и отладку.

Такой подход важен, потому что агенты часто принимают решения «на лету», а их поведение может быть непредсказуемым. Sandbox превращает экспериментальное выполнение в предсказуемый процесс.

Что даёт in‑distribution harness?

Термин “harness” в контексте агентов — это всё, кроме модели: планировщик задач, обработчики ввода‑вывода, интерфейсы к внешним сервисам. In‑distribution harness позволяет:

  • Подключать frontier‑модели — самые крупные и универсальные LLM от OpenAI.
  • Тестировать интеграцию инструментов (например, API‑ключи, базы данных) в том же окружении, где будет работать агент.
  • Запускать «длинные» сценарии, где агент последовательно решает несколько подзадач.

Для бизнеса это означает, что можно построить полностью автономного помощника, который, к примеру, собирает данные из разных систем, генерирует отчёты и отправляет их руководству без вмешательства человека.

Как новые функции решают реальные задачи?

Представьте компанию, которая автоматизирует процесс «onboarding» новых сотрудников. До обновления агент мог бы:

  1. Считать правила компании из PDF‑файла.
  2. Создать учетные записи в нескольких сервисах.
  3. Отправить приветственное письмо.

Без sandbox такой агент мог случайно изменить конфигурацию сервера, а без harness было бы сложно обеспечить корректную работу с разными API. С новыми инструментами агент запускается в изолированном контейнере, имеет доступ только к шаблонам писем и API‑ключам, а harness гарантирует, что все вызовы внешних сервисов проходят проверку.

План развития SDK

OpenAI заявила, что сейчас выпускает sandbox и harness в версии для Python. В ближайшие месяцы появятся:

  • Поддержка TypeScript — чтобы фронтенд‑разработчики могли писать агентов в привычных им инструментах.
  • Режим «code mode» — обеспечит более гибкое взаимодействие с кодом, включая авто‑рефакторинг.
  • Subagents — возможность делегировать отдельные подзадачи вспомогательным агентам.

Все новые функции будут предоставлены через тот же API‑плейс, а цены останутся в рамках существующего тарифа OpenAI — это делает решение доступным как для стартапов, так и для крупных корпораций.

Кому это будет полезно?

Sandbox и harness интересны сразу нескольким группам:

  • Разработчикам ИИ‑приложений — они получают готовый набор безопасных инструментов без необходимости писать собственные слои изоляции.
  • ИТ‑отделам — могут разрешать запуск автоматизированных процессов без страха «сломать прод».
  • Бизнес‑аналитикам — позволяют быстро прототипировать «умных» ассистентов, которые работают с реальными данными.

Если ваша компания уже использует модели OpenAI, то переход на новую версию SDK занимает пару часов: достаточно обновить библиотеку и добавить конфигурацию sandbox.

Справка

OpenAI — американская исследовательская компания в области искусственного интеллекта, основанная в 2015 году группой предпринимателей, включая Илана Маска и Сэма Олтмана. За годы работы OpenAI выпустила несколько поколений GPT‑моделей, которые стали базой для множества коммерческих продуктов.

Agents SDK — набор библиотек и API, позволяющих разработчикам создавать автономных агентов, которые взаимодействуют с языковыми моделями OpenAI и внешними инструментами. SDK поддерживает Python и в планах имеет TypeScript.

Sandbox (изолированное окружение) — технологический слой, ограничивающий доступ программ к файловой системе и системным вызовам, часто реализуемый через контейнеризацию (Docker, Firecracker).

In‑distribution harness — компонент, соединяющий LLM‑модель с вспомогательными сервисами (базы данных, API, файловые хранилища) в рамках единого распределённого окружения.

Frontier модели — термин, обозначающий самые крупные и мощные модели серии GPT, обученные на огромных датасетах и обладающие широким спектром генеративных возможностей.

Python — интерпретируемый язык программирования, популярный среди специалистов по машинному обучению за счёт простоты синтаксиса и огромного количества библиотек.

OpenAI делает шаг к более надёжной автоматизации: sandbox защищает, а harness упрощает работу с самыми мощными моделями. Это открывает путь к реальному использованию «длинных» ИИ‑агентов в бизнесе.

Интересно почитать :

Sycamore привлек $65 млн на создание «Slack для ИИ-агентов». Почему это важно и
кому это нужно
Sycamore привлек $65 млн на создание «Slack для ИИ-агентов». Почему это важно и кому это нужно

Ключевые выводы Стартап Sycamore, работающий над единой платформой для ИИ-агентов в больших компаниях, привлек $65 млн на seed-раунде. Это один из крупнейших подобных раундов на ранней стадии. Главное отличие — …

Fujifilm Instax Wide 400: подробный обзор мгновенной камеры с широким форматом
Fujifilm Instax Wide 400: подробный обзор мгновенной камеры с широким форматом

Ключевые выводы Instax Wide 400 снимает крупные 62 × 99 мм фотографии – вдвое больше, чем у Instax Mini. Камера полностью автоматическая: нет ручных настроек экспозиции, но в условиях плохого …

Что такое TDP процессора и почему это важно для выбора компьютера
Что такое TDP процессора и почему это важно для выбора компьютера

Кратко: TDP (Thermal Design Power) — это расчетное тепловыделение процессора, измеряемое в ваттах Современные процессоры работают на частотах выше базовых, поэтому TDP уже не отражает реальное тепловыделение Для стабильной работы …

Можно ли заряжать смартфон от зарядки ноутбука и наоборот? Полный ответ
Можно ли заряжать смартфон от зарядки ноутбука и наоборот? Полный ответ

Кратко: Да, совместимы любые USB‑C блоки с поддержкой USB Power Delivery (PD). Скорость зависит от мощностей и поддерживаемых профилей: телефон – 9‑15 В, ноутбук – 20‑30 В. Проприетарные протоколы (Quick …

Иранские хакеры атакуют системы управления США: новая эскалация киберугрозы
Иранские хакеры атакуют системы управления США: новая эскалация киберугрозы

Ключевые выводы Иранские государственные хакеры начали целенаправленно атаковать системы управления критической инфраструктурой США (вода, энергетика, местные власти), чтобы вызвать реальные сбои. Атаки сосредоточены на взломе промышленных контроллеров (SCADA и PLC), …

Подробное руководство по Streamlabs OBS — подготовка и запуск прямого эфира
Подробное руководство по Streamlabs OBS — подготовка и запуск прямого эфира

Кратко: Streamlabs OBS — это мощный инструмент для стриминга с множеством встроенных функций. Правильная настройка битрейта и разрешения обеспечивает стабильную трансляцию. Добавление сцен и виджетов делает ваш стрим более профессиональным. …

ФильтрИзбранноеМеню43750 ₽
Top