Openai Обновила Agents Sdk: Sandbox И Harness — Новые Возможности Для Ваших Ии‑Агентов

Ключевые выводы

  • OpenAI добавила в Agents SDK sandbox‑режим, позволяющий запускать агентов в изолированных рабочем пространстве.
  • Новый in‑distribution harness упрощает работу с frontier‑моделями и тестирование инструментов внутри SDK.
  • Первые версии доступны для Python, поддержка TypeScript запланирована, а цены остаются стандартными API‑тарифами.
OpenAI усиливает безопасность и гибкость своих ИИ‑агентов, добавив sandbox и harness в SDK. Теперь компании могут разрабатывать «длинные» автономные сценарии без риска для основной инфраструктуры.

Что изменилось в Agents SDK?

OpenAI выпустила обновлённый набор инструментов для разработки агентов (Agents SDK). Основные нововведения — sandbox‑окружение и in‑distribution harness. Оба элемента направлены на то, чтобы разработчики могли создавать более безопасные и мощные помощники, работающие на самых новых моделях OpenAI.

Sandbox — это слой изоляции, который ограничивает доступ агента только теми файлами и кодом, которые нужны для конкретной задачи. Внутри «песочницы» агент работает в отдельном рабочем пространстве, а система за пределами неё остаётся защищённой.

In‑distribution harness — это набор вспомогательных компонентов, которые связывают модель‑ядро (frontier‑модель) с внешними инструментами и файлами. Он упрощает развертывание, тестирование и отладку агентов, использующих самые продвинутые модели.

Первый релиз ограничен Python‑SDK, но OpenAI уже анонсировала поддержку TypeScript в будущем. Все функции доступны через обычный API‑плейс‑принцип, без изменения цен.

Зачем нужен sandbox и как он работает?

Без изоляции агент может случайно изменить файлы, получить доступ к конфиденциальным данным или выполнить нежелательные команды. Sandbox решает эту проблему, предоставляя:

  • Контролируемый файловый доступ — агент видит только те файлы, которые явно разрешены.
  • Ограничения на исполнение кода — запуск скриптов происходит в безопасном контейнере, где нет доступа к системным ресурсам.
  • Логи действий — все операции фиксируются, что упрощает аудит и отладку.

Такой подход важен, потому что агенты часто принимают решения «на лету», а их поведение может быть непредсказуемым. Sandbox превращает экспериментальное выполнение в предсказуемый процесс.

Что даёт in‑distribution harness?

Термин “harness” в контексте агентов — это всё, кроме модели: планировщик задач, обработчики ввода‑вывода, интерфейсы к внешним сервисам. In‑distribution harness позволяет:

  • Подключать frontier‑модели — самые крупные и универсальные LLM от OpenAI.
  • Тестировать интеграцию инструментов (например, API‑ключи, базы данных) в том же окружении, где будет работать агент.
  • Запускать «длинные» сценарии, где агент последовательно решает несколько подзадач.

Для бизнеса это означает, что можно построить полностью автономного помощника, который, к примеру, собирает данные из разных систем, генерирует отчёты и отправляет их руководству без вмешательства человека.

Как новые функции решают реальные задачи?

Представьте компанию, которая автоматизирует процесс «onboarding» новых сотрудников. До обновления агент мог бы:

  1. Считать правила компании из PDF‑файла.
  2. Создать учетные записи в нескольких сервисах.
  3. Отправить приветственное письмо.

Без sandbox такой агент мог случайно изменить конфигурацию сервера, а без harness было бы сложно обеспечить корректную работу с разными API. С новыми инструментами агент запускается в изолированном контейнере, имеет доступ только к шаблонам писем и API‑ключам, а harness гарантирует, что все вызовы внешних сервисов проходят проверку.

План развития SDK

OpenAI заявила, что сейчас выпускает sandbox и harness в версии для Python. В ближайшие месяцы появятся:

  • Поддержка TypeScript — чтобы фронтенд‑разработчики могли писать агентов в привычных им инструментах.
  • Режим «code mode» — обеспечит более гибкое взаимодействие с кодом, включая авто‑рефакторинг.
  • Subagents — возможность делегировать отдельные подзадачи вспомогательным агентам.

Все новые функции будут предоставлены через тот же API‑плейс, а цены останутся в рамках существующего тарифа OpenAI — это делает решение доступным как для стартапов, так и для крупных корпораций.

Кому это будет полезно?

Sandbox и harness интересны сразу нескольким группам:

  • Разработчикам ИИ‑приложений — они получают готовый набор безопасных инструментов без необходимости писать собственные слои изоляции.
  • ИТ‑отделам — могут разрешать запуск автоматизированных процессов без страха «сломать прод».
  • Бизнес‑аналитикам — позволяют быстро прототипировать «умных» ассистентов, которые работают с реальными данными.

Если ваша компания уже использует модели OpenAI, то переход на новую версию SDK занимает пару часов: достаточно обновить библиотеку и добавить конфигурацию sandbox.

Справка

OpenAI — американская исследовательская компания в области искусственного интеллекта, основанная в 2015 году группой предпринимателей, включая Илана Маска и Сэма Олтмана. За годы работы OpenAI выпустила несколько поколений GPT‑моделей, которые стали базой для множества коммерческих продуктов.

Agents SDK — набор библиотек и API, позволяющих разработчикам создавать автономных агентов, которые взаимодействуют с языковыми моделями OpenAI и внешними инструментами. SDK поддерживает Python и в планах имеет TypeScript.

Sandbox (изолированное окружение) — технологический слой, ограничивающий доступ программ к файловой системе и системным вызовам, часто реализуемый через контейнеризацию (Docker, Firecracker).

In‑distribution harness — компонент, соединяющий LLM‑модель с вспомогательными сервисами (базы данных, API, файловые хранилища) в рамках единого распределённого окружения.

Frontier модели — термин, обозначающий самые крупные и мощные модели серии GPT, обученные на огромных датасетах и обладающие широким спектром генеративных возможностей.

Python — интерпретируемый язык программирования, популярный среди специалистов по машинному обучению за счёт простоты синтаксиса и огромного количества библиотек.

OpenAI делает шаг к более надёжной автоматизации: sandbox защищает, а harness упрощает работу с самыми мощными моделями. Это открывает путь к реальному использованию «длинных» ИИ‑агентов в бизнесе.

Интересно почитать :

Карманный помощник или повод для задержания? Что говорит закон о ношении
мультитула и складного ножа в общественных местах России
Карманный помощник или повод для задержания? Что говорит закон о ношении мультитула и складного ножа в общественных местах России

Кратко: Мультитул считается бытовым инструментом и законно в общественных местах, если есть сертификат. Складной нож легален при длине клинка < 90 мм и отсутствии «жёсткой» фиксации. Запреты действуют в метро, …

Дуг Филд уходит из Ford: что изменится в стратегии электромобилей и технологий?
Дуг Филд уходит из Ford: что изменится в стратегии электромобилей и технологий?

Ключевые выводы Дуг Филд, руководивший EV‑программой Ford, уйдет после пяти лет; его функции перейдут в новую структуру «product creation and industrialization» под руководством COO Кумара Галхотры. Компания ставит цель обновить …

Snap Map добавил «Лояльность к месту»: бейджи‑знак отличия для самых частых
посетителей
Snap Map добавил «Лояльность к месту»: бейджи‑знак отличия для самых частых посетителей

Ключевые выводы Snapchat запустил функцию «Place Loyalty», которая показывает ваш ранг среди самых частых посетителей места на Snap Map за последний год. Пользователи получают золотой, серебряный или бронзовый бейдж в …

Skyroot Aerospace стала первым индийским «единорогом» в космических технологиях:
$60 млн инвестиций и запуск ракеты Vikram‑1
Skyroot Aerospace стала первым индийским «единорогом» в космических технологиях: $60 млн инвестиций и запуск ракеты Vikram‑1

Ключевые выводы Skyroot Aerospace привлекла $60 млн, оценка стартапа дошла до $1,1 млрд – первый космический единорог из Индии. Компания готовится к орбитальному запуску ракеты Vikram‑1 в июне 2026 г., …

Как 10x Science использует ИИ и масс‑спектрометрию для ускорения разработки
биопрепаратов
Как 10x Science использует ИИ и масс‑спектрометрию для ускорения разработки биопрепаратов

Ключевые выводы 10x Science получила $4,8 млн посевного финансирования для развития платформы, соединяющей ИИ и масс‑спектрометрию. Платформа автоматически интерпретирует спектры, подбирает последовательности белков и облегчает регуляторную валидацию. Технология уже помогает …

Что такое TDP, TGP и TBP у видеокарт: разбираемся в энергопотреблении и выбираем
правильный блок питания
Что такое TDP, TGP и TBP у видеокарт: разбираемся в энергопотреблении и выбираем правильный блок питания

Кратко: TDP (Thermal Design Power) — максимальное тепловыделение компонента, всегда ниже TGP/TBP TGP (Total Graphics Power) — полная мощность GPU, используется Nvidia TBP (Total Board Power) — полная мощность видеокарты, …

ФильтрИзбранноеМеню43750 ₽
Top