- Ключевые выводы
- Что такое Lockdown Mode и зачем он нужен?
- Какие функции отключаются?
- Как работает защита от prompt injection?
- Кому стоит включать Lockdown Mode?
- Как включить Lockdown Mode?
- Что остаётся доступным в Lockdown Mode?
- Оценка эффективности: плюсы и минусы
- Сравнение с другими подходами к защите ИИ
- Будущее защиты от prompt injection
- Справка
Ключевые выводы
- Lockdown Mode отключает живой веб‑поиск, загрузку изображений из интернета и некоторые функции агентного режима, чтобы снизить риск prompt injection.
- Режим предназначен для пользователей и организаций, работающих с конфиденциальными данными; он уже доступен в ChatGPT Business и у некоторых личных аккаунтов.
- Несмотря на ограничения, полностью избавиться от подстановок запросов нельзя – они могут появиться в кэше или загруженных файлах.
OpenAI решила ограничить возможности ChatGPT, которые часто становятся мостом для скрытых инструкций злоумышленников. Новый Lockdown Mode – это попытка отгородить ИИ от «мусора» в интернете, но он не делает систему полностью непроницаемой.
Что такое Lockdown Mode и зачем он нужен?
Lockdown Mode – это специальный набор ограничений, который OpenAI включила в ChatGPT в ответ на растущую угрозу prompt injection (внедрение вредоносных инструкций в запросы). Такие атаки позволяют злоумышленнику скрыть команды в веб‑страницах, кэшированных данных или загружаемых файлах, а затем заставить ИИ выполнить нежелательные действия.
Основная идея режима – убрать те «окна», через которые модель может «подглядывать» в внешние ресурсы. При включенном Lockdown Mode ИИ работает только с тем, что уже находится в его локальном хранилище (кэш), и не может напрямую обращаться к интернету.
Это полезно для компаний, которым требуется строгий контроль над тем, какие данные могут покидать их среду, а также для отдельных специалистов, обрабатывающих юридически значимую информацию.
Какие функции отключаются?
Включив Lockdown Mode, пользователь теряет доступ к нескольким «лёгким» возможностям:
- Живой веб‑поиск – модель не делает запросы к текущим страницам, а работает только с кэшированным контентом.
- Загрузка и отображение изображений из интернета – вы всё ещё можете генерировать картинки, но их нельзя брать из внешних источников.
- Deep research – функции, позволяющие проводить детальный анализ больших массивов данных, отключаются.
- Agent mode – возможность запускать автономные «агенты» для выполнения цепочек задач приостановлена.
Все остальные базовые возможности, такие как генерация текста, синтез кода и создание собственных изображений, остаются доступными.
Как работает защита от prompt injection?
Lockdown Mode не гарантирует 100 % безопасность, но значительно снижает вероятность того, что вредоносный запрос проскользнет в процесс генерации. Основные принципы защиты:
- Изоляция от живого контента – без доступа к текущим веб‑страницам ИИ не может подхватить скрытую инструкцию, размещённую в свежем HTML‑коде.
- Ограничение на загрузку файлов – даже если пользователь загружает файл, система проверяет его на наличие подозрительных паттернов перед обработкой.
- Работа с кэшем – кэшированные страницы проверяются один раз, после чего их содержимое считается «очищенным» от потенциальных угроз.
Однако OpenAI признаёт, что вредоносные инструкции могут всё равно попасть в кэш или в уже загруженный документ. Поэтому компания советует рассматривать Lockdown Mode как «смягчение» риска, а не абсолютную защиту.
Кому стоит включать Lockdown Mode?
OpenAI явно дала понять, что режим не для всех. Он ориентирован на:
- корпоративных клиентов, обрабатывающих конфиденциальные данные (финансы, медицина, юридические услуги);
- исследовательские группы, которым важно исключить утечки информации;
- индивидуальных пользователей, участвующих в проектах с высоким уровнем риска.
Если вы просто хотите иногда поиграть с ChatGPT, включать режим нет смысла – ограничения могут сильно притупить удобство работы.
Как включить Lockdown Mode?
Сейчас режим доступен в двух направлениях:
- ChatGPT Business – все аккаунты, подключённые к бизнес‑подписке, могут самостоятельно активировать режим в настройках.
- Элитные личные аккаунты – пользователи, прошедшие отбор (например, участвующие в бета‑тестах), могут запросить доступ через форму обратной связи.
Включить режим легко: в разделе “Settings → Safety & Privacy” есть переключатель “Lockdown Mode”. После активации все ограничения вступают в силу сразу.
Что остаётся доступным в Lockdown Mode?
Несмотря на ограничения, пользователи сохраняют большинство «творческих» функций:
- Генерация текста – ответы, статьи, коды, письма.
- Создание изображений через DALL‑E – только без запросов к внешним картинкам.
- Работа с уже загруженными файлами, если они прошли проверку.
- Поддержка большинства языков и инструментов разработки.
Таким образом, режим подходит тем, кто ценит конфиденциальность выше полной функциональности.
Оценка эффективности: плюсы и минусы
Плюсы:
- Снижение вероятности утечки данных через скрытые команды.
- Простая настройка – один клик в настройках.
- Поддержка бизнес‑клиентов, которым безопасность критична.
Минусы:
- Ограничение доступа к актуальной информации в интернете.
- Некоторые функции (агенты, глубокий поиск) недоступны, что может усложнить сложные задачи.
- Не устраняет полностью риск prompt injection – требуется дополнительный аудит входных данных.
Сравнение с другими подходами к защите ИИ
Рынок ИИ предлагает несколько вариантов «защиты» от вредоносных запросов:
| Метод | Как работает | Плюсы | Минусы |
|---|---|---|---|
| Фильтрация ввода | Проверка текста на наличие опасных триггеров | Не требует изменений модели | Легко обойти с помощью эвфемизмов |
| Контекстные ограничители | Встроенные системные подсказки, ограничивающие «поведение» модели | Гибко настраивается | Может влиять на качество ответов |
| Lockdown Mode (OpenAI) | Отключение внешних источников и ограничение функций | Снижение поверхностного вектора атаки | Уменьшение функциональности |
Lockdown Mode – это более «жесткий» способ, который меняет саму архитектуру доступа, а не только проверяет входные данные.
Будущее защиты от prompt injection
OpenAI планирует улучшать режим, добавляя более тонкую настройку разрешений (например, выбор отдельных веб‑сайтов для «белого списка»). Также компания экспериментирует с моделью, способной автоматически распознавать скрытые инструкции даже в кэшированных данных.
Пока что пользователи должны сочетать Lockdown Mode с другими практиками: шифрование данных, ограничение прав доступа и проверка файлов вручную.
Справка
OpenAI – американская исследовательская компания, основанная в 2015 году Илоной Маск, Сэмом Альтманом и другими. Известна благодаря развитию моделей GPT (Generative Pre‑trained Transformer) и DALL‑E. Компания активно работает над вопросами этики и безопасности ИИ.
ChatGPT – чат‑бот, основанный на модели GPT‑4, запущенный в конце 2022 года. Предлагает пользователям генерацию текста, кода, изображений и другие функции через веб‑интерфейс и API.
Prompt injection – вид атак, когда злоумышленник внедряет в запросы к ИИ скрытые команды, влияющие на результат. Пример: инструкция «не отвечай на вопросы о банковских данных» может быть скрыта в тексте веб‑страницы.
ChatGPT Business – платформа для компаний, позволяющая управлять пользователями, контролировать данные и включать дополнительные механизмы безопасности, такие как Lockdown Mode.
DALL‑E – сервис OpenAI для генерации изображений по текстовому описанию. Работает независимо от веб‑поиска, поэтому доступен даже в Lockdown Mode.
Lockdown Mode – хороший шаг к более безопасному использованию ChatGPT в бизнесе. Он не решает всех проблем, но помогает минимизировать самые очевидные риски, связанные с подстановками запросов. Если вам важна конфиденциальность, стоит попробовать режим и дополнить его собственными процедурами контроля.







