Как Anthropic Протестировал Ai‑Рынок: Эксперимент «Project Deal», Результаты И Выводы

Ключевые выводы

  • Anthropic провела закрытый эксперимент, где 69 сотрудников торговали реальными товарами через AI‑агентов, используя бюджет $100.
  • За время пилота было заключено 186 сделок на сумму более $4 000, при этом более «продвинутый» AI‑модель давала участникам лучшие результаты.
  • Участники не замечали разницы в качестве агентов, что поднимает вопрос о скрытом «разрыве в качестве» и необходимости прозрачности в будущих AI‑рынках.
Anthropic решил проверить, сможет ли искусственный интеллект реально вести переговоры и заключать сделки. Результаты показали, что это возможно, но также выявили скрытые риски, связанные с разницей в «качествах» моделей.

Что такое Project Deal и зачем он был нужен?

В середине 2023 года компания Anthropic запустила эксперимент под названием Project Deal. Цель была простой: проверить, способны ли AI‑агенты выступать одновременно и в роли покупателя, и в роли продавца, заключая реальные сделки за реальные деньги.

Для этого был собран небольшой «само‑отобранный» пул из 69 сотрудников компании. Каждый получил виртуальный бюджет в $100, который выплачивался в виде подарочных карт. Сотрудники могли предлагать свои вещи – от книг до гаджетов – и пытаться продать их другим участникам, используя лишь интерактивные AI‑боты.

Эксперимент был полностью закрытым: сделки заключались внутри компании, а деньги переводились в виде подарочных карт, так что ни один сторонний продавец или покупатель не участвовал.

Главный вопрос, который ставили исследователи, – смогут ли AI‑агенты вести переговоры эффективно и без человеческой подсказки, а также как меняются результаты в зависимости от «уровня» модели.

Как проходил эксперимент: четыре разных рынка

Anthropic запустила четыре параллельных рынка, каждый из которых использовал другую версию своей модели:

  • «Реальный» рынок – все участники были представлены самой продвинутой моделью Anthropic (Claude 3), а заключённые сделки действительно исполнялись.
  • Три «исследовательских» рынка – в них применялись менее мощные версии модели, чтобы посмотреть, как уровень AI влияет на результаты.

Все рынки работали по одним и тем же правилам: участник ставил цену, другой отвечал через своего агента, и если обе стороны согласовывались – сделка фиксировалась.

Важно отметить, что исходные инструкции, которые получали агенты перед началом переговоров, не оказали заметного влияния на вероятность продажи или на окончательную цену.

Какие результаты получились?

За несколько дней работы «реального» рынка было совершено 186 сделок на общую сумму более $4 000. При этом каждый участник в среднем потратил около $58, а заработал около $68, что говорит о положительном «экономическом балансе».

Сравнивая рынки, исследователи заметили, что участники, представленные более продвинутой моделью, получили «объективно лучшие» результаты – их цены были ближе к оптимальному «рыночному» уровню, а вероятность заключения сделки была выше.

Однако, несмотря на различия в результирующей эффективности, пользователи не ощущали, что их агент «хуже». Это поднимает вопрос о «разрыве в качестве» AI‑моделей: люди могут оставаться в неведении о том, что их переговорный партнёр хуже, чем у другого.

Почему это важно для будущего AI‑торговли?

Project Deal – первый публичный пример того, как AI может стать полноценным участником экономических процессов, а не просто помощником. Если в дальнейшем появятся открытые AI‑рынки, важно будет обеспечить:

  • Прозрачность уровня модели, который используется каждому участнику.
  • Механизмы контроля за «качеством» агентов, чтобы никто не оказался в невыгодном положении.
  • Этичные нормы, гарантирующие, что AI‑агенты не будут эксплуатировать незнание пользователей.

Пока эксперимент ограничен 69 сотрудниками Anthropic, но уже сейчас видно, что технология способна поддерживать реальные денежные потоки и создавать рынок, управляемый полностью машинным интеллектом.

Что говорят аналитики?

Эксперты в области экономических систем отмечают, что такие пилоты позволяют собрать данные о том, как AI взаимодействует с человеческим поведением в условиях реального стимула (деньги). Это ценная информация для построения более сложных систем автоматизированной торговли, биржевых платформ и даже государственных аукционов.

С другой стороны, вопросы о конфиденциальности, ответственности и регуляции остаются открытыми. Если в будущих версиях AI‑агенты будут принимать решения о покупке товаров стоимостью в тысячи долларов, потребуется чёткая правовая база.

Справка

Anthropic – американская компания, основанная в 2021 году бывшими сотрудниками OpenAI. Специализируется на разработке больших языковых моделей, известных под брендом Claude. Основатели включают Даниэля Дойч, Даниэла Руссо и Джованни Саввани.

Claude – серия языковых моделей от Anthropic, позиционируемых как более «безопасные» и «управляемые» по сравнению с аналогами. Сейчас наиболее продвинутая версия – Claude 3.

Project Deal – внутренний эксперимент Anthropic, целью которого было проверка способности AI‑агентов вести реальные коммерческие переговоры. В рамках проекта использовались четыре разных модели, включая «реальную» и три исследовательские версии.

AI‑агент – программный «персонаж», который использует языковую модель для общения, принятия решений и выполнения действий от имени пользователя. В этом эксперименте каждый участник получил собственного AI‑агента‑покупателя и AI‑агента‑продавца.

Гостевая карта (gift card) – предоплаченный электронный сертификат, использованный в эксперименте в качестве денежного эквивалента. Каждый сотрудник получил $100 в виде такой карты, чтобы иметь реальную финансовую нагрузку при сделках.

Эксперимент Project Deal — это первый шаг к тому, чтобы AI стал полноценным игроком на реальном рынке. Он показал, что технологии уже способны заключать сделки, но также раскрыл потенциальную опасность скрытого неравенства между моделями.

Интересно почитать :

Как стартап ScaleOps экономит до 80% расходов на облако, устраняя «простой» GPU
и решая проблему статичных настроек Kubernetes
Как стартап ScaleOps экономит до 80% расходов на облако, устраняя «простой» GPU и решая проблему статичных настроек Kubernetes

Ключевые выводы Компании тратят миллионы на GPU и облачные ресурсы, но до 80% этих мощностей простаивает из-за неэффективного ручного управления и статичных настроек в Kubernetes. Израильский стартап ScaleOps, основанный бывшим …

9 лучших фенов-аналогов Dyson: какой выбрать в 2026 году
9 лучших фенов-аналогов Dyson: какой выбрать в 2026 году

Кратко: Лучшие фены-аналоги Dyson стоят в 5-10 раз дешевле оригинала Все модели оснащены бесщеточными моторами с высокой скоростью вращения Ионизация и несколько температурных режимов защищают волосы от перегрева Компактный дизайн …

Как выбрать отвертку или набор отверток: 7 критериев для идеального инструмента
Как выбрать отвертку или набор отверток: 7 критериев для идеального инструмента

Кратко: Тип шлица определяет совместимость с крепежом: Phillips, Pozidriv, Torx, шестигранник и другие Рукоятка влияет на комфорт: двух-, трехкомпонентные, прорезиненные варианты Дополнительные функции: магнитный наконечник, диэлектрическое покрытие, реверсивный механизм Для …

Что такое TDP процессора и почему это важно для выбора компьютера
Что такое TDP процессора и почему это важно для выбора компьютера

Кратко: TDP (Thermal Design Power) — это расчетное тепловыделение процессора, измеряемое в ваттах Современные процессоры работают на частотах выше базовых, поэтому TDP уже не отражает реальное тепловыделение Для стабильной работы …

Фьюжн‑стартапы на грани: стоит ли выходить на биржу и почему компании ищут
дополнительные доходы?
Фьюжн‑стартапы на грани: стоит ли выходить на биржу и почему компании ищут дополнительные доходы?

Ключевые выводы TAE Technologies и General Fusion готовятся к публичному листингу через слияния, получив сотни миллионов долларов. Обе компании ещё не достигли научного брейк‑ивена — критического этапа, который многие инвесторы …

X запускает революционные инструменты для создателей контента: эксклюзивные
треды, улучшенная монетизация и новые аналитические инструменты
X запускает революционные инструменты для создателей контента: эксклюзивные треды, улучшенная монетизация и новые аналитические инструменты

Ключевые выводы X представляет эксклюзивные треды, позволяющие создателям монетизировать контент прямо на платформе Обновлена система подписок с улучшенной платёжной стеной и двухэтапным процессом Запущен новый Paid Partnership label для прозрачной …

ФильтрИзбранноеМеню43750 ₽
Top