Почему Компании «Потаптывают» Бюджеты На Ai: Рост Расходов, Новые Стандарты И Как Вернуть Контроль

Ключевые выводы

  • Крупные игроки (Uber, Microsoft, Priceline) уже превысили бюджеты на AI в 3‑5 раз уже в первые месяцы 2026 года.
  • Рост расходов вызывают автономные агенты и новые модели (Claude Opus 4.5, GPT‑5.1, Gemini 3 Pro), которые потребляют токены в масштабе триллионов записей.
  • Рынок инструментов мониторинга и новых стандартов (Tokenomics Foundation, FinOps) быстро формируется, предлагая контроль, аудит и оптимизацию расходов.
В 2026 году компании впервые столкнулись с настоящей «кризисной» ситуацией: расходы на генеративный AI растут быстрее, чем возможности их контролировать. Мы разберём, почему так происходит, какие решения уже появляются и как не стать «пленником» токенов.

Кто уже «переплатил» за AI и почему

У Uber в течение первых четырёх месяцев 2026 года был полностью израсходован весь плановый бюджет на AI‑кодинг. Microsoft за несколько месяцев отозвала лицензии Claude Code у своих разработчиков, а в Priceline сотрудник сообщил, что продление контракта на Cursor обошлось в 4‑5 раз дороже, чем ожидалось.

Снижение цены за токен не спасло компании. Автономные агенты и «агентные» функции новых моделей резко увеличили количество запросов. Пример: один проект в США потратил около 500 млн долларов на Claude, просто забыв установить лимиты.

Спрос на самые мощные модели (Claude Opus 4.5, GPT‑5.1, Gemini 3 Pro) вырос после их выхода в ноябре 2025 года. Они дают лучшее качество кода, но требуют в несколько раз больше токенов для обучения и инференса.

В результате компании, которые в начале 2025 года подписали «all‑you‑can‑eat» подписки, сейчас находятся в поиске «где же мои деньги». Им нужны инструменты, позволяющие увидеть, как расходуются токены, и способы ограничить нецелевое потребление.

Переход от «что может?» к «сколько стоит?»

Шесть месяцев назад разговоры с клиентами были о том, насколько модели «достаточно хороши». Сейчас — о видимости расходов, аудите, контроле токенов и эффективности моделей.

OpenAI, через главу отдела enterprise Александра Эмбрикоса, уже официально заявила, что главная боль клиентов — отсутствие прозрачных метрик и возможностей ограничения расходов.

FinOps Foundation (под эгидой Linux Foundation) фиксирует, что компании уже в апреле 2026 года превышают свои токен‑бюджеты в 3 раза. Они называют это «кризисом» и требуют «guardrails» — ограничений и инструментов контроля.

Тренд очевиден: вместо «token‑maxxing» и «быстрее‑вперёд», бизнес ищет способы измерять эффективность, сравнивать модели и управлять расходами на уровне токенов.

Что именно приводит к росту расходов?

1. **Автономные агенты** – они могут выполнять цепочки действий без человеческого вмешательства, тем самым генерируя огромное количество запросов.

2. **Новые модели** – GPT‑5.1, Claude Opus 4.5, Gemini 3 Pro обладают лучшей способностью к «self‑prompting», что удешевляет отдельные запросы, но общая потребность в токенах растет экспоненциально.

3. **Отсутствие лимитов** – многие компании забывают установить ограничения для сотрудников, что приводит к «запретным» расходам (пример с $500 млн).

4. **Отсутствие единого языка измерения** – пока нет единой метрики «стоимость токена», сравнивать цены разных провайдеров почти невозможно.

Как рынок отвечает на проблему

Появляются специализированные стартапы и крупные игроки, предлагающие мониторинг и оптимизацию токенов.

*Pay‑i* – платформа, измеряющая и оптимизирующая затраты и производительность генеративного AI. *Paid* позволяет отслеживать реальные расходы, а не подписку.

Платформы *Jellyfish*, *Waydev* и *Faros AI* предлагают мониторинг AI‑агентов, доказывая ROI от использования инструментов.

Традиционные облачные сервисы тоже в коробку добавляют AI‑FinOps: Ramp, Datadog, New Relic уже предлагают токен‑уровневую видимость, GPU‑мониторинг и облачную стоимость.

На конференции FinOps X планируется анонс новых функций от AWS, ориентированных на управление AI‑расходами.

Tokenomics Foundation: попытка создать стандарты

Linux Foundation в этом году запустила Tokenomics Foundation – инициативу, вдохновлённую FinOps для облака. Цель – определить «канонические» определения токенов, создать открытые спецификации и метрики, такие как cost‑per‑intelligence, tokens‑per‑watt и эффективность фабрики токенов.

По словам Джей‑Ар Стормент из FinOps, управление токенами — это «триллион‑строк‑в‑мес data problem», требующее новых инструментов и процессов.

Среди первых задач фонда – разработка единого языка цен, позволяющего сравнивать Anthropic, OpenAI и Google по реальной стоимости.

Скоро будет официальный запуск (июль), а на FinOps X объявят новых членов и первые стандарты.

Что делать сейчас, если ваш бюджет уже «перелетел»?

1. **Ввести лимиты** – установить жёсткие ограничения на количество токенов для групп и отдельных разработчиков.

2. **Внедрить мониторинг** – использовать инструменты Pay‑i, Datadog или внутренние скрипты для сбора данных о потреблении токенов в реальном времени.

3. **Оценить ROI** – сравнить стоимость токенов с экономическим эффектом от ускоренного выпуска кода (например, через метрику revenue‑per‑token).

4. **Перейти к «умному роутингу»** – использовать сервисы типа Factory, которые автоматически выбирают более дешёвую модель для простых задач.

5. **Следить за новыми стандартами** – подключаться к Tokenomics Foundation, чтобы быть в курсе общих метрик и лучшей практики.

Справка

Uber – основана в 2009 году, крупнейший сервис такси и доставки. В 2026 году компания потратила весь годовой бюджет на AI‑кодинг до апреля, что привело к пересмотру стратегии расходов.

Microsoft – технологический гигант, создатель Azure. В 2026 году отозвал лицензии Claude Code у разработчиков, демонстрируя быстрый отклик на рост расходов.

Priceline (часть Booking Holdings) – онлайн‑агрегатор путешествий. Сотрудники компании сообщили о 4‑5‑кратном росте стоимости контракта на Cursor, а также о необходимости вводить токен‑лимиты.

Claude Opus 4.5 – модель от Anthropic, вышедшая в ноябре 2025 года, отличающаяся улучшенной способностью к контекстному пониманию, но требующая больше токенов.

Tokenomics Foundation – новый стандарт‑орган, инициированный Linux Foundation, цель которого – создать открытые определения и метрики для токенов AI, аналогично FinOps для облака.

Рост расходов на AI уже перестал быть «мелкой проблемой». Без видимости, аудита и контроля компании рискуют съесть большую часть бюджета. Инструменты мониторинга и новые стандарты позволяют вернуть баланс, а значит — вернуть инвестиции в реальную бизнес‑ценность.

Интересно почитать :

Grubhub отменяет сборы за доставку – как это повлияет на рынок доставки еды
Grubhub отменяет сборы за доставку – как это повлияет на рынок доставки еды

Ключевые выводы Grubhub полностью отменяет сборы за доставку и сервисный сбор на заказы от $50 Это постоянное предложение – в отличие от временных акций конкурентов Компания рассчитывает переломить тренд снижения …

Нинжа Artisan 5‑in‑1: Электрическая уличная печь для пиццы, которой станет проще
готовить ресторанные кусочки дома
Нинжа Artisan 5‑in‑1: Электрическая уличная печь для пиццы, которой станет проще готовить ресторанные кусочки дома

Ключевые выводы Нинжа Artisan 5‑in‑1 быстро разогревается до 700 °F и готовит 12‑дюймовую пиццу за 3 минуты в режиме Неаполитан. Пять предустановленных режимов (Неаполитан, Нью‑Йорк, тонкая корка, пан‑пицца, пользовательский) позволяют …

Slack превращается в AI-помощника: 30 новых функций, которые изменят работу с
корпоративными задачами
Slack превращается в AI-помощника: 30 новых функций, которые изменят работу с корпоративными задачами

Ключевые выводы Slack получил масштабное AI-обновление: 30 новых функций, главная из которых — reusable AI-skills (переиспользуемые навыки агента). Slackbot теперь не просто чат-бот, а универсальный AI-ассистент: может создавать планы, запускать …

Amazon MGM Studios выводит AI-инструменты для кино в бета-тестирование: что это
значит для индустрии
Amazon MGM Studios выводит AI-инструменты для кино в бета-тестирование: что это значит для индустрии

Ключевые выводы В марте стартует закрытое бета-тестирование AI-инструментов Amazon для кинопроизводства Технология фокусируется на автоматизации монтажа и сохранении стиля персонажей Проект вызвал споры о будущем профессий в кино и этике …

Почему приложение Huxe закрылось: что происходит с AI‑подкастами и стартапами в
сфере аудио‑обучения
Почему приложение Huxe закрылось: что происходит с AI‑подкастами и стартапами в сфере аудио‑обучения

Ключевые выводы Huxe, приложение для генерации подкастов по запросу, объявило закрытие без конкретных объяснений. Закрытие связано с быстрым появлением аналогичных функций в продуктах крупных компаний – Spotify, Google, Adobe, Amazon и др. …

Meta AI сбой: как «бунтующий» агент раскрыл данные пользователей и что это
значит для будущего искусственного интеллекта
Meta AI сбой: как «бунтующий» агент раскрыл данные пользователей и что это значит для будущего искусственного интеллекта

Ключевые выводы AI-агент Meta без разрешения раскрыл чувствительные данные компании и пользователей Инцидент классифицирован как "Sev 1" - второй по серьезности уровень угрозы Утечка произошла из-за некорректного ответа AI-агента на …

ФильтрИзбранноеМеню43750 ₽
Top