Ключевые выводы
- Крупные игроки (Uber, Microsoft, Priceline) уже превысили бюджеты на AI в 3‑5 раз уже в первые месяцы 2026 года.
- Рост расходов вызывают автономные агенты и новые модели (Claude Opus 4.5, GPT‑5.1, Gemini 3 Pro), которые потребляют токены в масштабе триллионов записей.
- Рынок инструментов мониторинга и новых стандартов (Tokenomics Foundation, FinOps) быстро формируется, предлагая контроль, аудит и оптимизацию расходов.
В 2026 году компании впервые столкнулись с настоящей «кризисной» ситуацией: расходы на генеративный AI растут быстрее, чем возможности их контролировать. Мы разберём, почему так происходит, какие решения уже появляются и как не стать «пленником» токенов.
Кто уже «переплатил» за AI и почему
У Uber в течение первых четырёх месяцев 2026 года был полностью израсходован весь плановый бюджет на AI‑кодинг. Microsoft за несколько месяцев отозвала лицензии Claude Code у своих разработчиков, а в Priceline сотрудник сообщил, что продление контракта на Cursor обошлось в 4‑5 раз дороже, чем ожидалось.
Снижение цены за токен не спасло компании. Автономные агенты и «агентные» функции новых моделей резко увеличили количество запросов. Пример: один проект в США потратил около 500 млн долларов на Claude, просто забыв установить лимиты.
Спрос на самые мощные модели (Claude Opus 4.5, GPT‑5.1, Gemini 3 Pro) вырос после их выхода в ноябре 2025 года. Они дают лучшее качество кода, но требуют в несколько раз больше токенов для обучения и инференса.
В результате компании, которые в начале 2025 года подписали «all‑you‑can‑eat» подписки, сейчас находятся в поиске «где же мои деньги». Им нужны инструменты, позволяющие увидеть, как расходуются токены, и способы ограничить нецелевое потребление.
Переход от «что может?» к «сколько стоит?»
Шесть месяцев назад разговоры с клиентами были о том, насколько модели «достаточно хороши». Сейчас — о видимости расходов, аудите, контроле токенов и эффективности моделей.
OpenAI, через главу отдела enterprise Александра Эмбрикоса, уже официально заявила, что главная боль клиентов — отсутствие прозрачных метрик и возможностей ограничения расходов.
FinOps Foundation (под эгидой Linux Foundation) фиксирует, что компании уже в апреле 2026 года превышают свои токен‑бюджеты в 3 раза. Они называют это «кризисом» и требуют «guardrails» — ограничений и инструментов контроля.
Тренд очевиден: вместо «token‑maxxing» и «быстрее‑вперёд», бизнес ищет способы измерять эффективность, сравнивать модели и управлять расходами на уровне токенов.
Что именно приводит к росту расходов?
1. **Автономные агенты** – они могут выполнять цепочки действий без человеческого вмешательства, тем самым генерируя огромное количество запросов.
2. **Новые модели** – GPT‑5.1, Claude Opus 4.5, Gemini 3 Pro обладают лучшей способностью к «self‑prompting», что удешевляет отдельные запросы, но общая потребность в токенах растет экспоненциально.
3. **Отсутствие лимитов** – многие компании забывают установить ограничения для сотрудников, что приводит к «запретным» расходам (пример с $500 млн).
4. **Отсутствие единого языка измерения** – пока нет единой метрики «стоимость токена», сравнивать цены разных провайдеров почти невозможно.
Как рынок отвечает на проблему
Появляются специализированные стартапы и крупные игроки, предлагающие мониторинг и оптимизацию токенов.
*Pay‑i* – платформа, измеряющая и оптимизирующая затраты и производительность генеративного AI. *Paid* позволяет отслеживать реальные расходы, а не подписку.
Платформы *Jellyfish*, *Waydev* и *Faros AI* предлагают мониторинг AI‑агентов, доказывая ROI от использования инструментов.
Традиционные облачные сервисы тоже в коробку добавляют AI‑FinOps: Ramp, Datadog, New Relic уже предлагают токен‑уровневую видимость, GPU‑мониторинг и облачную стоимость.
На конференции FinOps X планируется анонс новых функций от AWS, ориентированных на управление AI‑расходами.
Tokenomics Foundation: попытка создать стандарты
Linux Foundation в этом году запустила Tokenomics Foundation – инициативу, вдохновлённую FinOps для облака. Цель – определить «канонические» определения токенов, создать открытые спецификации и метрики, такие как cost‑per‑intelligence, tokens‑per‑watt и эффективность фабрики токенов.
По словам Джей‑Ар Стормент из FinOps, управление токенами — это «триллион‑строк‑в‑мес data problem», требующее новых инструментов и процессов.
Среди первых задач фонда – разработка единого языка цен, позволяющего сравнивать Anthropic, OpenAI и Google по реальной стоимости.
Скоро будет официальный запуск (июль), а на FinOps X объявят новых членов и первые стандарты.
Что делать сейчас, если ваш бюджет уже «перелетел»?
1. **Ввести лимиты** – установить жёсткие ограничения на количество токенов для групп и отдельных разработчиков.
2. **Внедрить мониторинг** – использовать инструменты Pay‑i, Datadog или внутренние скрипты для сбора данных о потреблении токенов в реальном времени.
3. **Оценить ROI** – сравнить стоимость токенов с экономическим эффектом от ускоренного выпуска кода (например, через метрику revenue‑per‑token).
4. **Перейти к «умному роутингу»** – использовать сервисы типа Factory, которые автоматически выбирают более дешёвую модель для простых задач.
5. **Следить за новыми стандартами** – подключаться к Tokenomics Foundation, чтобы быть в курсе общих метрик и лучшей практики.
Справка
Uber – основана в 2009 году, крупнейший сервис такси и доставки. В 2026 году компания потратила весь годовой бюджет на AI‑кодинг до апреля, что привело к пересмотру стратегии расходов.
Microsoft – технологический гигант, создатель Azure. В 2026 году отозвал лицензии Claude Code у разработчиков, демонстрируя быстрый отклик на рост расходов.
Priceline (часть Booking Holdings) – онлайн‑агрегатор путешествий. Сотрудники компании сообщили о 4‑5‑кратном росте стоимости контракта на Cursor, а также о необходимости вводить токен‑лимиты.
Claude Opus 4.5 – модель от Anthropic, вышедшая в ноябре 2025 года, отличающаяся улучшенной способностью к контекстному пониманию, но требующая больше токенов.
Tokenomics Foundation – новый стандарт‑орган, инициированный Linux Foundation, цель которого – создать открытые определения и метрики для токенов AI, аналогично FinOps для облака.
Рост расходов на AI уже перестал быть «мелкой проблемой». Без видимости, аудита и контроля компании рискуют съесть большую часть бюджета. Инструменты мониторинга и новые стандарты позволяют вернуть баланс, а значит — вернуть инвестиции в реальную бизнес‑ценность.








