Почему Компании «Потаптывают» Бюджеты На Ai: Рост Расходов, Новые Стандарты И Как Вернуть Контроль

TechLand 5 июня 2026 г. 14:49 56 Время чтения: 2 минут.

Почему Компании «Потаптывают» Бюджеты На Ai: Рост Расходов, Новые Стандарты И
Как Вернуть Контроль

Ключевые выводы
Кто уже «переплатил» за AI и почему
Переход от «что может?» к «сколько стоит?»
Что именно приводит к росту расходов?
Как рынок отвечает на проблему
Tokenomics Foundation: попытка создать стандарты
Что делать сейчас, если ваш бюджет уже «перелетел»?
Справка

Ключевые выводы

Крупные игроки (Uber, Microsoft, Priceline) уже превысили бюджеты на AI в 3‑5 раз уже в первые месяцы 2026 года.
Рост расходов вызывают автономные агенты и новые модели (Claude Opus 4.5, GPT‑5.1, Gemini 3 Pro), которые потребляют токены в масштабе триллионов записей.
Рынок инструментов мониторинга и новых стандартов (Tokenomics Foundation, FinOps) быстро формируется, предлагая контроль, аудит и оптимизацию расходов.

В 2026 году компании впервые столкнулись с настоящей «кризисной» ситуацией: расходы на генеративный AI растут быстрее, чем возможности их контролировать. Мы разберём, почему так происходит, какие решения уже появляются и как не стать «пленником» токенов.

Кто уже «переплатил» за AI и почему

У Uber в течение первых четырёх месяцев 2026 года был полностью израсходован весь плановый бюджет на AI‑кодинг. Microsoft за несколько месяцев отозвала лицензии Claude Code у своих разработчиков, а в Priceline сотрудник сообщил, что продление контракта на Cursor обошлось в 4‑5 раз дороже, чем ожидалось.

Снижение цены за токен не спасло компании. Автономные агенты и «агентные» функции новых моделей резко увеличили количество запросов. Пример: один проект в США потратил около 500 млн долларов на Claude, просто забыв установить лимиты.

Спрос на самые мощные модели (Claude Opus 4.5, GPT‑5.1, Gemini 3 Pro) вырос после их выхода в ноябре 2025 года. Они дают лучшее качество кода, но требуют в несколько раз больше токенов для обучения и инференса.

В результате компании, которые в начале 2025 года подписали «all‑you‑can‑eat» подписки, сейчас находятся в поиске «где же мои деньги». Им нужны инструменты, позволяющие увидеть, как расходуются токены, и способы ограничить нецелевое потребление.

Переход от «что может?» к «сколько стоит?»

Шесть месяцев назад разговоры с клиентами были о том, насколько модели «достаточно хороши». Сейчас — о видимости расходов, аудите, контроле токенов и эффективности моделей.

OpenAI, через главу отдела enterprise Александра Эмбрикоса, уже официально заявила, что главная боль клиентов — отсутствие прозрачных метрик и возможностей ограничения расходов.

FinOps Foundation (под эгидой Linux Foundation) фиксирует, что компании уже в апреле 2026 года превышают свои токен‑бюджеты в 3 раза. Они называют это «кризисом» и требуют «guardrails» — ограничений и инструментов контроля.

Тренд очевиден: вместо «token‑maxxing» и «быстрее‑вперёд», бизнес ищет способы измерять эффективность, сравнивать модели и управлять расходами на уровне токенов.

Что именно приводит к росту расходов?

1. **Автономные агенты** – они могут выполнять цепочки действий без человеческого вмешательства, тем самым генерируя огромное количество запросов.

2. **Новые модели** – GPT‑5.1, Claude Opus 4.5, Gemini 3 Pro обладают лучшей способностью к «self‑prompting», что удешевляет отдельные запросы, но общая потребность в токенах растет экспоненциально.

3. **Отсутствие лимитов** – многие компании забывают установить ограничения для сотрудников, что приводит к «запретным» расходам (пример с $500 млн).

4. **Отсутствие единого языка измерения** – пока нет единой метрики «стоимость токена», сравнивать цены разных провайдеров почти невозможно.

Как рынок отвечает на проблему

Появляются специализированные стартапы и крупные игроки, предлагающие мониторинг и оптимизацию токенов.

*Pay‑i* – платформа, измеряющая и оптимизирующая затраты и производительность генеративного AI. *Paid* позволяет отслеживать реальные расходы, а не подписку.

Платформы *Jellyfish*, *Waydev* и *Faros AI* предлагают мониторинг AI‑агентов, доказывая ROI от использования инструментов.

Традиционные облачные сервисы тоже в коробку добавляют AI‑FinOps: Ramp, Datadog, New Relic уже предлагают токен‑уровневую видимость, GPU‑мониторинг и облачную стоимость.

На конференции FinOps X планируется анонс новых функций от AWS, ориентированных на управление AI‑расходами.

Tokenomics Foundation: попытка создать стандарты

Linux Foundation в этом году запустила Tokenomics Foundation – инициативу, вдохновлённую FinOps для облака. Цель – определить «канонические» определения токенов, создать открытые спецификации и метрики, такие как cost‑per‑intelligence, tokens‑per‑watt и эффективность фабрики токенов.

По словам Джей‑Ар Стормент из FinOps, управление токенами — это «триллион‑строк‑в‑мес data problem», требующее новых инструментов и процессов.

Среди первых задач фонда – разработка единого языка цен, позволяющего сравнивать Anthropic, OpenAI и Google по реальной стоимости.

Скоро будет официальный запуск (июль), а на FinOps X объявят новых членов и первые стандарты.

Что делать сейчас, если ваш бюджет уже «перелетел»?

1. **Ввести лимиты** – установить жёсткие ограничения на количество токенов для групп и отдельных разработчиков.

2. **Внедрить мониторинг** – использовать инструменты Pay‑i, Datadog или внутренние скрипты для сбора данных о потреблении токенов в реальном времени.

3. **Оценить ROI** – сравнить стоимость токенов с экономическим эффектом от ускоренного выпуска кода (например, через метрику revenue‑per‑token).

4. **Перейти к «умному роутингу»** – использовать сервисы типа Factory, которые автоматически выбирают более дешёвую модель для простых задач.

5. **Следить за новыми стандартами** – подключаться к Tokenomics Foundation, чтобы быть в курсе общих метрик и лучшей практики.

Справка

Uber – основана в 2009 году, крупнейший сервис такси и доставки. В 2026 году компания потратила весь годовой бюджет на AI‑кодинг до апреля, что привело к пересмотру стратегии расходов.

Microsoft – технологический гигант, создатель Azure. В 2026 году отозвал лицензии Claude Code у разработчиков, демонстрируя быстрый отклик на рост расходов.

Priceline (часть Booking Holdings) – онлайн‑агрегатор путешествий. Сотрудники компании сообщили о 4‑5‑кратном росте стоимости контракта на Cursor, а также о необходимости вводить токен‑лимиты.

Claude Opus 4.5 – модель от Anthropic, вышедшая в ноябре 2025 года, отличающаяся улучшенной способностью к контекстному пониманию, но требующая больше токенов.

Tokenomics Foundation – новый стандарт‑орган, инициированный Linux Foundation, цель которого – создать открытые определения и метрики для токенов AI, аналогично FinOps для облака.

Рост расходов на AI уже перестал быть «мелкой проблемой». Без видимости, аудита и контроля компании рискуют съесть большую часть бюджета. Инструменты мониторинга и новые стандарты позволяют вернуть баланс, а значит — вернуть инвестиции в реальную бизнес‑ценность.

Интересно почитать :

IPO Go в Японии: крупнейшее размещение 2024 года и путь к роботакси

Ключевые выводы Go привлекла 88,6 млрд иен (≈ 553 млн $) — крупнейшее IPO в Японии в 2024‑м году. Полученные средства пойдут на развитие роботакси, R&D и возможные M&A в …

Beehiiv расширяет возможности: вебинары, AI‑аналитика подкастов, платные пробные периоды и метранные платные стены

Ключевые выводы Beehiiv превратился из сервиса рассылок в универсальную площадку для создателей: теперь доступны вебинары, подкасты с AI‑аналитикой и гибкие модели монетизации. Новые вебинары поддерживают до 10 000 участников, видео, …

Новый процессор Nvidia Vera: как «агентный» ИИ открывает $200 млрд рынка

Ключевые выводы Вера — первый в мире процессор, специально спроектированный для агентного ИИ, открывает новый рынок стоимостью около $200 млрд. Nvidia уже продала процессоры Vera на сумму $20 млрд, а …

Founders Fund запускает «MAFIA the GAME»: технологические титаны в карточном шоу

Ключевые выводы Founders Fund запустил шоу «MAFIA the GAME», где ведущие технологические предприниматели соревнуются в карточной игре. Проект отражает рост инфотейнмента: бизнес‑лидеры используют развлекательный контент для брендинга и политического влияния. …

История серии Forza Horizon: от начала в 2012‑го до шестой части 2026 года

Кратко: Первая часть Forza Horizon вышла в 2012 г., превратив серию в открытый мир. Каждая новая игра меняет локацию, добавляет сезоны, ко‑оператив и новые режимы. Forza Horizon 6 (2026) перенесёт …

End‑to‑end шифрование в RCS: iPhone и Android наконец могут писать друг другу в защищённом режиме

Ключевые выводы Apple и Google начали бета‑тестировать сквозное шифрование в RCS‑сообщениях между iPhone и Android. Шифрование защищает переписку от хакеров, правительств и даже компаний‑операторов. Новые возможности RCS (индикатор набора, реакция …