Google Представил Новые Tpu 8t И Tpu 8i: Ускоренная Тренировка И Выгодный Inference Для Ии‑Моделей

Ключевые выводы

  • Google разделил восьмое поколение TPU на два продукта: TPU 8t (тренировка) и TPU 8i (inference).
  • Новые чипы обещают до 3 раз быстрее обучение моделей, 80 % лучшее соотношение цена‑производительность и возможность соединения более миллиона TPU в один кластер.
  • Google продолжит поддерживать GPU Nvidia (Vera Rubin) и совместно развивает сетевой стек Falcon, что делает их облачную инфраструктуру гибридной, а не полной заменой Nvidia.
Google объявил о выпуске двух специализированных тензорных процессоров, которые обещают ускорить обучение ИИ‑моделей и снизить затраты на их использование в облаке.

Что именно представляет собой TPU 8t и TPU 8i?

TPU 8t — это «тренировочный» чип. Он ориентирован на работу с большими нейросетями, где нужны сотни терафлопов вычислительной мощности. TPU 8i — «инференсный» вариант, который оптимизирован для быстрого отклика на запросы пользователей после того, как модель уже обучена.

Разделение на две линии дает Google возможность более точно подгонять железо под конкретные задачи: обучение получает максимум вычислительных ресурсов, а inference – минимум задержек и энергопотребления.

По словам инженеров Google, обе модели построены на том же базовом ядре тензорных процессоров, но различаются конфигурацией памяти, сетевого интерфейса и частотой работы.

Одна из самых громких цифр – возможность собрать более 1 млн TPU в едином кластере. Это открывает двери для обучения гипермасштабных моделей вроде GPT‑4‑уровня без разбивки нагрузки между несколькими провайдерами.

Сравнение с предыдущим поколением и конкурентами

В сравнении с TPU v4 новые процессоры показывают:

  • до 3 раз быстрее обучение (из‑за улучшенной матричной арифметики);
  • на 80 % лучшее соотношение цена‑производительность;
  • в 2‑3‑кратном снижении энергопотребления на инференс‑запрос.

Для Nvidia это не прямая атака, а скорее добавление к портфолио. Google уже обещал, что в его облаке к концу года появятся GPU «Vera Rubin» – мощные ускорители от Nvidia, ориентированные на графическую обработку и глубокое обучение.

Такой гибридный подход позволяет клиентам выбирать «идеальный» набор железа под конкретный проект, а Google сохраняет совместимость с крупнейшими экосистемами ИИ‑инструментов.

Как новые TPU влияют на затраты клиентов

Благодаря более высокой эффективности, компании могут уменьшить расходы на обучение моделей на десятки тысяч долларов. При масштабных проектах, где требуется многодневный тренинг, экономия становится заметной уже после первых нескольких запусков.

Кроме того, возможность объединять сотни тысяч TPU в один кластер сокращает необходимость в дополнительных сервисах оркестрации и сетевого оборудования, что тоже сказывается на счёте.

Ниже простая формула, которую используют многие стартапы: затраты ≈ (вычислительные часы × цена за час) ÷ коэффициент эффективности. Увеличивая коэффициент эффективности на 80 %, итоговая стоимость падает почти вдвое.

Сотрудничество с Nvidia и развитие сетевого стека Falcon

Google не собирается полностью отказываться от Nvidia. В этом квартале компании начали совместно работать над улучшением программного обеспечения Falcon – low‑latency транспортного уровня, открытого в 2023 году. Falcon позволяет ускорить передачу данных между GPU и TPU, минимизируя задержки в распределенных вычислениях.

Проект развивается в рамках Open Compute Project, где открытый исходный код помогает другим провайдерам и крупным компаниям внедрять одинаковые стандарты сетевого взаимодействия.

Для клиентов это значит, что независимо от того, используют ли они TPU, GPU Nvidia или их комбинацию, они получат одинаково стабильную и быструю связь между узлами.

Перспективы развития AI‑чипов у гиперскейлеров

Сейчас Amazon, Microsoft и Google активно инвестируют в собственные AI‑чипы. Но пока полностью избавиться от Nvidia не получается – рынок GPU всё ещё доминирует в сфере графики и некоторых видов обучения.

Если спрос на облачные ИИ‑услуги продолжит расти, гиперскейлеры могут уменьшить свою зависимость от сторонних поставщиков, интегрируя всё больше специализированных процессоров в свои дата‑центры.

Тем не менее, аналитики считают, что ставка на собственные чипы – это скорее стратегическая диверсификация, чем попытка вытеснить Nvidia.

Справка

Google Cloud – подразделение Google, предоставляющее облачные сервисы (вычисления, хранение, AI). Основано в 2008 году, обслуживает более 10 млн компаний, включая крупнейшие технологические корпорации.

Tensor Processing Unit (TPU) – кастомный ASIC от Google, специально разработанный для ускорения матричных операций в нейронных сетях. Первая версия появилась в 2016 году.

TPU 8t – новая модель TPU, предназначенная для обучения моделей. Обеспечивает до 3 раз большую производительность по сравнению с предыдущим поколением.

TPU 8i – инференс‑версии TPU, оптимизированная под быстрый отклик и низкое энергопотребление при обслуживании запросов пользователей.

Nvidia Vera Rubin – графический процессор последнего поколения от Nvidia, названный в честь известного астронома. Планируется к запуску в облаке Google в конце 2024 года.

Falcon – программный стек для низколатентных сетевых соединений, открытый Google в 2023 году. Работает в рамках Open Compute Project, позволяя ускорять передачу данных между ускорителями.

Новые TPU 8t и TPU 8i могут стать важным шагом к более доступному и эффективному ИИ в облаке, а гибридная стратегия Google сохраняет баланс между собственными чипами и GPU‑решениями Nvidia.

Интересно почитать :

Как работает шумоподавление в наушниках: простое объяснение технологий и их
эффективность
Как работает шумоподавление в наушниках: простое объяснение технологий и их эффективность

Кратко: ANC — это совместная работа микрофонов, процессора и динамика, создающая «противофазу». Гибридные схемы (два микрофона) дают лучший диапазон частот и стабильность. Адаптивный режим автоматически меняет уровень подавления в зависимости …

Какое качество воды в регионах России: оптимальный подбор фильтров для чистой
питьевой воды
Какое качество воды в регионах России: оптимальный подбор фильтров для чистой питьевой воды

Кратко: Качество воды в регионах России значительно различается из-за геологических особенностей Основные загрязнения: железо, хлор, жесткость, нитраты, микробиология Оптимальный фильтр подбирается на основе анализа воды из конкретного источника Обратный осмос …

Google предоставил Министерству обороны США доступ к ИИ для классифицированных
сетей: что это значит?
Google предоставил Министерству обороны США доступ к ИИ для классифицированных сетей: что это значит?

Ключевые выводы Google заключил договор с Министерством обороны США, позволяя использовать свои ИИ‑модели в секретных сетях. Компания добавила формулировку о нежелании применять ИИ для массовой слежки и автономного вооружения, но …

Роботы-«невидимки»: как Lucid Bots моет окна, пока другие показывают фокусы
Роботы-«невидимки»: как Lucid Bots моет окна, пока другие показывают фокусы

Ключевые выводы Компания Lucid Bots сознательно идёт против мейнстрима робототехники, фокусируясь не на человекоподобных роботах, а на решении конкретных рабочих задач — мойке окон и фасадов. Основатель Эндрю Ашур, без …

Tank OS — новый открытый инструмент Red Hat для безопасного развёртывания
OpenClaw
Tank OS — новый открытый инструмент Red Hat для безопасного развёртывания OpenClaw

Ключевые выводы Tank OS — открытый проект, позволяющий развёртывать OpenClaw в изолированных контейнерах Podman на Fedora. Инструмент ориентирован на ИТ‑профессионалов, которым нужно управлять массивом агентов OpenClaw в корпоративных сетях. Tank …

Replit — от 2,8 млн $ к бюджету в 1 млрд $: что происходит с AI‑платформой?
Replit — от 2,8 млн $ к бюджету в 1 млрд $: что происходит с AI‑платформой?

Ключевые выводы Replit за 18 мес. превратился из компании с доходом $2,8 млн в 2024‑й в бизнес с годовым run‑rate в близости к $1 млрд. Компания остаётся независимой, но её маржа (+gross margin) …

ФильтрИзбранноеМеню43750 ₽
Top