Google Представил Новые Tpu 8t И Tpu 8i: Ускоренная Тренировка И Выгодный Inference Для Ии‑Моделей

Ключевые выводы

  • Google разделил восьмое поколение TPU на два продукта: TPU 8t (тренировка) и TPU 8i (inference).
  • Новые чипы обещают до 3 раз быстрее обучение моделей, 80 % лучшее соотношение цена‑производительность и возможность соединения более миллиона TPU в один кластер.
  • Google продолжит поддерживать GPU Nvidia (Vera Rubin) и совместно развивает сетевой стек Falcon, что делает их облачную инфраструктуру гибридной, а не полной заменой Nvidia.
Google объявил о выпуске двух специализированных тензорных процессоров, которые обещают ускорить обучение ИИ‑моделей и снизить затраты на их использование в облаке.

Что именно представляет собой TPU 8t и TPU 8i?

TPU 8t — это «тренировочный» чип. Он ориентирован на работу с большими нейросетями, где нужны сотни терафлопов вычислительной мощности. TPU 8i — «инференсный» вариант, который оптимизирован для быстрого отклика на запросы пользователей после того, как модель уже обучена.

Разделение на две линии дает Google возможность более точно подгонять железо под конкретные задачи: обучение получает максимум вычислительных ресурсов, а inference – минимум задержек и энергопотребления.

По словам инженеров Google, обе модели построены на том же базовом ядре тензорных процессоров, но различаются конфигурацией памяти, сетевого интерфейса и частотой работы.

Одна из самых громких цифр – возможность собрать более 1 млн TPU в едином кластере. Это открывает двери для обучения гипермасштабных моделей вроде GPT‑4‑уровня без разбивки нагрузки между несколькими провайдерами.

Сравнение с предыдущим поколением и конкурентами

В сравнении с TPU v4 новые процессоры показывают:

  • до 3 раз быстрее обучение (из‑за улучшенной матричной арифметики);
  • на 80 % лучшее соотношение цена‑производительность;
  • в 2‑3‑кратном снижении энергопотребления на инференс‑запрос.

Для Nvidia это не прямая атака, а скорее добавление к портфолио. Google уже обещал, что в его облаке к концу года появятся GPU «Vera Rubin» – мощные ускорители от Nvidia, ориентированные на графическую обработку и глубокое обучение.

Такой гибридный подход позволяет клиентам выбирать «идеальный» набор железа под конкретный проект, а Google сохраняет совместимость с крупнейшими экосистемами ИИ‑инструментов.

Как новые TPU влияют на затраты клиентов

Благодаря более высокой эффективности, компании могут уменьшить расходы на обучение моделей на десятки тысяч долларов. При масштабных проектах, где требуется многодневный тренинг, экономия становится заметной уже после первых нескольких запусков.

Кроме того, возможность объединять сотни тысяч TPU в один кластер сокращает необходимость в дополнительных сервисах оркестрации и сетевого оборудования, что тоже сказывается на счёте.

Ниже простая формула, которую используют многие стартапы: затраты ≈ (вычислительные часы × цена за час) ÷ коэффициент эффективности. Увеличивая коэффициент эффективности на 80 %, итоговая стоимость падает почти вдвое.

Сотрудничество с Nvidia и развитие сетевого стека Falcon

Google не собирается полностью отказываться от Nvidia. В этом квартале компании начали совместно работать над улучшением программного обеспечения Falcon – low‑latency транспортного уровня, открытого в 2023 году. Falcon позволяет ускорить передачу данных между GPU и TPU, минимизируя задержки в распределенных вычислениях.

Проект развивается в рамках Open Compute Project, где открытый исходный код помогает другим провайдерам и крупным компаниям внедрять одинаковые стандарты сетевого взаимодействия.

Для клиентов это значит, что независимо от того, используют ли они TPU, GPU Nvidia или их комбинацию, они получат одинаково стабильную и быструю связь между узлами.

Перспективы развития AI‑чипов у гиперскейлеров

Сейчас Amazon, Microsoft и Google активно инвестируют в собственные AI‑чипы. Но пока полностью избавиться от Nvidia не получается – рынок GPU всё ещё доминирует в сфере графики и некоторых видов обучения.

Если спрос на облачные ИИ‑услуги продолжит расти, гиперскейлеры могут уменьшить свою зависимость от сторонних поставщиков, интегрируя всё больше специализированных процессоров в свои дата‑центры.

Тем не менее, аналитики считают, что ставка на собственные чипы – это скорее стратегическая диверсификация, чем попытка вытеснить Nvidia.

Справка

Google Cloud – подразделение Google, предоставляющее облачные сервисы (вычисления, хранение, AI). Основано в 2008 году, обслуживает более 10 млн компаний, включая крупнейшие технологические корпорации.

Tensor Processing Unit (TPU) – кастомный ASIC от Google, специально разработанный для ускорения матричных операций в нейронных сетях. Первая версия появилась в 2016 году.

TPU 8t – новая модель TPU, предназначенная для обучения моделей. Обеспечивает до 3 раз большую производительность по сравнению с предыдущим поколением.

TPU 8i – инференс‑версии TPU, оптимизированная под быстрый отклик и низкое энергопотребление при обслуживании запросов пользователей.

Nvidia Vera Rubin – графический процессор последнего поколения от Nvidia, названный в честь известного астронома. Планируется к запуску в облаке Google в конце 2024 года.

Falcon – программный стек для низколатентных сетевых соединений, открытый Google в 2023 году. Работает в рамках Open Compute Project, позволяя ускорять передачу данных между ускорителями.

Новые TPU 8t и TPU 8i могут стать важным шагом к более доступному и эффективному ИИ в облаке, а гибридная стратегия Google сохраняет баланс между собственными чипами и GPU‑решениями Nvidia.

Интересно почитать :

Индия предлагает нулевые налоги до 2047 года для привлечения гигантов облачных
технологий и инвестиций в ИИ
Индия предлагает нулевые налоги до 2047 года для привлечения гигантов облачных технологий и инвестиций в ИИ

Ключевые выводы Индия отменила налоги до 2047 года для зарубежных облачных компаний, размещающих инфраструктуру на своей территории Google, Microsoft и Amazon планируют инвестировать $67,5 млрд в индийские дата-центры для ИИ …

Spotify ужесточает доступ к API для разработчиков: что изменится для создателей
приложений
Spotify ужесточает доступ к API для разработчиков: что изменится для создателей приложений

Ключевые выводы С 2026 года Spotify ограничивает Developer Mode до 5 тестовых пользователей вместо 25 Обязательным требованием становится наличие Premium подписки у разработчика Удалены ключевые API endpoints для работы с …

Whoop представляет инновационные инструменты для женского здоровья: анализ крови
и прогнозирование цикла
Whoop представляет инновационные инструменты для женского здоровья: анализ крови и прогнозирование цикла

Ключевые выводы Whoop запускает новую панель для женского здоровья с 11 биомаркерами крови Компания добавила функцию прогнозирования гормональных изменений в менструальном цикле Анализ включает показатели AMH, прогестерона, витамина B12 и …

SK hynix готовится к листингу в США: зачем гиганту памяти $10–14 млрд и что это
значит для рынка AI-чипов
SK hynix готовится к листингу в США: зачем гиганту памяти $10–14 млрд и что это значит для рынка AI-чипов

Ключевые выводы SK hynix конфиденциально подала заявку на листинг в США (форма F-1) на вторую половину 2026 года, планируя привлечь $10–14 млрд. Основная цель листинга — сокращение долгосрочного дисконта в …

Что такое беспроводная зарядка Qi и как она связана с MagSafe
Что такое беспроводная зарядка Qi и как она связана с MagSafe

Кратко: Qi — открытый стандарт беспроводной зарядки, поддерживаемый тысячами устройств MagSafe — фирменная технология Apple с магнитным позиционированием Qi2 объединил лучшие черты обоих стандартов: магниты и универсальность Скорость зарядки зависит …

Beehiiv расширяет возможности: вебинары, AI‑аналитика подкастов, платные пробные
периоды и метранные платные стены
Beehiiv расширяет возможности: вебинары, AI‑аналитика подкастов, платные пробные периоды и метранные платные стены

Ключевые выводы Beehiiv превратился из сервиса рассылок в универсальную площадку для создателей: теперь доступны вебинары, подкасты с AI‑аналитикой и гибкие модели монетизации. Новые вебинары поддерживают до 10 000 участников, видео, …

ФильтрИзбранноеМеню43750 ₽
Top