Google Представил Новые Tpu 8t И Tpu 8i: Ускоренная Тренировка И Выгодный Inference Для Ии‑Моделей

TechLand 22 апреля 2026 г. 18:39 74 Время чтения: 1 минут.

Google Представил Новые Tpu 8t И Tpu 8i: Ускоренная Тренировка И Выгодный
Inference Для Ии‑Моделей

Ключевые выводы
Что именно представляет собой TPU 8t и TPU 8i?
Сравнение с предыдущим поколением и конкурентами
Как новые TPU влияют на затраты клиентов
Сотрудничество с Nvidia и развитие сетевого стека Falcon
Перспективы развития AI‑чипов у гиперскейлеров
Справка

Ключевые выводы

Google разделил восьмое поколение TPU на два продукта: TPU 8t (тренировка) и TPU 8i (inference).
Новые чипы обещают до 3 раз быстрее обучение моделей, 80 % лучшее соотношение цена‑производительность и возможность соединения более миллиона TPU в один кластер.
Google продолжит поддерживать GPU Nvidia (Vera Rubin) и совместно развивает сетевой стек Falcon, что делает их облачную инфраструктуру гибридной, а не полной заменой Nvidia.

Google объявил о выпуске двух специализированных тензорных процессоров, которые обещают ускорить обучение ИИ‑моделей и снизить затраты на их использование в облаке.

Что именно представляет собой TPU 8t и TPU 8i?

TPU 8t — это «тренировочный» чип. Он ориентирован на работу с большими нейросетями, где нужны сотни терафлопов вычислительной мощности. TPU 8i — «инференсный» вариант, который оптимизирован для быстрого отклика на запросы пользователей после того, как модель уже обучена.

Разделение на две линии дает Google возможность более точно подгонять железо под конкретные задачи: обучение получает максимум вычислительных ресурсов, а inference – минимум задержек и энергопотребления.

По словам инженеров Google, обе модели построены на том же базовом ядре тензорных процессоров, но различаются конфигурацией памяти, сетевого интерфейса и частотой работы.

Одна из самых громких цифр – возможность собрать более 1 млн TPU в едином кластере. Это открывает двери для обучения гипермасштабных моделей вроде GPT‑4‑уровня без разбивки нагрузки между несколькими провайдерами.

Сравнение с предыдущим поколением и конкурентами

В сравнении с TPU v4 новые процессоры показывают:

до 3 раз быстрее обучение (из‑за улучшенной матричной арифметики);
на 80 % лучшее соотношение цена‑производительность;
в 2‑3‑кратном снижении энергопотребления на инференс‑запрос.

Для Nvidia это не прямая атака, а скорее добавление к портфолио. Google уже обещал, что в его облаке к концу года появятся GPU «Vera Rubin» – мощные ускорители от Nvidia, ориентированные на графическую обработку и глубокое обучение.

Такой гибридный подход позволяет клиентам выбирать «идеальный» набор железа под конкретный проект, а Google сохраняет совместимость с крупнейшими экосистемами ИИ‑инструментов.

Как новые TPU влияют на затраты клиентов

Благодаря более высокой эффективности, компании могут уменьшить расходы на обучение моделей на десятки тысяч долларов. При масштабных проектах, где требуется многодневный тренинг, экономия становится заметной уже после первых нескольких запусков.

Кроме того, возможность объединять сотни тысяч TPU в один кластер сокращает необходимость в дополнительных сервисах оркестрации и сетевого оборудования, что тоже сказывается на счёте.

Ниже простая формула, которую используют многие стартапы: затраты ≈ (вычислительные часы × цена за час) ÷ коэффициент эффективности. Увеличивая коэффициент эффективности на 80 %, итоговая стоимость падает почти вдвое.

Сотрудничество с Nvidia и развитие сетевого стека Falcon

Google не собирается полностью отказываться от Nvidia. В этом квартале компании начали совместно работать над улучшением программного обеспечения Falcon – low‑latency транспортного уровня, открытого в 2023 году. Falcon позволяет ускорить передачу данных между GPU и TPU, минимизируя задержки в распределенных вычислениях.

Проект развивается в рамках Open Compute Project, где открытый исходный код помогает другим провайдерам и крупным компаниям внедрять одинаковые стандарты сетевого взаимодействия.

Для клиентов это значит, что независимо от того, используют ли они TPU, GPU Nvidia или их комбинацию, они получат одинаково стабильную и быструю связь между узлами.

Перспективы развития AI‑чипов у гиперскейлеров

Сейчас Amazon, Microsoft и Google активно инвестируют в собственные AI‑чипы. Но пока полностью избавиться от Nvidia не получается – рынок GPU всё ещё доминирует в сфере графики и некоторых видов обучения.

Если спрос на облачные ИИ‑услуги продолжит расти, гиперскейлеры могут уменьшить свою зависимость от сторонних поставщиков, интегрируя всё больше специализированных процессоров в свои дата‑центры.

Тем не менее, аналитики считают, что ставка на собственные чипы – это скорее стратегическая диверсификация, чем попытка вытеснить Nvidia.

Справка

Google Cloud – подразделение Google, предоставляющее облачные сервисы (вычисления, хранение, AI). Основано в 2008 году, обслуживает более 10 млн компаний, включая крупнейшие технологические корпорации.

Tensor Processing Unit (TPU) – кастомный ASIC от Google, специально разработанный для ускорения матричных операций в нейронных сетях. Первая версия появилась в 2016 году.

TPU 8t – новая модель TPU, предназначенная для обучения моделей. Обеспечивает до 3 раз большую производительность по сравнению с предыдущим поколением.

TPU 8i – инференс‑версии TPU, оптимизированная под быстрый отклик и низкое энергопотребление при обслуживании запросов пользователей.

Nvidia Vera Rubin – графический процессор последнего поколения от Nvidia, названный в честь известного астронома. Планируется к запуску в облаке Google в конце 2024 года.

Falcon – программный стек для низколатентных сетевых соединений, открытый Google в 2023 году. Работает в рамках Open Compute Project, позволяя ускорять передачу данных между ускорителями.

Новые TPU 8t и TPU 8i могут стать важным шагом к более доступному и эффективному ИИ в облаке, а гибридная стратегия Google сохраняет баланс между собственными чипами и GPU‑решениями Nvidia.

Интересно почитать :

История смартфонов Google — от Nexus до Pixel: эволюция бренда и ключевые технологии

Кратко: Google начал производство смартфонов в 2010 году с линейки Nexus В 2016 году бренд Pixel заменил Nexus, став флагманом чистого Android С 2021 года Google использует собственные процессоры Tensor …

Как сделать веб‑камеру из смартфона для видеосвязи: пошаговое руководство

Кратко: Нативные возможности Android 14 и iOS 17 позволяют подключить телефон без сторонних программ. Для Windows 11 доступна связь через приложение «Связь с Windows» без установки клиентской части. Топ‑5 приложений …

Сравнили сборки ПК на 100 000 рублей от ChatGPT, Gemini и DeepSeek — кто справился лучше?

Кратко: Все три крупные нейросети превысили заявленный бюджет — от 120 000 руб до 145 000 руб. Самая точная цена‑прогнозика – у DeepSeek, но и она ошиблась в видеокарте. Лучший …

Scapia привлек $63 млн: как индийский финтех меняет путешествия и платежи

Ключевые выводы Scapia привлекла $63 млн в раунде, возглавляемом General Catalyst, оценка компании превысила $500 млн. Стартап сочетает кобрендинговые карты Visa/RuPay, UPI‑платежи и сервисы бронирования, ориентируясь на молодёжь. За год …

Как стартап ScaleOps экономит до 80% расходов на облако, устраняя «простой» GPU и решая проблему статичных настроек Kubernetes

Ключевые выводы Компании тратят миллионы на GPU и облачные ресурсы, но до 80% этих мощностей простаивает из-за неэффективного ручного управления и статичных настроек в Kubernetes. Израильский стартап ScaleOps, основанный бывшим …

GM открывает рынок стационарных батарей: натрий‑ион против лития, почему автопроизводителям выгодно инвестировать в хранение энергии

Ключевые выводы GM объявила о запуске серии натрий‑ионных батарей, ориентированных на рынок стационарного хранения энергии. Рост спроса на крупные батареи обусловлен ускоренным строительством AI‑ дата‑центров и масштабной электрификацией промышленности. Натрий‑ион …

Google Представил Новые Tpu 8t И Tpu 8i: Ускоренная Тренировка И Выгодный Inference Для Ии‑Моделей

Содержание