Xcena Бросает Вызов Дорогим Процессорам: Чип Mx1 Приближает Вычисления К Памяти И Снижает Затраты На Ии‑Инференс

Ключевые выводы

  • XCENA разработала чип MX1, который размещает вычислительные ядра непосредственно в модуле DRAM, сокращая дорогостоящие походы данных между CPU, GPU и памятью.
  • Компания привлекла $135 млн в раунде Series B, общая оценка $570 млн, а массовое производство запланировано к концу 2026 года.
  • MX1 обещает заменить десятки серверов одним узлом, что особенно привлекательно для гиперскейлеров, тратящих десятки миллиардов на AI‑инфраструктуру.
Каждый запрос к ChatGPT заставляет данные прыгать от памяти к CPU, дальше к GPU и обратно. XCENA пытается остановить эту «гонку» и перенести часть работы прямо в память.

Проблема: почему текущая архитектура дорого обходится

Когда вы задаёте вопрос ChatGPT, запрос проходит несколько этапов: сначала выходит из оперативной памяти, попадает в CPU для предобработки, затем в GPU, где происходит тяжёлая математика, и возвращается обратно. И это происходит для каждого генерируемого слова.

Каждый такой «переход» требует энергии, времени и дорогостоящего железа. По сути, система тратит ресурсы не на саму модель, а на перемещение данных между процессорами и памятью.

Эта структура создаёт узкое место – дорогостоящие и энергозатратные чипы (CPU, GPU) вынуждены обслуживать каждое небольшое действие, хотя большая часть работы связана с простыми манипуляциями над данными.

Отсюда и растут расходы на облачные AI‑серверы, а также повышается нагрузка на электросети дата‑центров.

Решение XCENA: чип MX1 и концепция «вычисления у памяти»

XCENA (южнокорейско‑американский стартап) построила чип MX1, который ставит процессорные ядра прямо рядом с DRAM. Это достигается через интерфейс CXL (Compute Express Link) – быстрый «экспресс‑коридор» между процессором и модулем памяти.

Благодаря этому данные могут быть предобработаны, кешированы и даже храниться в KV‑кешах (контекст предыдущих запросов) непосредственно в памяти, без необходимости «выезжать» к CPU или GPU.

Внутри MX1 работают тысячи небольших ядер на базе RISC‑V, каждое из которых оптимизировано под задачи обработки данных, а не под тяжёлую математику. Именно эта вертикальная интеграция – собственный контроллер DRAM, шина межсоединений и иерархия памяти – отличает MX1 от конкурентов.

По заявлению компании, то, что раньше требовало 10 серверов, теперь может работать на одном узле.

Почему это важно для гиперскейлеров

Крупные облачные провайдеры ежегодно тратят десятки миллиардов долларов на AI‑инфраструктуру. Даже 1‑2 % экономии в потреблении памяти могут означать сотни миллионов долларов прибыли.

MX1 ориентирован именно на эти компании: ускорение предобработки, снижение нагрузки на CPU, экономия энергии и упрощение архитектуры дата‑центра.

Поскольку цены на память продолжают расти, а спрос на инференс растёт, переход к «memory‑centric» архитектурам выглядит логичным шагом.

В ближайшем будущем, когда модели станут ещё больше, такой подход может стать стандартом.

Конкуренты и отличия

На рынке уже работают Astera Labs и Marvell – обе компании предлагают решения по улучшению связи между процессорами и памятью. Marvell, будучи крупным игроком, использует несколько общих ядер, тогда как XCENA ставит ставку на «тысячи» специализированных ядер.

Кроме того, XCENA полностью контролирует стек: от микросхемы до контроллера DRAM, что даёт гибкость в настройке под конкретные нагрузки.

Такой уровень интеграции пока встречается редко и может стать конкурентным преимуществом, особенно если MX1 действительно покажет заявленные результаты.

Важно отметить, что MX1 пока находится в статусе прототипа; массовое производство стартует в конце 2026 года на фабриках Samsung, а первые доходы ожидаются в 2027 году.

Финансирование и планы роста

В марте 2024 года XCENA закрыла раунд Series B на $135 млн, возглавленный южнокорейскими венчурными фондами Altinum и IMM Investment, а также Corstone Asia и уже существующими инвесторами.

Оценка компании после раунда составила $570 млн, а общий объём привлеченных средств – $185 млн.

Помимо привлечения капитала, команда активно ведёт переговоры с мировыми поставщиками памяти, чтобы обеспечить масштабирование производства.

С учётом растущего спроса на решения, уменьшающие энергопотребление и стоимость инференса, инвесторы видят в MX1 потенциальный «ключевой слой» AI‑инфраструктуры.

В ближайшие годы XCENA планирует подписать первые крупные контракты с гиперскейлерами и расширить команду инженеров‑разработчиков.

Справка

XCENA – стартап, основанный в 2022 году в Пангё (Корея) и Саннивейле (США). Основатели – Джин Ким (CEO), Доун Ким (CTO) и Гарри Джухюн Ким (CPO), ранее работавшие в Samsung и SK Hynix. Компания разрабатывает чипы, которые помещают вычисления рядом с DRAM, чтобы уменьшить задержки и энергопотребление.

MX1 – первый прототип чипа от XCENA. Внутри него размещены тысячи ядер RISC‑V, собственный контроллер DRAM и шина CXL. Предназначен для ускорения инференса, предобработки данных и управления KV‑кешем.

CXL (Compute Express Link) – открытый стандарт межсоединения, позволяющий процессору напрямую обращаться к памяти и ускорителям с низкой задержкой. CXL поддерживается крупными производителями серверов и процессоров.

RISC‑V – открытая архитектура процессорных ядер, позволяющая компаниям разрабатывать кастомные решения без лицензий. На MX1 используется для создания небольших, энерго‑эффективных ядер, оптимизированных под обработку данных.

Astera Labs – американская компания, специализирующаяся на решениях для высокоскоростного соединения процессоров и памяти. Конкурирует с XCENA в области улучшения пропускной способности между CPU и DRAM.

Marvell Technology – крупный поставщик полупроводников, работающий над решениями для AI‑инфраструктуры, в том числе чипами с поддержкой CXL. Предлагает менее масштабный набор ядер по сравнению с MX1.

Если MX1 покажет заявленные результаты, это может изменить баланс сил в AI‑инфраструктуре: от дорогих GPU к более экономичным решениям, где ключевая работа происходит прямо в памяти.

Интересно почитать :

Мама‑инвестор: как Allison Stern собрала $10 млн для фонда, ориентированного на
женщин‑покупательниц
Мама‑инвестор: как Allison Stern собрала $10 млн для фонда, ориентированного на женщин‑покупательниц

Ключевые выводы Allison Stern привлекла $10 млн для первого фонда Mother Ventures, который инвестирует в продукты и сервисы для мам. Американские мамы совершают 85 % семейных покупок и управляют потребительским …

Как выбрать платформу для сборки мини-ПК: полный гайд 2026
Как выбрать платформу для сборки мини-ПК: полный гайд 2026

Кратко: Платформа для мини-ПК — это компактный корпус с материнской платой и блоком питания Выбор зависит от задач: базовый, средний или продвинутый уровень использования Ключевые критерии: процессор, форм-фактор, тип памяти, …

Подробное руководство по Streamlabs OBS — подготовка и запуск прямого эфира
Подробное руководство по Streamlabs OBS — подготовка и запуск прямого эфира

Кратко: Streamlabs OBS — это мощный инструмент для стриминга с множеством встроенных функций. Правильная настройка битрейта и разрешения обеспечивает стабильную трансляцию. Добавление сцен и виджетов делает ваш стрим более профессиональным. …

Glean — как «Google для предприятий» достиг $300 млн ARR и меняет правила игры в
корпоративном AI‑поиске
Glean — как «Google для предприятий» достиг $300 млн ARR и меняет правила игры в корпоративном AI‑поиске

Ключевые выводы Glean достиг $300 млн ежегодного повторяющегося дохода (ARR) — рост в 3 раза за 15 мес. Уникальный «контекстный граф» снижает расход AI‑токенов до 30‑40 % по сравнению с традиционными …

Арена: как студенческий проект стал главным бенчмарком ИИ-моделей
Арена: как студенческий проект стал главным бенчмарком ИИ-моделей

Ключевые выводы Арена - это дефакто публичный лидерборд для frontier LLM-моделей, созданный в UC Berkeley Платформа оценивает модели через прямые сравнения, а не статические тесты Структурная нейтральность означает, что Арена …

Ривьян и Uber объединяются для создания автономных роботакси: что это значит для
будущего транспорта
Ривьян и Uber объединяются для создания автономных роботакси: что это значит для будущего транспорта

Ключевые выводы Uber инвестирует $300 млн в Ривьян для создания автономных роботакси Партнерство предусматривает покупку 10 000 R2 роботакси с опцией на еще 40 000 Запуск сервиса запланирован на 2028 …

ФильтрИзбранноеМеню43750 ₽
Top