Ключевые выводы
- XCENA разработала чип MX1, который размещает вычислительные ядра непосредственно в модуле DRAM, сокращая дорогостоящие походы данных между CPU, GPU и памятью.
- Компания привлекла $135 млн в раунде Series B, общая оценка $570 млн, а массовое производство запланировано к концу 2026 года.
- MX1 обещает заменить десятки серверов одним узлом, что особенно привлекательно для гиперскейлеров, тратящих десятки миллиардов на AI‑инфраструктуру.
Каждый запрос к ChatGPT заставляет данные прыгать от памяти к CPU, дальше к GPU и обратно. XCENA пытается остановить эту «гонку» и перенести часть работы прямо в память.
Проблема: почему текущая архитектура дорого обходится
Когда вы задаёте вопрос ChatGPT, запрос проходит несколько этапов: сначала выходит из оперативной памяти, попадает в CPU для предобработки, затем в GPU, где происходит тяжёлая математика, и возвращается обратно. И это происходит для каждого генерируемого слова.
Каждый такой «переход» требует энергии, времени и дорогостоящего железа. По сути, система тратит ресурсы не на саму модель, а на перемещение данных между процессорами и памятью.
Эта структура создаёт узкое место – дорогостоящие и энергозатратные чипы (CPU, GPU) вынуждены обслуживать каждое небольшое действие, хотя большая часть работы связана с простыми манипуляциями над данными.
Отсюда и растут расходы на облачные AI‑серверы, а также повышается нагрузка на электросети дата‑центров.
Решение XCENA: чип MX1 и концепция «вычисления у памяти»
XCENA (южнокорейско‑американский стартап) построила чип MX1, который ставит процессорные ядра прямо рядом с DRAM. Это достигается через интерфейс CXL (Compute Express Link) – быстрый «экспресс‑коридор» между процессором и модулем памяти.
Благодаря этому данные могут быть предобработаны, кешированы и даже храниться в KV‑кешах (контекст предыдущих запросов) непосредственно в памяти, без необходимости «выезжать» к CPU или GPU.
Внутри MX1 работают тысячи небольших ядер на базе RISC‑V, каждое из которых оптимизировано под задачи обработки данных, а не под тяжёлую математику. Именно эта вертикальная интеграция – собственный контроллер DRAM, шина межсоединений и иерархия памяти – отличает MX1 от конкурентов.
По заявлению компании, то, что раньше требовало 10 серверов, теперь может работать на одном узле.
Почему это важно для гиперскейлеров
Крупные облачные провайдеры ежегодно тратят десятки миллиардов долларов на AI‑инфраструктуру. Даже 1‑2 % экономии в потреблении памяти могут означать сотни миллионов долларов прибыли.
MX1 ориентирован именно на эти компании: ускорение предобработки, снижение нагрузки на CPU, экономия энергии и упрощение архитектуры дата‑центра.
Поскольку цены на память продолжают расти, а спрос на инференс растёт, переход к «memory‑centric» архитектурам выглядит логичным шагом.
В ближайшем будущем, когда модели станут ещё больше, такой подход может стать стандартом.
Конкуренты и отличия
На рынке уже работают Astera Labs и Marvell – обе компании предлагают решения по улучшению связи между процессорами и памятью. Marvell, будучи крупным игроком, использует несколько общих ядер, тогда как XCENA ставит ставку на «тысячи» специализированных ядер.
Кроме того, XCENA полностью контролирует стек: от микросхемы до контроллера DRAM, что даёт гибкость в настройке под конкретные нагрузки.
Такой уровень интеграции пока встречается редко и может стать конкурентным преимуществом, особенно если MX1 действительно покажет заявленные результаты.
Важно отметить, что MX1 пока находится в статусе прототипа; массовое производство стартует в конце 2026 года на фабриках Samsung, а первые доходы ожидаются в 2027 году.
Финансирование и планы роста
В марте 2024 года XCENA закрыла раунд Series B на $135 млн, возглавленный южнокорейскими венчурными фондами Altinum и IMM Investment, а также Corstone Asia и уже существующими инвесторами.
Оценка компании после раунда составила $570 млн, а общий объём привлеченных средств – $185 млн.
Помимо привлечения капитала, команда активно ведёт переговоры с мировыми поставщиками памяти, чтобы обеспечить масштабирование производства.
С учётом растущего спроса на решения, уменьшающие энергопотребление и стоимость инференса, инвесторы видят в MX1 потенциальный «ключевой слой» AI‑инфраструктуры.
В ближайшие годы XCENA планирует подписать первые крупные контракты с гиперскейлерами и расширить команду инженеров‑разработчиков.
Справка
XCENA – стартап, основанный в 2022 году в Пангё (Корея) и Саннивейле (США). Основатели – Джин Ким (CEO), Доун Ким (CTO) и Гарри Джухюн Ким (CPO), ранее работавшие в Samsung и SK Hynix. Компания разрабатывает чипы, которые помещают вычисления рядом с DRAM, чтобы уменьшить задержки и энергопотребление.
MX1 – первый прототип чипа от XCENA. Внутри него размещены тысячи ядер RISC‑V, собственный контроллер DRAM и шина CXL. Предназначен для ускорения инференса, предобработки данных и управления KV‑кешем.
CXL (Compute Express Link) – открытый стандарт межсоединения, позволяющий процессору напрямую обращаться к памяти и ускорителям с низкой задержкой. CXL поддерживается крупными производителями серверов и процессоров.
RISC‑V – открытая архитектура процессорных ядер, позволяющая компаниям разрабатывать кастомные решения без лицензий. На MX1 используется для создания небольших, энерго‑эффективных ядер, оптимизированных под обработку данных.
Astera Labs – американская компания, специализирующаяся на решениях для высокоскоростного соединения процессоров и памяти. Конкурирует с XCENA в области улучшения пропускной способности между CPU и DRAM.
Marvell Technology – крупный поставщик полупроводников, работающий над решениями для AI‑инфраструктуры, в том числе чипами с поддержкой CXL. Предлагает менее масштабный набор ядер по сравнению с MX1.
Если MX1 покажет заявленные результаты, это может изменить баланс сил в AI‑инфраструктуре: от дорогих GPU к более экономичным решениям, где ключевая работа происходит прямо в памяти.






