Xcena Бросает Вызов Дорогим Процессорам: Чип Mx1 Приближает Вычисления К Памяти И Снижает Затраты На Ии‑Инференс

TechLand 29 мая 2026 г. 12:00 60 Время чтения: 1 минут.

Xcena Бросает Вызов Дорогим Процессорам: Чип Mx1 Приближает Вычисления К Памяти
И Снижает Затраты На Ии‑Инференс

Ключевые выводы
Проблема: почему текущая архитектура дорого обходится
Решение XCENA: чип MX1 и концепция «вычисления у памяти»
Почему это важно для гиперскейлеров
Конкуренты и отличия
Финансирование и планы роста
Справка

Ключевые выводы

XCENA разработала чип MX1, который размещает вычислительные ядра непосредственно в модуле DRAM, сокращая дорогостоящие походы данных между CPU, GPU и памятью.
Компания привлекла $135 млн в раунде Series B, общая оценка $570 млн, а массовое производство запланировано к концу 2026 года.
MX1 обещает заменить десятки серверов одним узлом, что особенно привлекательно для гиперскейлеров, тратящих десятки миллиардов на AI‑инфраструктуру.

Каждый запрос к ChatGPT заставляет данные прыгать от памяти к CPU, дальше к GPU и обратно. XCENA пытается остановить эту «гонку» и перенести часть работы прямо в память.

Проблема: почему текущая архитектура дорого обходится

Когда вы задаёте вопрос ChatGPT, запрос проходит несколько этапов: сначала выходит из оперативной памяти, попадает в CPU для предобработки, затем в GPU, где происходит тяжёлая математика, и возвращается обратно. И это происходит для каждого генерируемого слова.

Каждый такой «переход» требует энергии, времени и дорогостоящего железа. По сути, система тратит ресурсы не на саму модель, а на перемещение данных между процессорами и памятью.

Эта структура создаёт узкое место – дорогостоящие и энергозатратные чипы (CPU, GPU) вынуждены обслуживать каждое небольшое действие, хотя большая часть работы связана с простыми манипуляциями над данными.

Отсюда и растут расходы на облачные AI‑серверы, а также повышается нагрузка на электросети дата‑центров.

Решение XCENA: чип MX1 и концепция «вычисления у памяти»

XCENA (южнокорейско‑американский стартап) построила чип MX1, который ставит процессорные ядра прямо рядом с DRAM. Это достигается через интерфейс CXL (Compute Express Link) – быстрый «экспресс‑коридор» между процессором и модулем памяти.

Благодаря этому данные могут быть предобработаны, кешированы и даже храниться в KV‑кешах (контекст предыдущих запросов) непосредственно в памяти, без необходимости «выезжать» к CPU или GPU.

Внутри MX1 работают тысячи небольших ядер на базе RISC‑V, каждое из которых оптимизировано под задачи обработки данных, а не под тяжёлую математику. Именно эта вертикальная интеграция – собственный контроллер DRAM, шина межсоединений и иерархия памяти – отличает MX1 от конкурентов.

По заявлению компании, то, что раньше требовало 10 серверов, теперь может работать на одном узле.

Почему это важно для гиперскейлеров

Крупные облачные провайдеры ежегодно тратят десятки миллиардов долларов на AI‑инфраструктуру. Даже 1‑2 % экономии в потреблении памяти могут означать сотни миллионов долларов прибыли.

MX1 ориентирован именно на эти компании: ускорение предобработки, снижение нагрузки на CPU, экономия энергии и упрощение архитектуры дата‑центра.

Поскольку цены на память продолжают расти, а спрос на инференс растёт, переход к «memory‑centric» архитектурам выглядит логичным шагом.

В ближайшем будущем, когда модели станут ещё больше, такой подход может стать стандартом.

Конкуренты и отличия

На рынке уже работают Astera Labs и Marvell – обе компании предлагают решения по улучшению связи между процессорами и памятью. Marvell, будучи крупным игроком, использует несколько общих ядер, тогда как XCENA ставит ставку на «тысячи» специализированных ядер.

Кроме того, XCENA полностью контролирует стек: от микросхемы до контроллера DRAM, что даёт гибкость в настройке под конкретные нагрузки.

Такой уровень интеграции пока встречается редко и может стать конкурентным преимуществом, особенно если MX1 действительно покажет заявленные результаты.

Важно отметить, что MX1 пока находится в статусе прототипа; массовое производство стартует в конце 2026 года на фабриках Samsung, а первые доходы ожидаются в 2027 году.

Финансирование и планы роста

В марте 2024 года XCENA закрыла раунд Series B на $135 млн, возглавленный южнокорейскими венчурными фондами Altinum и IMM Investment, а также Corstone Asia и уже существующими инвесторами.

Оценка компании после раунда составила $570 млн, а общий объём привлеченных средств – $185 млн.

Помимо привлечения капитала, команда активно ведёт переговоры с мировыми поставщиками памяти, чтобы обеспечить масштабирование производства.

С учётом растущего спроса на решения, уменьшающие энергопотребление и стоимость инференса, инвесторы видят в MX1 потенциальный «ключевой слой» AI‑инфраструктуры.

В ближайшие годы XCENA планирует подписать первые крупные контракты с гиперскейлерами и расширить команду инженеров‑разработчиков.

Справка

XCENA – стартап, основанный в 2022 году в Пангё (Корея) и Саннивейле (США). Основатели – Джин Ким (CEO), Доун Ким (CTO) и Гарри Джухюн Ким (CPO), ранее работавшие в Samsung и SK Hynix. Компания разрабатывает чипы, которые помещают вычисления рядом с DRAM, чтобы уменьшить задержки и энергопотребление.

MX1 – первый прототип чипа от XCENA. Внутри него размещены тысячи ядер RISC‑V, собственный контроллер DRAM и шина CXL. Предназначен для ускорения инференса, предобработки данных и управления KV‑кешем.

CXL (Compute Express Link) – открытый стандарт межсоединения, позволяющий процессору напрямую обращаться к памяти и ускорителям с низкой задержкой. CXL поддерживается крупными производителями серверов и процессоров.

RISC‑V – открытая архитектура процессорных ядер, позволяющая компаниям разрабатывать кастомные решения без лицензий. На MX1 используется для создания небольших, энерго‑эффективных ядер, оптимизированных под обработку данных.

Astera Labs – американская компания, специализирующаяся на решениях для высокоскоростного соединения процессоров и памяти. Конкурирует с XCENA в области улучшения пропускной способности между CPU и DRAM.

Marvell Technology – крупный поставщик полупроводников, работающий над решениями для AI‑инфраструктуры, в том числе чипами с поддержкой CXL. Предлагает менее масштабный набор ядер по сравнению с MX1.

Если MX1 покажет заявленные результаты, это может изменить баланс сил в AI‑инфраструктуре: от дорогих GPU к более экономичным решениям, где ключевая работа происходит прямо в памяти.

Интересно почитать :

Тесла планирует увеличить капитальные затраты до $25 млрд в 2026 г.: что значит переход к ИИ и робототехнике

Ключевые выводы Тесла планирует потратить $25 млрд на капитальные вложения в 2026 году – почти в три раза больше, чем в предыдущие годы. Большая часть бюджета направлена на развитие ИИ, …

Чем отличаются Apple Intelligence, Galaxy AI и Google AI: сравниваем архитектуру, функции и интеграцию

Кратко: Apple Intelligence использует гибридную архитектуру с приоритетом локальной обработки Galaxy AI делает акцент на коммуникационных функциях и мультимедиа Google AI предлагает универсальный ассистент Gemini с широкой интеграцией в сервисы …

Возможности и особенности оболочки OriginOS 6: полный обзор интерфейса Vivo

Кратко: OriginOS 6 — молодая оболочка Vivo с обширными возможностями кастомизации Поддерживает динамические виджеты, темы, кинетические обои и умные анимации Фирменные функции: iManager, V-Appstore, EasyShare, Vivo DocMaster, Комплект Офис ИИ-инструменты …

AI‑нотатки без экрана: как Plaud завоёвывает рынок встреч

Ключевые выводы Plaud продала более 2 млн устройств и достигла $100 млн годового дохода от подписок. Устройства работают без экрана, записывают звук и создают краткие резюме встреч. Половина пользователей переходит …

Как Андрей Янг переосмысливает бизнес‑модель: от возврата денег к новой волне стартапов

Ключевые выводы Андрей Янг считает, что будущие стартапы должны возвращать часть прибыли клиентам, а не только забирать её. Проекты — Noble Mobile, Cost Plus Drugs, Light Phone и Misfits Markets …

Что такое DNS и зачем его менять: объясняем на пальцах

Кратко: DNS — это телефонная книга интернета, переводящая доменное имя в IP‑адрес. Смена DNS приводит к ускорению загрузки, шифрованию запросов и блокировке нежелательной рекламы. Для разных целей (скорость, безопасность, родительский …