Xcena Бросает Вызов Дорогим Процессорам: Чип Mx1 Приближает Вычисления К Памяти И Снижает Затраты На Ии‑Инференс

Ключевые выводы

  • XCENA разработала чип MX1, который размещает вычислительные ядра непосредственно в модуле DRAM, сокращая дорогостоящие походы данных между CPU, GPU и памятью.
  • Компания привлекла $135 млн в раунде Series B, общая оценка $570 млн, а массовое производство запланировано к концу 2026 года.
  • MX1 обещает заменить десятки серверов одним узлом, что особенно привлекательно для гиперскейлеров, тратящих десятки миллиардов на AI‑инфраструктуру.
Каждый запрос к ChatGPT заставляет данные прыгать от памяти к CPU, дальше к GPU и обратно. XCENA пытается остановить эту «гонку» и перенести часть работы прямо в память.

Проблема: почему текущая архитектура дорого обходится

Когда вы задаёте вопрос ChatGPT, запрос проходит несколько этапов: сначала выходит из оперативной памяти, попадает в CPU для предобработки, затем в GPU, где происходит тяжёлая математика, и возвращается обратно. И это происходит для каждого генерируемого слова.

Каждый такой «переход» требует энергии, времени и дорогостоящего железа. По сути, система тратит ресурсы не на саму модель, а на перемещение данных между процессорами и памятью.

Эта структура создаёт узкое место – дорогостоящие и энергозатратные чипы (CPU, GPU) вынуждены обслуживать каждое небольшое действие, хотя большая часть работы связана с простыми манипуляциями над данными.

Отсюда и растут расходы на облачные AI‑серверы, а также повышается нагрузка на электросети дата‑центров.

Решение XCENA: чип MX1 и концепция «вычисления у памяти»

XCENA (южнокорейско‑американский стартап) построила чип MX1, который ставит процессорные ядра прямо рядом с DRAM. Это достигается через интерфейс CXL (Compute Express Link) – быстрый «экспресс‑коридор» между процессором и модулем памяти.

Благодаря этому данные могут быть предобработаны, кешированы и даже храниться в KV‑кешах (контекст предыдущих запросов) непосредственно в памяти, без необходимости «выезжать» к CPU или GPU.

Внутри MX1 работают тысячи небольших ядер на базе RISC‑V, каждое из которых оптимизировано под задачи обработки данных, а не под тяжёлую математику. Именно эта вертикальная интеграция – собственный контроллер DRAM, шина межсоединений и иерархия памяти – отличает MX1 от конкурентов.

По заявлению компании, то, что раньше требовало 10 серверов, теперь может работать на одном узле.

Почему это важно для гиперскейлеров

Крупные облачные провайдеры ежегодно тратят десятки миллиардов долларов на AI‑инфраструктуру. Даже 1‑2 % экономии в потреблении памяти могут означать сотни миллионов долларов прибыли.

MX1 ориентирован именно на эти компании: ускорение предобработки, снижение нагрузки на CPU, экономия энергии и упрощение архитектуры дата‑центра.

Поскольку цены на память продолжают расти, а спрос на инференс растёт, переход к «memory‑centric» архитектурам выглядит логичным шагом.

В ближайшем будущем, когда модели станут ещё больше, такой подход может стать стандартом.

Конкуренты и отличия

На рынке уже работают Astera Labs и Marvell – обе компании предлагают решения по улучшению связи между процессорами и памятью. Marvell, будучи крупным игроком, использует несколько общих ядер, тогда как XCENA ставит ставку на «тысячи» специализированных ядер.

Кроме того, XCENA полностью контролирует стек: от микросхемы до контроллера DRAM, что даёт гибкость в настройке под конкретные нагрузки.

Такой уровень интеграции пока встречается редко и может стать конкурентным преимуществом, особенно если MX1 действительно покажет заявленные результаты.

Важно отметить, что MX1 пока находится в статусе прототипа; массовое производство стартует в конце 2026 года на фабриках Samsung, а первые доходы ожидаются в 2027 году.

Финансирование и планы роста

В марте 2024 года XCENA закрыла раунд Series B на $135 млн, возглавленный южнокорейскими венчурными фондами Altinum и IMM Investment, а также Corstone Asia и уже существующими инвесторами.

Оценка компании после раунда составила $570 млн, а общий объём привлеченных средств – $185 млн.

Помимо привлечения капитала, команда активно ведёт переговоры с мировыми поставщиками памяти, чтобы обеспечить масштабирование производства.

С учётом растущего спроса на решения, уменьшающие энергопотребление и стоимость инференса, инвесторы видят в MX1 потенциальный «ключевой слой» AI‑инфраструктуры.

В ближайшие годы XCENA планирует подписать первые крупные контракты с гиперскейлерами и расширить команду инженеров‑разработчиков.

Справка

XCENA – стартап, основанный в 2022 году в Пангё (Корея) и Саннивейле (США). Основатели – Джин Ким (CEO), Доун Ким (CTO) и Гарри Джухюн Ким (CPO), ранее работавшие в Samsung и SK Hynix. Компания разрабатывает чипы, которые помещают вычисления рядом с DRAM, чтобы уменьшить задержки и энергопотребление.

MX1 – первый прототип чипа от XCENA. Внутри него размещены тысячи ядер RISC‑V, собственный контроллер DRAM и шина CXL. Предназначен для ускорения инференса, предобработки данных и управления KV‑кешем.

CXL (Compute Express Link) – открытый стандарт межсоединения, позволяющий процессору напрямую обращаться к памяти и ускорителям с низкой задержкой. CXL поддерживается крупными производителями серверов и процессоров.

RISC‑V – открытая архитектура процессорных ядер, позволяющая компаниям разрабатывать кастомные решения без лицензий. На MX1 используется для создания небольших, энерго‑эффективных ядер, оптимизированных под обработку данных.

Astera Labs – американская компания, специализирующаяся на решениях для высокоскоростного соединения процессоров и памяти. Конкурирует с XCENA в области улучшения пропускной способности между CPU и DRAM.

Marvell Technology – крупный поставщик полупроводников, работающий над решениями для AI‑инфраструктуры, в том числе чипами с поддержкой CXL. Предлагает менее масштабный набор ядер по сравнению с MX1.

Если MX1 покажет заявленные результаты, это может изменить баланс сил в AI‑инфраструктуре: от дорогих GPU к более экономичным решениям, где ключевая работа происходит прямо в памяти.

Интересно почитать :

Equal AI – голосовой помощник, который отвечает на звонки, объясняет их цель и
спасает от спама в Индии
Equal AI – голосовой помощник, который отвечает на звонки, объясняет их цель и спасает от спама в Индии

Ключевые выводы Equal AI — индийское приложение, которое принимает звонки, определяет их цель и передаёт её пользователю в виде текста и быстрых ответов. Приложение уже имеет более 1 млн активных пользователей …

Redwood Materials назначила Deepak Ahuja новым CFO: что это значит для рынка
аккумуляторов и энергохранилищ
Redwood Materials назначила Deepak Ahuja новым CFO: что это значит для рынка аккумуляторов и энергохранилищ

Ключевые выводы Redwood Materials назначила Deepak Ahuja, бывшего финансового директора Tesla, на пост CFO. Компания уже собрала более 2 млрд долларов, в том числе от Google, Nvidia и крупнейших фондов. …

Почему технологические гиганты бросаются в газовые электростанции: рост расходов
и альтернативные пути развития
Почему технологические гиганты бросаются в газовые электростанции: рост расходов и альтернативные пути развития

Ключевые выводы Стоимость строительства новых газовых электростанций в США поднялась на 66 % за два года, а сроки реализации удлинились на 23 %. Спрос на электроэнергию от дата‑центров может вырасти …

Смартфон не заряжается: 9 причин и что делать — пошаговая инструкция
Смартфон не заряжается: 9 причин и что делать — пошаговая инструкция

Если смартфон не заряжается, проблема может быть в зарядном устройстве, кабеле, порте, аккумуляторе или программном обеспечении. Начните диагностику с зарядного устройства и кабеля, затем проверьте порт и аккумулятор. В большинстве …

Как трекеры пикселей раскрывают личные данные заявителей медицинского
страхования в США
Как трекеры пикселей раскрывают личные данные заявителей медицинского страхования в США

Ключевые выводы Пиксель‑трекеры, установленные на государственных сайтах страховых бирж, передавали личные сведения заявителей крупным рекламным платформам. Среди передаваемых данных – ZIP‑коды, электронная почта, пол, раса, а иногда даже сведения о …

Чем отличается DJI Osmo Pocket 4 от DJI Osmo Pocket 3: подробный разбор
Чем отличается DJI Osmo Pocket 4 от DJI Osmo Pocket 3: подробный разбор

Кратко: Новая матрица 1” с‑пикселем и режим D‑Log вместо D‑Log M. Скорость слоумо в 4K выросла до 240 fps (ранее 120 fps). Батарея увеличилась до 1545 мАч → ≈ 240 …

ФильтрИзбранноеМеню43750 ₽
Top