Memories.Ai: Как Визуальная Память Меняет Ии В Физическом Мире

TechLand 16 марта 2026 г. 20:30 96 Время чтения: 2 минут.

Memories.Ai: Как Визуальная Память Меняет Ии В Физическом Мире

Ключевые выводы
Почему ИИ нужна визуальная память
Технология за визуальной памятью
Партнерства и развитие
Сравнение с другими решениями памяти ИИ
Перспективы и будущее
Справка
Memories.ai
Shawn Shen
Ben Zhou
Nvidia
Qualcomm
LVMM (Large Visual Memory Model)

Ключевые выводы

Memories.ai создает инфраструктуру для визуальной памяти ИИ в физическом мире
Компания использует технологии Nvidia Cosmos-Reason 2 и Metropolis для обработки видео
LVMM (Large Visual Memory Model) может индексировать и извлекать визуальную информацию
Партнерство с Qualcomm позволит запускать технологию на процессорах для мобильных устройств
Рынок носимых устройств и робототехники станет основным направлением применения

Представьте, что ИИ не просто видит, но и помнит, что он видел. Это будущее, над которым работают в Memories.ai, создавая технологию, которая позволит ИИ-системам в физическом мире запоминать и вспоминать визуальные воспоминания.

Почему ИИ нужна визуальная память

Современный ИИ отлично справляется с задачами в цифровом пространстве, но когда дело доходит до физического мира, возникает фундаментальная проблема: ИИ не может запоминать то, что видит. Shawn Shen, соучредитель Memories.ai, считает, что это главное препятствие для развития носимых устройств и робототехники.

Идея возникла у Shen и его команды, когда они работали над ИИ-системой для умных очков Meta* Ray-Ban. "Мы задумались: а что, если человек не может вспомнить видео, которое записывает? Как он будет использовать эту технологию в реальной жизни?" — рассказывает Shen. Именно тогда они поняли, что никто не создает решения для визуальной памяти ИИ.

Вместо того чтобы ждать, пока кто-то другой решит эту проблему, Shen и его сооснователь Ben Zhou решили создать собственную компанию. Они покинули Meta* и запустили Memories.ai в 2024 году с миссией дать ИИ возможность запоминать и вспоминать визуальную информацию.

Технология за визуальной памятью

В основе технологии Memories.ai лежит LVMM (Large Visual Memory Model) — модель, которая может индексировать и извлекать визуальную информацию так же, как ChatGPT может работать с текстом. Но есть ключевое отличие: визуальная память намного сложнее, потому что видео данные неструктурированы и требуют специальной обработки.

Для решения этой задачи Memories.ai использует технологии Nvidia. В рамках сотрудничества с Nvidia компания применяет Cosmos-Reason 2 — модель рассуждений на основе зрения и языка, а также Metropolis — приложение для поиска и суммаризации видео. Эти инструменты позволяют эффективно обрабатывать большие объемы визуальных данных.

Данные для обучения модели Memories.ai собирает через специальное устройство LUCI, которое носят "сборщики данных". Это не коммерческий продукт, а инструмент для сбора обучающих данных. Shen объясняет, что они создали собственное устройство, потому что существующие видеорегистраторы не подходили для их задач — они слишком фокусировались на высоком качестве видео и быстрой разрядке батареи.

Партнерства и развитие

Memories.ai уже привлекла $16 миллионов инвестиций через два раунда финансирования. Компания работает над созданием инфраструктуры, которая позволит ИИ запоминать и вспоминать визуальную информацию.

В июле 2025 года Memories.ai выпустила второе поколение LVMM и подписала партнерство с Qualcomm. Это сотрудничество позволит запускать технологию на процессорах Qualcomm, что открывает путь для использования в мобильных устройствах и носимой электронике.

Компания также работает с крупными производителями носимых устройств, хотя Shen не раскрывает имена партнеров. Он подчеркивает, что сейчас фокус на создании модели и инфраструктуры, а рынок носимых устройств и робототехники придет позже.

Сравнение с другими решениями памяти ИИ

Хотя такие компании как OpenAI, xAI и Google добавили функции памяти в свои ИИ-системы, Memories.ai фокусируется именно на визуальной памяти. Текстовая память проще, потому что текст структурирован и легко индексируется. Визуальная память требует обработки неструктурированных данных и понимания контекста.

LVMM Memories.ai можно сравнить с более компактной версией Gemini Embedding 2, мультимодальной модели индексации и извлечения, выпущенной Google в этом месяце. Основное отличие в том, что Memories.ai создает специализированную инфраструктуру для визуальной памяти, а не просто добавляет функцию к существующему ИИ.

Перспективы и будущее

Shen видит огромный потенциал в носимых устройствах и робототехнике. "ИИ уже хорошо работает в цифровом мире. А что насчет физического мира?" — задается он вопросом. Ответ заключается в том, чтобы дать ИИ возможность запоминать и вспоминать то, что он видит.

Технология Memories.ai может найти применение в умных очках, камерах наблюдения, автономных роботах и других устройствах, которые взаимодействуют с окружающим миром через зрение. Главное преимущество — это возможность ИИ не просто реагировать на текущий момент, но и учитывать предыдущий опыт.

Мы верим, что в будущем ИИ должен иметь визуальные воспоминания. Это не просто функция — это фундаментальная возможность, которая позволит ИИ работать в физическом мире так же эффективно, как он работает в цифровом.

Справка

Memories.ai

Memories.ai — стартап, основанный в 2024 году, который создает инфраструктуру для визуальной памяти ИИ. Компания привлекла $16 млн инвестиций и разрабатывает LVMM (Large Visual Memory Model) для обработки видео данных. Штаб-квартира находится в Сан-Франциско.

Shawn Shen

Соучредитель и CEO Memories.ai. Ранее работал над ИИ-системой для умных очков Meta* Ray-Ban. Обладает опытом в области компьютерного зрения и машинного обучения. Имеет степень в области компьютерных наук.

Ben Zhou

Соучредитель и CTO Memories.ai. Работал вместе с Shen над ИИ-системой для Meta*. Специализируется на архитектуре ИИ и обработке видео данных.

Nvidia

Технологический гигант, производитель графических процессоров и ИИ-решений. Предоставляет инструменты Cosmos-Reason 2 и Metropolis для обработки видео данных. Штаб-квартира в Санта-Кларе, Калифорния.

Qualcomm

Производитель процессоров для мобильных устройств и носимой электроники. Сотрудничает с Memories.ai для интеграции технологии визуальной памяти в мобильные процессоры.

LVMM (Large Visual Memory Model)

Модель визуальной памяти, разработанная Memories.ai. Может индексировать и извлекать видео данные, позволяя ИИ запоминать и вспоминать визуальную информацию. Выпущена в июле 2025 года.

Визуальная память ИИ — это не просто технологический тренд, это фундаментальная возможность, которая может изменить то, как ИИ взаимодействует с физическим миром. Memories.ai делает первый шаг в этом направлении, создавая инфраструктуру, которая позволит ИИ запоминать и учиться на визуальном опыте.

Примечания:

* Meta признана экстремистской организацией и запрещена в РФ

Интересно почитать :

Alexa Podcasts — как Amazon превратил голосового помощника в генератор подкастов за считанные минуты

Ключевые выводы Amazon добавил в Alexa+ функцию «Alexa Podcasts», позволяющую создавать подкасты по запросу за несколько минут. Сервис использует ИИ‑генерацию голоса, а также партнерства с более чем 200 новостными источниками …

Нvidia вкладывает в юридический ИИ: как Legora выигрывает в битве с Harvey

Ключевые выводы NVentures вложила $50 млн в Legora, сделав её первой юридической инвестицией Nvidia. Legora достигла $100 млн ARR и оценка $5,6 млрд, но пока отстает от конкурента Harvey, оценённого …

120 горячих клавиш для Windows 10/11, которые ускорят работу за клавиатурой

Кратко: С клавишами Win, Ctrl, Alt и Shift можно выполнять более 120 действий без мыши. Один клик — это сразу несколько функций: открытие Проводника, переключение между рабочими столами, создание скриншота. …

Porsche Cayenne Coupe Electric: всё, что нужно знать о новом электромобиле премиум‑класса

Ключевые выводы Porsche Cayenne Coupe Electric поступит в продажу ближе к лету 2026 года в трёх версиях: базовой, S и Turbo. Базовая модель стартует от 113 800 $, S‑версия – 131 200 …

Как защитить смартфон от шпионского ПО: Lockdown Mode, Advanced Protection и строгие настройки WhatsApp

Ключевые выводы Шпионское ПО, вроде Graphite от Paragon Solutions, уже успешно заражает журналистов без их кликов. Apple Lockdown Mode, Google Advanced Protection и строгие настройки WhatsApp значительно снижают риск компрометации, …

Meta увольняет сотни сотрудников: сокращения при рекордных инвестициях в ИИ

Ключевые выводы Meta увольняет несколько сотен сотрудников в отделах продаж, рекрутинга и подразделении Reality Labs. Это вторые значительные сокращения в 2026 году после январского сокращения 10% штата Reality Labs. Компания …