Memories.Ai: Как Визуальная Память Меняет Ии В Физическом Мире

TechLand 16 марта 2026 г. 20:30 26 Время чтения: 2 минут.

Memories.Ai: Как Визуальная Память Меняет Ии В Физическом Мире

Ключевые выводы
Почему ИИ нужна визуальная память
Технология за визуальной памятью
Партнерства и развитие
Сравнение с другими решениями памяти ИИ
Перспективы и будущее
Справка
Memories.ai
Shawn Shen
Ben Zhou
Nvidia
Qualcomm
LVMM (Large Visual Memory Model)

Ключевые выводы

Memories.ai создает инфраструктуру для визуальной памяти ИИ в физическом мире
Компания использует технологии Nvidia Cosmos-Reason 2 и Metropolis для обработки видео
LVMM (Large Visual Memory Model) может индексировать и извлекать визуальную информацию
Партнерство с Qualcomm позволит запускать технологию на процессорах для мобильных устройств
Рынок носимых устройств и робототехники станет основным направлением применения

Представьте, что ИИ не просто видит, но и помнит, что он видел. Это будущее, над которым работают в Memories.ai, создавая технологию, которая позволит ИИ-системам в физическом мире запоминать и вспоминать визуальные воспоминания.

Почему ИИ нужна визуальная память

Современный ИИ отлично справляется с задачами в цифровом пространстве, но когда дело доходит до физического мира, возникает фундаментальная проблема: ИИ не может запоминать то, что видит. Shawn Shen, соучредитель Memories.ai, считает, что это главное препятствие для развития носимых устройств и робототехники.

Идея возникла у Shen и его команды, когда они работали над ИИ-системой для умных очков Meta* Ray-Ban. "Мы задумались: а что, если человек не может вспомнить видео, которое записывает? Как он будет использовать эту технологию в реальной жизни?" — рассказывает Shen. Именно тогда они поняли, что никто не создает решения для визуальной памяти ИИ.

Вместо того чтобы ждать, пока кто-то другой решит эту проблему, Shen и его сооснователь Ben Zhou решили создать собственную компанию. Они покинули Meta* и запустили Memories.ai в 2024 году с миссией дать ИИ возможность запоминать и вспоминать визуальную информацию.

Технология за визуальной памятью

В основе технологии Memories.ai лежит LVMM (Large Visual Memory Model) — модель, которая может индексировать и извлекать визуальную информацию так же, как ChatGPT может работать с текстом. Но есть ключевое отличие: визуальная память намного сложнее, потому что видео данные неструктурированы и требуют специальной обработки.

Для решения этой задачи Memories.ai использует технологии Nvidia. В рамках сотрудничества с Nvidia компания применяет Cosmos-Reason 2 — модель рассуждений на основе зрения и языка, а также Metropolis — приложение для поиска и суммаризации видео. Эти инструменты позволяют эффективно обрабатывать большие объемы визуальных данных.

Данные для обучения модели Memories.ai собирает через специальное устройство LUCI, которое носят "сборщики данных". Это не коммерческий продукт, а инструмент для сбора обучающих данных. Shen объясняет, что они создали собственное устройство, потому что существующие видеорегистраторы не подходили для их задач — они слишком фокусировались на высоком качестве видео и быстрой разрядке батареи.

Партнерства и развитие

Memories.ai уже привлекла $16 миллионов инвестиций через два раунда финансирования. Компания работает над созданием инфраструктуры, которая позволит ИИ запоминать и вспоминать визуальную информацию.

В июле 2025 года Memories.ai выпустила второе поколение LVMM и подписала партнерство с Qualcomm. Это сотрудничество позволит запускать технологию на процессорах Qualcomm, что открывает путь для использования в мобильных устройствах и носимой электронике.

Компания также работает с крупными производителями носимых устройств, хотя Shen не раскрывает имена партнеров. Он подчеркивает, что сейчас фокус на создании модели и инфраструктуры, а рынок носимых устройств и робототехники придет позже.

Сравнение с другими решениями памяти ИИ

Хотя такие компании как OpenAI, xAI и Google добавили функции памяти в свои ИИ-системы, Memories.ai фокусируется именно на визуальной памяти. Текстовая память проще, потому что текст структурирован и легко индексируется. Визуальная память требует обработки неструктурированных данных и понимания контекста.

LVMM Memories.ai можно сравнить с более компактной версией Gemini Embedding 2, мультимодальной модели индексации и извлечения, выпущенной Google в этом месяце. Основное отличие в том, что Memories.ai создает специализированную инфраструктуру для визуальной памяти, а не просто добавляет функцию к существующему ИИ.

Перспективы и будущее

Shen видит огромный потенциал в носимых устройствах и робототехнике. "ИИ уже хорошо работает в цифровом мире. А что насчет физического мира?" — задается он вопросом. Ответ заключается в том, чтобы дать ИИ возможность запоминать и вспоминать то, что он видит.

Технология Memories.ai может найти применение в умных очках, камерах наблюдения, автономных роботах и других устройствах, которые взаимодействуют с окружающим миром через зрение. Главное преимущество — это возможность ИИ не просто реагировать на текущий момент, но и учитывать предыдущий опыт.

Мы верим, что в будущем ИИ должен иметь визуальные воспоминания. Это не просто функция — это фундаментальная возможность, которая позволит ИИ работать в физическом мире так же эффективно, как он работает в цифровом.

Справка

Memories.ai

Memories.ai — стартап, основанный в 2024 году, который создает инфраструктуру для визуальной памяти ИИ. Компания привлекла $16 млн инвестиций и разрабатывает LVMM (Large Visual Memory Model) для обработки видео данных. Штаб-квартира находится в Сан-Франциско.

Shawn Shen

Соучредитель и CEO Memories.ai. Ранее работал над ИИ-системой для умных очков Meta* Ray-Ban. Обладает опытом в области компьютерного зрения и машинного обучения. Имеет степень в области компьютерных наук.

Ben Zhou

Соучредитель и CTO Memories.ai. Работал вместе с Shen над ИИ-системой для Meta*. Специализируется на архитектуре ИИ и обработке видео данных.

Nvidia

Технологический гигант, производитель графических процессоров и ИИ-решений. Предоставляет инструменты Cosmos-Reason 2 и Metropolis для обработки видео данных. Штаб-квартира в Санта-Кларе, Калифорния.

Qualcomm

Производитель процессоров для мобильных устройств и носимой электроники. Сотрудничает с Memories.ai для интеграции технологии визуальной памяти в мобильные процессоры.

LVMM (Large Visual Memory Model)

Модель визуальной памяти, разработанная Memories.ai. Может индексировать и извлекать видео данные, позволяя ИИ запоминать и вспоминать визуальную информацию. Выпущена в июле 2025 года.

Визуальная память ИИ — это не просто технологический тренд, это фундаментальная возможность, которая может изменить то, как ИИ взаимодействует с физическим миром. Memories.ai делает первый шаг в этом направлении, создавая инфраструктуру, которая позволит ИИ запоминать и учиться на визуальном опыте.

Примечания:

* Meta признана экстремистской организацией и запрещена в РФ

Интересно почитать :

Как выбрать витую пару для домашней сети: полное руководство 2026

Кратко: Для домашней сети до 100 Мбит/с подойдет 2-х парный кабель категории 5е Для будущего развития сети выбирайте 4-х парный кабель категории 6 Экранированные кабели (FTP/SFTP) в домашних условиях не …

Сбой работы TikTok в США: техническая неполадка или политическое вмешательство?

Пока метель накрывала США, миллионы пользователей TikTok столкнулись с необъяснимыми сбоями в работе приложения. Совпадение по времени с запуском новой структуры американского TikTok и политической нестабильностью в стране породило волну …

Webflow приобретает Vidoso для создания AI-контента: как это изменит маркетинг

Ключевые выводы Webflow приобретает AI-платформу Vidoso для усиления своих маркетинговых возможностей Vidoso использует большие языковые модели для создания маркетинговых материалов: изображений, презентаций, видео, блогов и постов в соцсетях Приобретение позволит …

Patreon против Apple: новый дедлайн для перехода на подписки и скрытый конфликт за будущее монетизации

Свежий виток противостояния между платформой для авторов и «яблочным» гигантом. Apple перенесла срок перехода Patreon на новую систему оплат внутри приложений — теперь у создателей есть два года на миграцию. …

Финтех-компания Marquis требует компенсацию от провайдера брандмауэра после масштабной утечки данных клиентов

Когда компания, отвечающая за безопасность банковских данных, становится жертвой хакеров, вопросы начинают задавать всем. Именно это сейчас происходит с финтех-гигантом Marquis, который публично обвинил своего поставщика защитных решений SonicWall в …

TikTok вернул пользователей после кризиса: как изменился рынок коротких видео

Ключевые выводы TikTok восстановил более 90 млн ежедневных пользователей после временного падения Приложения-конкуренты смогли привлечь лишь малую часть аудитории Основные причины кризиса — опасения пользователей об изменении политики приватности Технические …