Ключевые выводы
- Memories.ai создает инфраструктуру для визуальной памяти ИИ в физическом мире
- Компания использует технологии Nvidia Cosmos-Reason 2 и Metropolis для обработки видео
- LVMM (Large Visual Memory Model) может индексировать и извлекать визуальную информацию
- Партнерство с Qualcomm позволит запускать технологию на процессорах для мобильных устройств
- Рынок носимых устройств и робототехники станет основным направлением применения
Представьте, что ИИ не просто видит, но и помнит, что он видел. Это будущее, над которым работают в Memories.ai, создавая технологию, которая позволит ИИ-системам в физическом мире запоминать и вспоминать визуальные воспоминания.
Почему ИИ нужна визуальная память
Современный ИИ отлично справляется с задачами в цифровом пространстве, но когда дело доходит до физического мира, возникает фундаментальная проблема: ИИ не может запоминать то, что видит. Shawn Shen, соучредитель Memories.ai, считает, что это главное препятствие для развития носимых устройств и робототехники.
Идея возникла у Shen и его команды, когда они работали над ИИ-системой для умных очков Meta* Ray-Ban. "Мы задумались: а что, если человек не может вспомнить видео, которое записывает? Как он будет использовать эту технологию в реальной жизни?" — рассказывает Shen. Именно тогда они поняли, что никто не создает решения для визуальной памяти ИИ.
Вместо того чтобы ждать, пока кто-то другой решит эту проблему, Shen и его сооснователь Ben Zhou решили создать собственную компанию. Они покинули Meta* и запустили Memories.ai в 2024 году с миссией дать ИИ возможность запоминать и вспоминать визуальную информацию.
Технология за визуальной памятью
В основе технологии Memories.ai лежит LVMM (Large Visual Memory Model) — модель, которая может индексировать и извлекать визуальную информацию так же, как ChatGPT может работать с текстом. Но есть ключевое отличие: визуальная память намного сложнее, потому что видео данные неструктурированы и требуют специальной обработки.
Для решения этой задачи Memories.ai использует технологии Nvidia. В рамках сотрудничества с Nvidia компания применяет Cosmos-Reason 2 — модель рассуждений на основе зрения и языка, а также Metropolis — приложение для поиска и суммаризации видео. Эти инструменты позволяют эффективно обрабатывать большие объемы визуальных данных.
Данные для обучения модели Memories.ai собирает через специальное устройство LUCI, которое носят "сборщики данных". Это не коммерческий продукт, а инструмент для сбора обучающих данных. Shen объясняет, что они создали собственное устройство, потому что существующие видеорегистраторы не подходили для их задач — они слишком фокусировались на высоком качестве видео и быстрой разрядке батареи.
Партнерства и развитие
Memories.ai уже привлекла $16 миллионов инвестиций через два раунда финансирования. Компания работает над созданием инфраструктуры, которая позволит ИИ запоминать и вспоминать визуальную информацию.
В июле 2025 года Memories.ai выпустила второе поколение LVMM и подписала партнерство с Qualcomm. Это сотрудничество позволит запускать технологию на процессорах Qualcomm, что открывает путь для использования в мобильных устройствах и носимой электронике.
Компания также работает с крупными производителями носимых устройств, хотя Shen не раскрывает имена партнеров. Он подчеркивает, что сейчас фокус на создании модели и инфраструктуры, а рынок носимых устройств и робототехники придет позже.
Сравнение с другими решениями памяти ИИ
Хотя такие компании как OpenAI, xAI и Google добавили функции памяти в свои ИИ-системы, Memories.ai фокусируется именно на визуальной памяти. Текстовая память проще, потому что текст структурирован и легко индексируется. Визуальная память требует обработки неструктурированных данных и понимания контекста.
LVMM Memories.ai можно сравнить с более компактной версией Gemini Embedding 2, мультимодальной модели индексации и извлечения, выпущенной Google в этом месяце. Основное отличие в том, что Memories.ai создает специализированную инфраструктуру для визуальной памяти, а не просто добавляет функцию к существующему ИИ.
Перспективы и будущее
Shen видит огромный потенциал в носимых устройствах и робототехнике. "ИИ уже хорошо работает в цифровом мире. А что насчет физического мира?" — задается он вопросом. Ответ заключается в том, чтобы дать ИИ возможность запоминать и вспоминать то, что он видит.
Технология Memories.ai может найти применение в умных очках, камерах наблюдения, автономных роботах и других устройствах, которые взаимодействуют с окружающим миром через зрение. Главное преимущество — это возможность ИИ не просто реагировать на текущий момент, но и учитывать предыдущий опыт.
Мы верим, что в будущем ИИ должен иметь визуальные воспоминания. Это не просто функция — это фундаментальная возможность, которая позволит ИИ работать в физическом мире так же эффективно, как он работает в цифровом.
Справка
Memories.ai
Memories.ai — стартап, основанный в 2024 году, который создает инфраструктуру для визуальной памяти ИИ. Компания привлекла $16 млн инвестиций и разрабатывает LVMM (Large Visual Memory Model) для обработки видео данных. Штаб-квартира находится в Сан-Франциско.
Shawn Shen
Соучредитель и CEO Memories.ai. Ранее работал над ИИ-системой для умных очков Meta* Ray-Ban. Обладает опытом в области компьютерного зрения и машинного обучения. Имеет степень в области компьютерных наук.
Ben Zhou
Соучредитель и CTO Memories.ai. Работал вместе с Shen над ИИ-системой для Meta*. Специализируется на архитектуре ИИ и обработке видео данных.
Nvidia
Технологический гигант, производитель графических процессоров и ИИ-решений. Предоставляет инструменты Cosmos-Reason 2 и Metropolis для обработки видео данных. Штаб-квартира в Санта-Кларе, Калифорния.
Qualcomm
Производитель процессоров для мобильных устройств и носимой электроники. Сотрудничает с Memories.ai для интеграции технологии визуальной памяти в мобильные процессоры.
LVMM (Large Visual Memory Model)
Модель визуальной памяти, разработанная Memories.ai. Может индексировать и извлекать видео данные, позволяя ИИ запоминать и вспоминать визуальную информацию. Выпущена в июле 2025 года.
Визуальная память ИИ — это не просто технологический тренд, это фундаментальная возможность, которая может изменить то, как ИИ взаимодействует с физическим миром. Memories.ai делает первый шаг в этом направлении, создавая инфраструктуру, которая позволит ИИ запоминать и учиться на визуальном опыте.








