Memories.Ai: Как Визуальная Память Меняет Ии В Физическом Мире

Ключевые выводы

  • Memories.ai создает инфраструктуру для визуальной памяти ИИ в физическом мире
  • Компания использует технологии Nvidia Cosmos-Reason 2 и Metropolis для обработки видео
  • LVMM (Large Visual Memory Model) может индексировать и извлекать визуальную информацию
  • Партнерство с Qualcomm позволит запускать технологию на процессорах для мобильных устройств
  • Рынок носимых устройств и робототехники станет основным направлением применения
Представьте, что ИИ не просто видит, но и помнит, что он видел. Это будущее, над которым работают в Memories.ai, создавая технологию, которая позволит ИИ-системам в физическом мире запоминать и вспоминать визуальные воспоминания.

Почему ИИ нужна визуальная память

Современный ИИ отлично справляется с задачами в цифровом пространстве, но когда дело доходит до физического мира, возникает фундаментальная проблема: ИИ не может запоминать то, что видит. Shawn Shen, соучредитель Memories.ai, считает, что это главное препятствие для развития носимых устройств и робототехники.

Идея возникла у Shen и его команды, когда они работали над ИИ-системой для умных очков Meta* Ray-Ban. "Мы задумались: а что, если человек не может вспомнить видео, которое записывает? Как он будет использовать эту технологию в реальной жизни?" — рассказывает Shen. Именно тогда они поняли, что никто не создает решения для визуальной памяти ИИ.

Вместо того чтобы ждать, пока кто-то другой решит эту проблему, Shen и его сооснователь Ben Zhou решили создать собственную компанию. Они покинули Meta* и запустили Memories.ai в 2024 году с миссией дать ИИ возможность запоминать и вспоминать визуальную информацию.

Технология за визуальной памятью

В основе технологии Memories.ai лежит LVMM (Large Visual Memory Model) — модель, которая может индексировать и извлекать визуальную информацию так же, как ChatGPT может работать с текстом. Но есть ключевое отличие: визуальная память намного сложнее, потому что видео данные неструктурированы и требуют специальной обработки.

Для решения этой задачи Memories.ai использует технологии Nvidia. В рамках сотрудничества с Nvidia компания применяет Cosmos-Reason 2 — модель рассуждений на основе зрения и языка, а также Metropolis — приложение для поиска и суммаризации видео. Эти инструменты позволяют эффективно обрабатывать большие объемы визуальных данных.

Данные для обучения модели Memories.ai собирает через специальное устройство LUCI, которое носят "сборщики данных". Это не коммерческий продукт, а инструмент для сбора обучающих данных. Shen объясняет, что они создали собственное устройство, потому что существующие видеорегистраторы не подходили для их задач — они слишком фокусировались на высоком качестве видео и быстрой разрядке батареи.

Партнерства и развитие

Memories.ai уже привлекла $16 миллионов инвестиций через два раунда финансирования. Компания работает над созданием инфраструктуры, которая позволит ИИ запоминать и вспоминать визуальную информацию.

В июле 2025 года Memories.ai выпустила второе поколение LVMM и подписала партнерство с Qualcomm. Это сотрудничество позволит запускать технологию на процессорах Qualcomm, что открывает путь для использования в мобильных устройствах и носимой электронике.

Компания также работает с крупными производителями носимых устройств, хотя Shen не раскрывает имена партнеров. Он подчеркивает, что сейчас фокус на создании модели и инфраструктуры, а рынок носимых устройств и робототехники придет позже.

Сравнение с другими решениями памяти ИИ

Хотя такие компании как OpenAI, xAI и Google добавили функции памяти в свои ИИ-системы, Memories.ai фокусируется именно на визуальной памяти. Текстовая память проще, потому что текст структурирован и легко индексируется. Визуальная память требует обработки неструктурированных данных и понимания контекста.

LVMM Memories.ai можно сравнить с более компактной версией Gemini Embedding 2, мультимодальной модели индексации и извлечения, выпущенной Google в этом месяце. Основное отличие в том, что Memories.ai создает специализированную инфраструктуру для визуальной памяти, а не просто добавляет функцию к существующему ИИ.

Перспективы и будущее

Shen видит огромный потенциал в носимых устройствах и робототехнике. "ИИ уже хорошо работает в цифровом мире. А что насчет физического мира?" — задается он вопросом. Ответ заключается в том, чтобы дать ИИ возможность запоминать и вспоминать то, что он видит.

Технология Memories.ai может найти применение в умных очках, камерах наблюдения, автономных роботах и других устройствах, которые взаимодействуют с окружающим миром через зрение. Главное преимущество — это возможность ИИ не просто реагировать на текущий момент, но и учитывать предыдущий опыт.

Мы верим, что в будущем ИИ должен иметь визуальные воспоминания. Это не просто функция — это фундаментальная возможность, которая позволит ИИ работать в физическом мире так же эффективно, как он работает в цифровом.

Справка

Memories.ai

Memories.ai — стартап, основанный в 2024 году, который создает инфраструктуру для визуальной памяти ИИ. Компания привлекла $16 млн инвестиций и разрабатывает LVMM (Large Visual Memory Model) для обработки видео данных. Штаб-квартира находится в Сан-Франциско.

Shawn Shen

Соучредитель и CEO Memories.ai. Ранее работал над ИИ-системой для умных очков Meta* Ray-Ban. Обладает опытом в области компьютерного зрения и машинного обучения. Имеет степень в области компьютерных наук.

Ben Zhou

Соучредитель и CTO Memories.ai. Работал вместе с Shen над ИИ-системой для Meta*. Специализируется на архитектуре ИИ и обработке видео данных.

Nvidia

Технологический гигант, производитель графических процессоров и ИИ-решений. Предоставляет инструменты Cosmos-Reason 2 и Metropolis для обработки видео данных. Штаб-квартира в Санта-Кларе, Калифорния.

Qualcomm

Производитель процессоров для мобильных устройств и носимой электроники. Сотрудничает с Memories.ai для интеграции технологии визуальной памяти в мобильные процессоры.

LVMM (Large Visual Memory Model)

Модель визуальной памяти, разработанная Memories.ai. Может индексировать и извлекать видео данные, позволяя ИИ запоминать и вспоминать визуальную информацию. Выпущена в июле 2025 года.

Визуальная память ИИ — это не просто технологический тренд, это фундаментальная возможность, которая может изменить то, как ИИ взаимодействует с физическим миром. Memories.ai делает первый шаг в этом направлении, создавая инфраструктуру, которая позволит ИИ запоминать и учиться на визуальном опыте.

Примечания:

  • * Meta признана экстремистской организацией и запрещена в РФ

Интересно почитать :

Netflix завоевывает Оскар: "Франкенштейн" и "Охотники за демонами К-поп"
становятся триумфаторами
Netflix завоевывает Оскар: "Франкенштейн" и "Охотники за демонами К-поп" становятся триумфаторами

Ключевые выводы Фильм Гильермо дель Торо "Франкенштейн" получил три Оскара в категориях художественное оформление, костюмы и грим Анимационный фильм "Охотники за демонами К-поп" стал самым популярным фильмом Netflix и выиграл …

Apple вводит новые подписки с годовыми обязательствами и сниженными ценами
Apple вводит новые подписки с годовыми обязательствами и сниженными ценами

Ключевые выводы Apple добавила в App Store возможность предлагать годовые подписки с ежемесячными платежами, что позволяет снижать цену за счёт долгосрочного обязательства. Новинка пока недоступна в США и Сингапуре из‑за …

Spotify вводит значок «Verified by Spotify»: как отличить настоящих музыкантов
от AI‑проектов
Spotify вводит значок «Verified by Spotify»: как отличить настоящих музыкантов от AI‑проектов

Ключевые выводы Spotify добавил значок «Verified by Spotify», чтобы выделять настоящих людей‑артистов среди растущего потока AI‑генерированных треков. Для получения бейджа исполнителю нужно иметь онлайн‑присутствие (концерты, мерч, соцсети) и стабильный интерес …

Искусственный интеллект под вопросом: почему чат-бот Grok опасен для детей и
подростков
Искусственный интеллект под вопросом: почему чат-бот Grok опасен для детей и подростков

Новый отчёт организации Common Sense Media встряхнул мир искусственного интеллекта. Оказалось, что чат-бот Grok от компании xAI генерирует опасный контент для несовершеннолетних, несмотря на заявленные меры защиты. Мы разобрались, почему …

Почему технологические гиганты бросаются в газовые электростанции: рост расходов
и альтернативные пути развития
Почему технологические гиганты бросаются в газовые электростанции: рост расходов и альтернативные пути развития

Ключевые выводы Стоимость строительства новых газовых электростанций в США поднялась на 66 % за два года, а сроки реализации удлинились на 23 %. Спрос на электроэнергию от дата‑центров может вырасти …

Как найм "носителей страсти" помог стартапу Bland вырасти в 10 раз быстрее
рынка. Неочевидные таланты и жесткая культура
Как найм "носителей страсти" помог стартапу Bland вырасти в 10 раз быстрее рынка. Неочевидные таланты и жесткая культура

Ключевые выводы Диплом не имеет значения. Основатель Bland искал в первую очередь "носителей страсти" — людей, одержимых своим делом, даже если их прошлое не вписывалось в стандартное резюме IT-специалиста. Глубокие …

ФильтрИзбранноеМеню43750 ₽
Top