Memories.Ai: Как Визуальная Память Меняет Ии В Физическом Мире

Ключевые выводы

  • Memories.ai создает инфраструктуру для визуальной памяти ИИ в физическом мире
  • Компания использует технологии Nvidia Cosmos-Reason 2 и Metropolis для обработки видео
  • LVMM (Large Visual Memory Model) может индексировать и извлекать визуальную информацию
  • Партнерство с Qualcomm позволит запускать технологию на процессорах для мобильных устройств
  • Рынок носимых устройств и робототехники станет основным направлением применения
Представьте, что ИИ не просто видит, но и помнит, что он видел. Это будущее, над которым работают в Memories.ai, создавая технологию, которая позволит ИИ-системам в физическом мире запоминать и вспоминать визуальные воспоминания.

Почему ИИ нужна визуальная память

Современный ИИ отлично справляется с задачами в цифровом пространстве, но когда дело доходит до физического мира, возникает фундаментальная проблема: ИИ не может запоминать то, что видит. Shawn Shen, соучредитель Memories.ai, считает, что это главное препятствие для развития носимых устройств и робототехники.

Идея возникла у Shen и его команды, когда они работали над ИИ-системой для умных очков Meta* Ray-Ban. "Мы задумались: а что, если человек не может вспомнить видео, которое записывает? Как он будет использовать эту технологию в реальной жизни?" — рассказывает Shen. Именно тогда они поняли, что никто не создает решения для визуальной памяти ИИ.

Вместо того чтобы ждать, пока кто-то другой решит эту проблему, Shen и его сооснователь Ben Zhou решили создать собственную компанию. Они покинули Meta* и запустили Memories.ai в 2024 году с миссией дать ИИ возможность запоминать и вспоминать визуальную информацию.

Технология за визуальной памятью

В основе технологии Memories.ai лежит LVMM (Large Visual Memory Model) — модель, которая может индексировать и извлекать визуальную информацию так же, как ChatGPT может работать с текстом. Но есть ключевое отличие: визуальная память намного сложнее, потому что видео данные неструктурированы и требуют специальной обработки.

Для решения этой задачи Memories.ai использует технологии Nvidia. В рамках сотрудничества с Nvidia компания применяет Cosmos-Reason 2 — модель рассуждений на основе зрения и языка, а также Metropolis — приложение для поиска и суммаризации видео. Эти инструменты позволяют эффективно обрабатывать большие объемы визуальных данных.

Данные для обучения модели Memories.ai собирает через специальное устройство LUCI, которое носят "сборщики данных". Это не коммерческий продукт, а инструмент для сбора обучающих данных. Shen объясняет, что они создали собственное устройство, потому что существующие видеорегистраторы не подходили для их задач — они слишком фокусировались на высоком качестве видео и быстрой разрядке батареи.

Партнерства и развитие

Memories.ai уже привлекла $16 миллионов инвестиций через два раунда финансирования. Компания работает над созданием инфраструктуры, которая позволит ИИ запоминать и вспоминать визуальную информацию.

В июле 2025 года Memories.ai выпустила второе поколение LVMM и подписала партнерство с Qualcomm. Это сотрудничество позволит запускать технологию на процессорах Qualcomm, что открывает путь для использования в мобильных устройствах и носимой электронике.

Компания также работает с крупными производителями носимых устройств, хотя Shen не раскрывает имена партнеров. Он подчеркивает, что сейчас фокус на создании модели и инфраструктуры, а рынок носимых устройств и робототехники придет позже.

Сравнение с другими решениями памяти ИИ

Хотя такие компании как OpenAI, xAI и Google добавили функции памяти в свои ИИ-системы, Memories.ai фокусируется именно на визуальной памяти. Текстовая память проще, потому что текст структурирован и легко индексируется. Визуальная память требует обработки неструктурированных данных и понимания контекста.

LVMM Memories.ai можно сравнить с более компактной версией Gemini Embedding 2, мультимодальной модели индексации и извлечения, выпущенной Google в этом месяце. Основное отличие в том, что Memories.ai создает специализированную инфраструктуру для визуальной памяти, а не просто добавляет функцию к существующему ИИ.

Перспективы и будущее

Shen видит огромный потенциал в носимых устройствах и робототехнике. "ИИ уже хорошо работает в цифровом мире. А что насчет физического мира?" — задается он вопросом. Ответ заключается в том, чтобы дать ИИ возможность запоминать и вспоминать то, что он видит.

Технология Memories.ai может найти применение в умных очках, камерах наблюдения, автономных роботах и других устройствах, которые взаимодействуют с окружающим миром через зрение. Главное преимущество — это возможность ИИ не просто реагировать на текущий момент, но и учитывать предыдущий опыт.

Мы верим, что в будущем ИИ должен иметь визуальные воспоминания. Это не просто функция — это фундаментальная возможность, которая позволит ИИ работать в физическом мире так же эффективно, как он работает в цифровом.

Справка

Memories.ai

Memories.ai — стартап, основанный в 2024 году, который создает инфраструктуру для визуальной памяти ИИ. Компания привлекла $16 млн инвестиций и разрабатывает LVMM (Large Visual Memory Model) для обработки видео данных. Штаб-квартира находится в Сан-Франциско.

Shawn Shen

Соучредитель и CEO Memories.ai. Ранее работал над ИИ-системой для умных очков Meta* Ray-Ban. Обладает опытом в области компьютерного зрения и машинного обучения. Имеет степень в области компьютерных наук.

Ben Zhou

Соучредитель и CTO Memories.ai. Работал вместе с Shen над ИИ-системой для Meta*. Специализируется на архитектуре ИИ и обработке видео данных.

Nvidia

Технологический гигант, производитель графических процессоров и ИИ-решений. Предоставляет инструменты Cosmos-Reason 2 и Metropolis для обработки видео данных. Штаб-квартира в Санта-Кларе, Калифорния.

Qualcomm

Производитель процессоров для мобильных устройств и носимой электроники. Сотрудничает с Memories.ai для интеграции технологии визуальной памяти в мобильные процессоры.

LVMM (Large Visual Memory Model)

Модель визуальной памяти, разработанная Memories.ai. Может индексировать и извлекать видео данные, позволяя ИИ запоминать и вспоминать визуальную информацию. Выпущена в июле 2025 года.

Визуальная память ИИ — это не просто технологический тренд, это фундаментальная возможность, которая может изменить то, как ИИ взаимодействует с физическим миром. Memories.ai делает первый шаг в этом направлении, создавая инфраструктуру, которая позволит ИИ запоминать и учиться на визуальном опыте.

Примечания:

  • * Meta признана экстремистской организацией и запрещена в РФ

Интересно почитать :

AI‑ноутейкеры в медицине: как Kin Health меняет запись визитов к врачу и что это
значит для пациентов
AI‑ноутейкеры в медицине: как Kin Health меняет запись визитов к врачу и что это значит для пациентов

Ключевые выводы Рынок AI‑нотейтокеров в США превысил $600 млн в 2024 году, а стартап Kin Health привлек $9 млн в раунде seed. Приложение Kin Health бесплатно записывает разговоры с врачом, …

Fresha привлекла $80 млн от KKR: как платформа для красоты и здоровья стала
«единорогом»
Fresha привлекла $80 млн от KKR: как платформа для красоты и здоровья стала «единорогом»

Ключевые выводы Fresha привлекла $80 млн от фонда KKR Next Generation Technology Growth, что оценило компанию более чем в $1 млрд. Платформа обслуживает более 140 000 бизнесов в 120 странах …

Как защитить смартфон от шпионского ПО: Lockdown Mode, Advanced Protection и
строгие настройки WhatsApp
Как защитить смартфон от шпионского ПО: Lockdown Mode, Advanced Protection и строгие настройки WhatsApp

Ключевые выводы Шпионское ПО, вроде Graphite от Paragon Solutions, уже успешно заражает журналистов без их кликов. Apple Lockdown Mode, Google Advanced Protection и строгие настройки WhatsApp значительно снижают риск компрометации, …

Дизайн‑студия США расширяется: Джо Геббия привлек Питера Арнелла в качестве
первого главного архитектора бренда
Дизайн‑студия США расширяется: Джо Геббия привлек Питера Арнелла в качестве первого главного архитектора бренда

Ключевые выводы Соучредитель Airbnb Джо Геббия усиливает команду Национальной дизайн‑студии США, привлекая Питера Арнелла в роль первого U.S. Chief Brand Architect. Арнелл, известный работой с брендами Samsung, Pepsi и The …

Как выбрать корпус для ПК: полное руководство для новичков и геймеров
Как выбрать корпус для ПК: полное руководство для новичков и геймеров

Кратко: Форм-фактор определяет, какие компоненты можно установить Совместимость материнской платы, видеокарты и кулера — ключевой критерий Система охлаждения влияет на производительность и долговечность Цена и внешний вид — вопросы личных …

Mac от Apple превзошёл прогнозы: рост на 6 % благодаря AI‑нагрузкам и новому
MacBook Neo
Mac от Apple превзошёл прогнозы: рост на 6 % благодаря AI‑нагрузкам и новому MacBook Neo

Ключевые выводы Выручка Mac за 2‑й квартал 2026 г. составила $8,4 млрд – на 6 % больше, чем годом ранее, превзойдя прогнозы аналитиков. Рост объясняется запуском MacBook Neo и высоким …

ФильтрИзбранноеМеню43750 ₽
Top