Memories.Ai: Как Визуальная Память Меняет Ии В Физическом Мире

Ключевые выводы

  • Memories.ai создает инфраструктуру для визуальной памяти ИИ в физическом мире
  • Компания использует технологии Nvidia Cosmos-Reason 2 и Metropolis для обработки видео
  • LVMM (Large Visual Memory Model) может индексировать и извлекать визуальную информацию
  • Партнерство с Qualcomm позволит запускать технологию на процессорах для мобильных устройств
  • Рынок носимых устройств и робототехники станет основным направлением применения
Представьте, что ИИ не просто видит, но и помнит, что он видел. Это будущее, над которым работают в Memories.ai, создавая технологию, которая позволит ИИ-системам в физическом мире запоминать и вспоминать визуальные воспоминания.

Почему ИИ нужна визуальная память

Современный ИИ отлично справляется с задачами в цифровом пространстве, но когда дело доходит до физического мира, возникает фундаментальная проблема: ИИ не может запоминать то, что видит. Shawn Shen, соучредитель Memories.ai, считает, что это главное препятствие для развития носимых устройств и робототехники.

Идея возникла у Shen и его команды, когда они работали над ИИ-системой для умных очков Meta* Ray-Ban. "Мы задумались: а что, если человек не может вспомнить видео, которое записывает? Как он будет использовать эту технологию в реальной жизни?" — рассказывает Shen. Именно тогда они поняли, что никто не создает решения для визуальной памяти ИИ.

Вместо того чтобы ждать, пока кто-то другой решит эту проблему, Shen и его сооснователь Ben Zhou решили создать собственную компанию. Они покинули Meta* и запустили Memories.ai в 2024 году с миссией дать ИИ возможность запоминать и вспоминать визуальную информацию.

Технология за визуальной памятью

В основе технологии Memories.ai лежит LVMM (Large Visual Memory Model) — модель, которая может индексировать и извлекать визуальную информацию так же, как ChatGPT может работать с текстом. Но есть ключевое отличие: визуальная память намного сложнее, потому что видео данные неструктурированы и требуют специальной обработки.

Для решения этой задачи Memories.ai использует технологии Nvidia. В рамках сотрудничества с Nvidia компания применяет Cosmos-Reason 2 — модель рассуждений на основе зрения и языка, а также Metropolis — приложение для поиска и суммаризации видео. Эти инструменты позволяют эффективно обрабатывать большие объемы визуальных данных.

Данные для обучения модели Memories.ai собирает через специальное устройство LUCI, которое носят "сборщики данных". Это не коммерческий продукт, а инструмент для сбора обучающих данных. Shen объясняет, что они создали собственное устройство, потому что существующие видеорегистраторы не подходили для их задач — они слишком фокусировались на высоком качестве видео и быстрой разрядке батареи.

Партнерства и развитие

Memories.ai уже привлекла $16 миллионов инвестиций через два раунда финансирования. Компания работает над созданием инфраструктуры, которая позволит ИИ запоминать и вспоминать визуальную информацию.

В июле 2025 года Memories.ai выпустила второе поколение LVMM и подписала партнерство с Qualcomm. Это сотрудничество позволит запускать технологию на процессорах Qualcomm, что открывает путь для использования в мобильных устройствах и носимой электронике.

Компания также работает с крупными производителями носимых устройств, хотя Shen не раскрывает имена партнеров. Он подчеркивает, что сейчас фокус на создании модели и инфраструктуры, а рынок носимых устройств и робототехники придет позже.

Сравнение с другими решениями памяти ИИ

Хотя такие компании как OpenAI, xAI и Google добавили функции памяти в свои ИИ-системы, Memories.ai фокусируется именно на визуальной памяти. Текстовая память проще, потому что текст структурирован и легко индексируется. Визуальная память требует обработки неструктурированных данных и понимания контекста.

LVMM Memories.ai можно сравнить с более компактной версией Gemini Embedding 2, мультимодальной модели индексации и извлечения, выпущенной Google в этом месяце. Основное отличие в том, что Memories.ai создает специализированную инфраструктуру для визуальной памяти, а не просто добавляет функцию к существующему ИИ.

Перспективы и будущее

Shen видит огромный потенциал в носимых устройствах и робототехнике. "ИИ уже хорошо работает в цифровом мире. А что насчет физического мира?" — задается он вопросом. Ответ заключается в том, чтобы дать ИИ возможность запоминать и вспоминать то, что он видит.

Технология Memories.ai может найти применение в умных очках, камерах наблюдения, автономных роботах и других устройствах, которые взаимодействуют с окружающим миром через зрение. Главное преимущество — это возможность ИИ не просто реагировать на текущий момент, но и учитывать предыдущий опыт.

Мы верим, что в будущем ИИ должен иметь визуальные воспоминания. Это не просто функция — это фундаментальная возможность, которая позволит ИИ работать в физическом мире так же эффективно, как он работает в цифровом.

Справка

Memories.ai

Memories.ai — стартап, основанный в 2024 году, который создает инфраструктуру для визуальной памяти ИИ. Компания привлекла $16 млн инвестиций и разрабатывает LVMM (Large Visual Memory Model) для обработки видео данных. Штаб-квартира находится в Сан-Франциско.

Shawn Shen

Соучредитель и CEO Memories.ai. Ранее работал над ИИ-системой для умных очков Meta* Ray-Ban. Обладает опытом в области компьютерного зрения и машинного обучения. Имеет степень в области компьютерных наук.

Ben Zhou

Соучредитель и CTO Memories.ai. Работал вместе с Shen над ИИ-системой для Meta*. Специализируется на архитектуре ИИ и обработке видео данных.

Nvidia

Технологический гигант, производитель графических процессоров и ИИ-решений. Предоставляет инструменты Cosmos-Reason 2 и Metropolis для обработки видео данных. Штаб-квартира в Санта-Кларе, Калифорния.

Qualcomm

Производитель процессоров для мобильных устройств и носимой электроники. Сотрудничает с Memories.ai для интеграции технологии визуальной памяти в мобильные процессоры.

LVMM (Large Visual Memory Model)

Модель визуальной памяти, разработанная Memories.ai. Может индексировать и извлекать видео данные, позволяя ИИ запоминать и вспоминать визуальную информацию. Выпущена в июле 2025 года.

Визуальная память ИИ — это не просто технологический тренд, это фундаментальная возможность, которая может изменить то, как ИИ взаимодействует с физическим миром. Memories.ai делает первый шаг в этом направлении, создавая инфраструктуру, которая позволит ИИ запоминать и учиться на визуальном опыте.

Примечания:

  • * Meta признана экстремистской организацией и запрещена в РФ

Интересно почитать :

AI-стартапы захватили венчурный рынок: как Anthropic, OpenAI и xAI
монополизировали капитал
AI-стартапы захватили венчурный рынок: как Anthropic, OpenAI и xAI монополизировали капитал

Ключевые выводы AI-стартапы привлекли 41% всех венчурных инвестиций в 2025 году, установив рекордный показатель Топ-10% компаний получили 50% всего финансирования, что демонстрирует крайнюю концентрацию капитала OpenAI, Anthropic и xAI привлекли …

Upwind Security: Как стартап перевернул облачную безопасность и привлек $250
миллионов
Upwind Security: Как стартап перевернул облачную безопасность и привлек $250 миллионов

Снаружи легко подумать, что у Upwind Security всё идеально. Стартап за 4 года достиг оценки в $1.5 млрд, а в списке клиентов — Siemens, Peloton и Nubank. Но CEO Амирам …

Как BuzzFeed пытается возродиться с помощью AI: BF Island, Conjure и будущее
контента
Как BuzzFeed пытается возродиться с помощью AI: BF Island, Conjure и будущее контента

Ключевые выводы BuzzFeed запускает три новых AI-приложения: BF Island, Conjure и Quiz Party Компания создала спин-офф Branch Office для разработки AI-инноваций BF Island сочетает AI-редактирование фото с библиотекой мемов и …

Nvidia представляет NemoClaw: безопасную платформу для корпоративных AI-агентов
Nvidia представляет NemoClaw: безопасную платформу для корпоративных AI-агентов

Ключевые выводы Nvidia представила NemoClaw - корпоративную версию OpenClaw с улучшенной безопасностью и конфиденциальностью Платформа позволяет предприятиям управлять AI-агентами с помощью одной команды NemoClaw аппаратно-независим и интегрируется с NeMo - …

Bluesky меняет лидерство: Graber уходит, Schneider возглавляет компанию
Bluesky меняет лидерство: Graber уходит, Schneider возглавляет компанию

Ключевые выводы Джей Грейбер покидает пост CEO Bluesky, чтобы стать директором по инновациям Новым временным CEO стал Тони Шнайдер, бывший глава Automattic Bluesky насчитывает более 40 миллионов пользователей и 500 …

Крах Delve: как стартап по кибербезопасности обвиняется в мошенничестве с
сертификатами
Крах Delve: как стартап по кибербезопасности обвиняется в мошенничестве с сертификатами

Ключевые выводы Анонимный источник обвинил Delve в создании фальшивых аудиторских отчетов и фиктивных сертификатов Стартап якобы сотрудничает с индийскими аудиторскими фирмами Accorp и Gradient, которые "закрывают глаза" на нарушения Клиенты …

ФильтрИзбранноеМеню43750 ₽
Top