Почему Ai‑Обзор Google Постоянно Ошибается В Простых Подсчётах Букв И Что С Этим Делать

Ключевые выводы

  • AI‑обзор Google периодически показывает неверные подсчёты букв в словах (например, «two Ps in Google»), потому что модель работает с токенами, а не с отдельными символами.
  • Токенизация и трансформер‑архитектура ограничивают способность LLM «видеть» отдельные буквы, что приводит к типичным орфографическим ошибкам.
  • Разработчики признают проблему и обещают поправки, но фундаментальное решение требует переосмысления токенов или гибридного подхода к обработке текста.
Google решила поставить генеративный ИИ в центр поиска, но пока его «мозг» всё ещё путает простые буквы. Мы посмотрели, почему это происходит, и что может измениться в ближайших обновлениях.

Что именно пошло не так в последнем AI‑обзоре?

Недавно Google выпустила новую функцию «AI Overview», которая должна быстро подводить итог запросу, показывая короткую справку. На первый взгляд всё выглядит здорово, но в реальной работе возникли курьёзные ошибки.

Например, система ответила на вопрос «Сколько букв «P» в слове Google?», заявив, что их две. Точно так же она подсчитала «один «r» в слове poop», но при этом написала «j‑o‑u‑r‑n‑a‑d‑i‑s‑m» вместо «journalism». В случае имени президента США она указала одну «P», но написала «t‑r‑p‑u‑m».

Эти ошибки не просто странные «фэйлы» – они демонстрируют фундаментальный лимит текущей архитектуры больших языковых моделей (LLM), на которой построена AI Overview.

Google уже признал проблему в интервью, сказав, что «подсчёт букв в словах – известная проблема LLM, над которой мы работаем». Что же стоит за этими простыми, но бросающими вызов ошибками?

Токенизация: почему модели «не видят» отдельные буквы

Большие языковые модели, включая те, что лежат в основе AI Overview, построены на трансформерах. Трансформер разбивает вводимый текст на токены – кусочки, которые могут быть целыми словами, их частями или даже несколькими символами.

Если токен представляет слово «google», модель хранит один вектор, описывающий смысл слова, но **не хранит** информацию о каждой отдельной букве. Поэтому, когда система пытается посчитать буквы, она обращается к статистическому представлению токена, а не к реальному набору символов.

«Токен‑база» делает LLM мощными в генерации связных ответов, но в то же время делает их «слепыми» к деталям орфографии. Это объясняет, почему запрос «сколько «r» в слове strawberry?», для которой модели часто дают ответ «один», а вовсе не «три».

Исследователь Мэтью Гуздаль из Университета Альберты подчеркивает: «Когда модель видит слово «the», у неё есть один вектор, описывающий значение «the», но «Т», «H», «E» как отдельные символы она не знает».

Почему «токен‑проблема» не так просто решить

Одно из предложений – использовать более «мелкую» токенизацию, когда каждый символ будет отдельным токеном. На практике такой подход резко ухудшает эффективность и увеличивает время обучения модели.

Шеридан Фойхт, аспирантка из Северо‑восточного университета, отмечает: «Невозможно придумать идеальный токенизатор – всегда будет компромисс между смысловым охватом и детализацией».

Это значит, что пока Google будет полагаться исключительно на текущий трансформер, подобные орфографические баги будут появляться время от времени. Одна из возможностей – гибридный подход: использовать традиционный «spell‑checking»‑модуль в сочетании с LLM, чтобы проверять ответы на простые подсчёты.

Пока что Google лишь обещает «исправить» проблему в будущих обновлениях, но не раскрывает, будет ли это переобучение модели или внедрение отдельного пост‑процессинга.

История ошибок: от «советов есть камни» до «неправильных букв»

AI Overview уже успел стать предметом шуток. При первом запуске система иногда приводила ответы из сатирических источников («Кушайте камни», «Поклейте клей на пиццу»). Затем в мае 2026 года официально зафиксировал ошибку, когда запрос «disregard» возвращал ответ «Understood. Let me know whenever you have a new prompt or question!», будто бы система «не поняла» запрос.

Новейшие ошибки с подсчётом букв лишь добавляют к репутации «глубоких, но иногда нелепых» AI‑обзоров.

Тем не менее, стоит помнить, что мощность этих моделей не ограничивается орфографией. Они способны писать код за секунды, находить решения сложных математических задач и формировать связные тексты – то, что обычный человек сделать за часы.

Поэтому, пока мы улыбаемся над «двумя P в Google», важно видеть общую картину: генеративный ИИ – это всё ещё эксперимент, требующий контроля и проверки.

Как пользователям проверять ответы AI Overview

1. **Сравнивайте с проверенными источниками** – если ответ кажется странным, откройте обычный поиск или словарь.

2. **Используйте двойной запрос** – сформулируйте вопрос по‑разному, чтобы увидеть, совпадают ли ответы.

3. **Не полагайтесь на цифры** – для подсчёта букв, слов или символов лучше проверять вручную или применять специализированные инструменты.

4. **Отмечайте ошибки** – если в интерфейсе есть возможность «сообщить об ошибке», используйте её – это поможет ускорить исправления.

5. **Следите за обновлениями** – Google регулярно публикует изменения в своих AI‑продуктах, и часто баги устраняются в новых версиях.

Что будет дальше: возможные пути развития AI Overview

Эксперты предполагают три основных направления:

  • Гибридный стек. Комбинация LLM с традиционными алгоритмами проверки орфографии и подсчёта символов.
  • Обучение на «тонких» токенах. Специальные модели, где каждый символ входит в токен‑словарь, но только для ограниченных областей (например, подсчет букв).
  • Контекстуальная валидация. Система «перепроверит» собственный ответ, сравнив его с простыми правилами (например, «если запрос о подсчёте, используем обычный скрипт»).

Любой из этих подходов потребует значительных ресурсов, но, как показывают текущие ошибки, инвестировать в точность стоит.

Справка

Google – американская технологическая компания, основанная в 1998 году Ларри Пейджем и Сергеем Брином. Сначала известна как поисковая система, сейчас предлагает облачные сервисы, Android, рекламные платформы и AI‑решения.

AI Overview – функция в поиске Google, предоставляющая короткие автоматические сводки по запросу, основанные на генеративных моделях ИИ.

Large Language Model (LLM) – большие языковые модели, обученные на огромных объёмах текста, способные генерировать связный текст и отвечать на вопросы.

Transformer – архитектура нейронных сетей, введённая в 2017 году, лежащая в основе большинства современных LLM, использующая механизм «внимания» для обработки контекста.

Matthew Guzdial – ассоциированный профессор Университета Альберты, специалист в области искусственного интеллекта и обучения машин, часто комментирует ограничения трансформеров.

Sheridan Feucht – аспирантка Северо‑восточного университета, исследует интерпретируемость LLM и проблемы токенизации.

AI Overview уже показывает, что генеративный ИИ — мощный, но несовершенный инструмент. Пока модель не научится «считать буквы», пользователям придётся проверять её ответы вручную, а разработчикам — искать более гибкие решения.

Интересно почитать :

Как умные телевизоры собирают данные и как это отключить: подробный гид 2026
Как умные телевизоры собирают данные и как это отключить: подробный гид 2026

Кратко: Smart TV используют ACR — скриншоты экрана каждые 0,5–0,01 сек. Голосовые помощники отправляют звук в облако, если включены. Отключить большую часть слежки можно за 5‑9 пунктов в настройках. Если …

Приложения для дружбы: как найти своих людей в эпоху одиночества
Приложения для дружбы: как найти своих людей в эпоху одиночества

Ключевые выводы Одиночество стало публичной проблемой здоровья, что стимулировало рост рынка приложений для дружбы — их доходы в США уже достигли $16 млн в 2025 году. Новые приложения (222, Pie, …

Snap перестал сотрудничать с Perplexity: что это значит для пользователей и
инвесторов
Snap перестал сотрудничать с Perplexity: что это значит для пользователей и инвесторов

Ключевые выводы Snap официально прекратил сотрудничество с Perplexity, соглашение на $400 млн было аннулировано. Рост дневных активных пользователей (DAU) составил 5 % и достиг 483 млн, несмотря на отмену проекта. …

Операция PowerOFF: как полиция добилась рассылки предупреждений 75 000
киберпреступникам и закрытия DDoS‑for‑Hire сервисов
Операция PowerOFF: как полиция добилась рассылки предупреждений 75 000 киберпреступникам и закрытия DDoS‑for‑Hire сервисов

Ключевые выводы Europol совместно с правоохранительными агентствами более 75 000 раз отправил предупреждающие письма людям, купившим сервисы DDoS‑for‑Hire. Операция PowerOFF привела к четырём арестам, закрытию 53 доменных имён и 24 …

Серьёзный сбой в цепочке поставок: как хакеры компрометировали TanStack и
коснулись OpenAI
Серьёзный сбой в цепочке поставок: как хакеры компрометировали TanStack и коснулись OpenAI

Ключевые выводы Хакеры взломали репозиторий TanStack, опубликовали 84 вредоносных npm‑пакета и в течение 6 минут распространили их среди разработчиков. OpenAI подтвердил компрометацию устройств двух сотрудников, но данных пользователей и продакшн‑систем …

Тесла Robotaxi попал в ДТП: два столкновения с телепилотом и что это значит для
будущего автономных такси
Тесла Robotaxi попал в ДТП: два столкновения с телепилотом и что это значит для будущего автономных такси

Ключевые выводы С июля 2025 года по данным NHTSA в Остине (Техас) зафиксировано минимум две аварии Robotaxi Tesla, в которых удалённый оператор управлял машиной. Обе аварии произошли на низкой скорости, …

ФильтрИзбранноеМеню43750 ₽
Top