Началось все примерно в конце декабря прошлого года, когда были отмечены первые сбои. Речь идет о системе Google-Новости. Если раньше выдача выделялась определенным интеллектом, то сегодня отмечается ее утрата. К примеру, если вы зададите в поиск новости по слову "Грузия", Google выдаст новости, содержащие слово "Грузия", но в поисковых результатах уже не будет новостей, не содержащих это слово точно в том виде, в каком был задан поиск. Например, если в новости не используется слово "Грузия", а используется его склонения - "Грузии", "Грузию" и т.д., то Google-Новости откажется его выдавать, пока не введете в поиск слово в соответствующем склонении.
Интеллектуальная поисковая система - это то, к чему все эти годы стремились такие поисковые гранды, как Google и Yandex. Поиск должен максимально близко выдавать ответы на запросы пользователей. Но в условиях, когда они позволяют регулировать со стороны самого пользователя точность выдачи, ограничения в "интеллекте" самого поисковика становится не нужным. Например, всегда можно ограничить ввод точным соответствием какой-либо фразе, слову.
У Yandex-Новости наблюдается своя "патология". Речь также идет о части выдачи новостных лент. В Yandex новости разбиты на "главные", которые выводятся на главную страничку Yandex-Новости, а также их соответствия. И зачастую можно наблюдать, как в "главные" попадают перепечатки новостей, а их источники теряются где среди ленты похожих. Если взять новости по Грузии, то очень редко в главную ленту попадают новости грузинских (русскоязычных) новостей, несмотря на то, что по большей части они и становятся источниками информации для многих других русскоязычных медиа-средств, зарегистрированных в системе. Объясняют это в системе тем, что робот сам отбирает новости для главной страницы по общему числу запросов. Но ведь если робот далек от интеллекта, то следует вмешаться человеку...
Между тем, в мире продолжается активная работа над проблемой приближения понимания поисковой системой запросов пользователей. Как заявляет директор исследовательского центра имени Тьюринга (Turing Center) при Вашингтонском университете Орен Эциони (Oren Etzioni), данная проблема будет решена уже через пять лет.
Решение этой проблемы Эциони предполагает на основе интеллектуальные поисковых систем на основе Open IE. По его словам, поисковые системы начнут преобразовывать фразы в логические выражения, и уже на основе этого ранжировать сайты. В качестве примера подобной системы, которая пока находится в разработке, Эциони привел поисковик Softbot. Правда, тут пока слишком много недоработок. Например, Softbot удаляет серверные журналы вместо файлов.