Новая поисковая система “Спутник”, тест

Ну, посмотрим на новый поисковик “Спутник”. Простым таким запросом – “пеггинг”.

При “строгой” фильтрации поисковик ничего не нашел (ой, да ну? Есть как минимум два абсолютно пристойных определения 1, 2), зато любезно выдал в “умеренной” фильтрации рассказ Чака Паланика “Кишки”. Кто читал, тот оценит “безопасность” поиска, а кто не читал – пусть подумает, стоит ли это читать, рассказ посвящен несчастным случаям во время мастурбации.

UPDATED (2017 год): описанные тут ляпы со временем поправили, хотя не все, не полностью и работала система все равно так себе. В мае 2017 появилась информация о том, что проект могут закрыть.

По первой ссылке просто нерелевантный материал. И, кстати, явно противозаконный. Торрент-раздача фильма “Все включено” мало того, что не имеет отношения к пеггингу, но еще и как минимум на территории РФ нелегальна. По второй ссылке выскочило два всплывающих окна и предупреждение Firefox о попытке атаки. Третья и четвертая посвящены тентпеггингу (что можно признать релевантным в рамках “умеренно безопасного” поиска результатом). Пятая и шестая – “Кишки” Паланика, седьмая действительно называется “Лечение остеохондроза позвоночника в санатории” и на данный момент недоступна. Просмотр кэшированной копии показал, что ни к привязке курса валют, ни к лошадям, ни к анальному сексу страница отношения не имеет.

Восьмой пункт – битая ссылка на сайт знакомств, что тоже вызывает вопросы относительно “умеренной безопасности”. Девятая ведет на релеватный и относительно вменяемый материал, но не напрямую, а через некий сомнительный ссылкосборник. Десятая – про биржевые торги, сочтем релевантной.

Итого: одна ссылка тупо незаконна, по одной ваш компьютер могут атаковать, две ведут на откровенно шокирующее описание несчастных случаев, две ссылки битые, одна на каких-то ссылкоспамеров, три релевантны. Сравните с Яндексом или Google сами.

Анализ запросов “хентай“, “тентакли” и “клитор” показал, что все грустно. Ни о какой “безопасности” говорить не приходится – там, где любая существующая система даст более-менее адекватную статью в Wikipedia, “Спутник” подсунет либо трояна, либо расчлененку, либо матерщину, либо просто завалит нерелевантным мусором. Включив “строгую” фильтрацию и набрав “клитор” я получил, например, вот это: http://proza.ru/2013/07/09/149 – фрагмент некоего сборника цитат, авторы которых выражались, скажем так, весьма свободно. И на первой же странице поиска по этому слову попался какой-то список слов, явно представляющий собой частотный словарь – http://www.ruthenia.ru/leibov_50/b-osm_orexov_add1.txt – извините, но это фейл из фейлов, индексировать такие списки и потом выдавать на них ссылки в первой десятке.

Яндекс со своим “семейным поиском” (в настройках можете поставить и попробовать) тоже не идеален, так как вообще ничего не находит по слову “клитор” или “тентакли” (а зря, есть абсолютно не-хентайная Day of Tentacle), ну так он хотя бы не заваливает реально опасными ссылками.

Меня, конечно, могут сейчас упрекнуть в том, что система как бы “не для поиска информации об анальном сексе”, однако это плохая и негодная отмазка. Безопасно искать информацию о городе Вязьме, колесной паре, выращивании кактусов или там быстром преобразовании Фурье – много умения не надо. А вот на неудобный вопрос “что такое клитор?” дать нормальный ответ – это и для живого человека не всегда просто. Поэтому, конечно, для тестирования “на безопасность и вменяемость” нужен запрос “пеггинг”, а не “погода в Саратове”.

Впрочем, я задал еще несколько запросов, которые уже не столь “неудобны”. Например, запрос “Петрановская” – из него ясно, что блоги система явно ранжирует ниже иных источников и потому личный блог детского психолога (и ведущего русскоязычного специалиста по приемному родительству) Людмилы Петрановской в десятку не попадает.

Вот запрос “слоупок” – в первой десятке нет статьи в Wikipedia, нет статьи в Lurkmore, но полно откровенного мусора (1, 2, 3). Может, они Lurkmore в целом забанили для умеренно безопасного поиска? Ан нет, на первом месте красуется ссылка на: http://lurkmore.to/Шаблон:Слоупок. То есть это просто откровенная лажа и халтура: пропустить статью и взять вместо нее сугубо служебный материал.

Умный Яндекс понимает, что “разогнать печь” – это в первую очередь “разогнать видеокарту серии GTX” (“печь” на жаргоне). Это и называется релевантным поиском. А “Спутник”? Закономерно тупит. Яндексу просишь показать “бездну баша” и он сразу дает ссылку на http://bash.im/abyssbest; “Спутник” показывает статью про bash.org.ru в Википедии первой ссылкой (это как раз правильно), а потом дает кучу мусора (например, второе место). Короче, как минимум пока это даже для бета-версии стыдно.

Tagged . Bookmark the permalink.

One Response to Новая поисковая система “Спутник”, тест

  1. Pingback: “Спутник”, кажется, всё – Alexa Project

Leave a Reply

Your email address will not be published. Required fields are marked *