Интернет-разведка. Руководство к действию

Страница: 1 ... 3334353637383940414243 ... 193

4. Транслитерация.

Люди довольно часто делают ошибки при вводе текста и вместо русских букв печатают их английских «близнецов». Например, букву «с». Рамблер говорит, что старается исправлять такие огрехи, однако не гарантирует результата.

Эксперимент показал, что система действительно справляется с опечатками транслитерации, если количество таких ошибок в слове невелико. Убедитесь сами.

Запрос (все буквы русские):

[ «глОКлАя кУздРА»]

Результат: Вы искали: «глОКлАя кУздРА », найдено сайтов: 5, документов: 37.

Запрос (заглавные буквы – латинские):

[ «глOKлAя кYздPA»]

Результат: Не найдено ни одного документа, полностью соответствующего запросу ««глOKлAя кYздPA »».

Запрос (заглавные буквы – латинские):

«глOклая куздPа»

Результат: Вы искали: ««глOклая куздPа »», найдено сайтов: 5, документов: 37.

Чтобы не загружать читателя лишними примерами, скажем лишь, что при трех опечатках правильный поиск еще проводился, но после появления четвертой неправильно написанной буквы результат поиска стал нулевым. Рамблер в комментариях к результату поиска в этом случае просто порекомендовал пользователям быть внимательнее при вводе текста.

5. Регистр букв.

Как правило, Рамблер не учитывает регистр букв, причем он распространяет это правило не только на слова запроса, но и на операторы.

Действительно, запросы «глоклая куздра» и «ГлоКЛаЯ КУздРа» дали одинаковые результаты.

Запрос:

[ «глоклая куздра»]

Результат: Вы искали: «„глоклая куздра“«, найдено сайтов: 8, документов: 45

Запрос:

[ «ГлоКЛаЯ КУздРа»]

Результат: Вы искали: «„ГлоКЛаЯ КУздРа“«, найдено сайтов: 8, документов: 45

Однако Рамблер сообщает, что он делает исключение из этого правила: если в запросе, как минимум, два слова, идущих подряд, написаны с заглавной буквы, система, как утверждают ее создатели, старается искать эти слова также с заглавной буквы. То есть, Рамблер пытается помочь тем, кто ищет имена собственные или географические названия.

Проведенный нами эксперимент этого не подтвердил.

Запросы:

[слава зайчиков] и [Слава Зайчиков]

выдали в Рамблере одинаковое количество страниц в выдаче.

Вы искали: слава зайчиков , найдено сайтов: 813, документов: 2621

Вы искали: Слава Зайчиков , найдено сайтов: 815, документов: 2621.

Это похоже на результаты Гугла, который не различает заглавные и прописные буквы:

Результаты 1 – 10 из примерно 138 000 для слава зайчиков

Результаты 1 – 10 из примерно 138 000 для Слава Зайчиков .

Тогда как в Яндексе, который различает заглавные и прописные буквы, результат был иным:

— 38 —
Страница: 1 ... 3334353637383940414243 ... 193