veefore: (Default)
[personal profile] veefore
Яндекс пишет, что выкатил новый алгоритм поиска, основанный на нейронных сетях. На Хабре развернулось довольно бурное обсуждение качества поиска Яндекса и его реальной (не декларируемой) политики относительно копипасты:
https://habrahabr.ru/company/yandex/blog/336094/

Особенно интересно почитать комментарии пользователя с ником asdoc.

Претензии простые - Яндекс не выдает оригиналы или выдает их далеко ниже многочисленных копий. И чем качественней контент, тем больше копий, тем сложнее найти оригинал. Хотя декларирует понижение в рейтинге сайтов, дублирующих контент, и все такое.

Я сам сталкивался с копированием информации один в один и выдачей сайта-двойника выше моего. При том, что мой сайт работает с 2008 года, двойники появились много позже. Информация хоть и не уникальная по сути, но форма представления - достаточно уникальная, чтобы я мог ее идентифицировать. Скопировано все было практически один в один, т.е. контентная часть одинаковая, даже структура страниц, ссылки... то есть, как мне кажется, Яндекс должен распознать копию и оригинал. Но нет.

Второй пример - при поиске по картинкам по запросу, например, "пробка на МКАД" Яндекс выдает первой вот эту мою фотографию: http://veefore.ru/picture.php?id=1742 (хотя у вас, может, другую?) Фотография сделана в 2010 году и с тех пор висит у меня на сайте. Проблема в том, что хоть она и выдается первой в Яндексе, но это не оригинал, а копия, и моего сайта в выдаче нет вообще. Ну то есть если поискать "другие размеры", то выдается несколько десятков сайтов, куда была скопирована фотография, а моего - нет.

Ну и сам поиск Яндекса по картинкам явным образом не способствует тому, чтобы люди переходили на сайт. В логах множество запросов к картинкам, но переходов на страницы сайта - практически ноль. Яндекс на халяву получает контент, пользователи получают контент, а производители контента ничего не получают.

Все это приводит к тому, что оригинальный авторский контент исчезает, на смену ему появляется копипаста и генерация бессмысленного контента, потому что это в итоге намного более эффективно. Исчезает не в том смысле, что люди меньше пишут, а в том, что его становится сложнее найти. По поводу контента напишу еще в одном из следующих постов.

Третий момент - Яндекс заявляет, что при поиски обращает внимание на поведние пользователей. То есть, грубо говоря, человек перешел по ссылке, задержался на странице - хорошая страница. Быстро ушел со страницы - плохая страница. Все бы ничего, но при такой схеме выше будут выдаваться популярные страницы, что еще больше добавляет им популярности. А менее популярные будут уходить вниз. Все бы ничего, но это означает, что страницы, куда не переходили люди - они никогда не вылезут в поиске. Потому что Яндекс не будет их показывать. Замкнутый круг. Вот такие у меня мысли возникают, хотя заметка вообще не про то.

Date: 2017-08-25 01:49 am (UTC)
leo_sosnine: (Default)
From: [personal profile] leo_sosnine
В гугле плохо ищется техническая информация "на земле". Он хорошо выдаёт чепуху на уровне бредогенератора от денежных вендоров.

Поэтому я постоянно вынужден пользоваться ограничителями на сайт site:blah-blah.com, тогда ещё боле-мене.

Profile

veefore: (Default)
Andre Erofeev

June 2025

S M T W T F S
1234567
891011121314
151617 18192021
22232425262728
2930     

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 9th, 2025 03:38 pm
Powered by Dreamwidth Studios