veefore: (Default)
[personal profile] veefore
Яндекс пишет, что выкатил новый алгоритм поиска, основанный на нейронных сетях. На Хабре развернулось довольно бурное обсуждение качества поиска Яндекса и его реальной (не декларируемой) политики относительно копипасты:
https://habrahabr.ru/company/yandex/blog/336094/

Особенно интересно почитать комментарии пользователя с ником asdoc.

Претензии простые - Яндекс не выдает оригиналы или выдает их далеко ниже многочисленных копий. И чем качественней контент, тем больше копий, тем сложнее найти оригинал. Хотя декларирует понижение в рейтинге сайтов, дублирующих контент, и все такое.

Я сам сталкивался с копированием информации один в один и выдачей сайта-двойника выше моего. При том, что мой сайт работает с 2008 года, двойники появились много позже. Информация хоть и не уникальная по сути, но форма представления - достаточно уникальная, чтобы я мог ее идентифицировать. Скопировано все было практически один в один, т.е. контентная часть одинаковая, даже структура страниц, ссылки... то есть, как мне кажется, Яндекс должен распознать копию и оригинал. Но нет.

Второй пример - при поиске по картинкам по запросу, например, "пробка на МКАД" Яндекс выдает первой вот эту мою фотографию: http://veefore.ru/picture.php?id=1742 (хотя у вас, может, другую?) Фотография сделана в 2010 году и с тех пор висит у меня на сайте. Проблема в том, что хоть она и выдается первой в Яндексе, но это не оригинал, а копия, и моего сайта в выдаче нет вообще. Ну то есть если поискать "другие размеры", то выдается несколько десятков сайтов, куда была скопирована фотография, а моего - нет.

Ну и сам поиск Яндекса по картинкам явным образом не способствует тому, чтобы люди переходили на сайт. В логах множество запросов к картинкам, но переходов на страницы сайта - практически ноль. Яндекс на халяву получает контент, пользователи получают контент, а производители контента ничего не получают.

Все это приводит к тому, что оригинальный авторский контент исчезает, на смену ему появляется копипаста и генерация бессмысленного контента, потому что это в итоге намного более эффективно. Исчезает не в том смысле, что люди меньше пишут, а в том, что его становится сложнее найти. По поводу контента напишу еще в одном из следующих постов.

Третий момент - Яндекс заявляет, что при поиски обращает внимание на поведние пользователей. То есть, грубо говоря, человек перешел по ссылке, задержался на странице - хорошая страница. Быстро ушел со страницы - плохая страница. Все бы ничего, но при такой схеме выше будут выдаваться популярные страницы, что еще больше добавляет им популярности. А менее популярные будут уходить вниз. Все бы ничего, но это означает, что страницы, куда не переходили люди - они никогда не вылезут в поиске. Потому что Яндекс не будет их показывать. Замкнутый круг. Вот такие у меня мысли возникают, хотя заметка вообще не про то.
From:
Anonymous( )Anonymous This account has disabled anonymous posting.
OpenID( )OpenID You can comment on this post while signed in with an account from many other sites, once you have confirmed your email address. Sign in using OpenID.
User
Account name:
Password:
If you don't have an account you can create one now.
Subject:
HTML doesn't work in the subject.

Message:

 
Notice: This account is set to log the IP addresses of everyone who comments.
Links will be displayed as unclickable URLs to help prevent spam.

Profile

veefore: (Default)
Andre Erofeev

September 2017

S M T W T F S
     12
3 4 56 789
1011 1213 14 1516
17 18 1920212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 23rd, 2017 11:03 am
Powered by Dreamwidth Studios