veefore: (Default)
[personal profile] veefore
Яндекс пишет, что выкатил новый алгоритм поиска, основанный на нейронных сетях. На Хабре развернулось довольно бурное обсуждение качества поиска Яндекса и его реальной (не декларируемой) политики относительно копипасты:
https://habrahabr.ru/company/yandex/blog/336094/

Особенно интересно почитать комментарии пользователя с ником asdoc.

Претензии простые - Яндекс не выдает оригиналы или выдает их далеко ниже многочисленных копий. И чем качественней контент, тем больше копий, тем сложнее найти оригинал. Хотя декларирует понижение в рейтинге сайтов, дублирующих контент, и все такое.

Я сам сталкивался с копированием информации один в один и выдачей сайта-двойника выше моего. При том, что мой сайт работает с 2008 года, двойники появились много позже. Информация хоть и не уникальная по сути, но форма представления - достаточно уникальная, чтобы я мог ее идентифицировать. Скопировано все было практически один в один, т.е. контентная часть одинаковая, даже структура страниц, ссылки... то есть, как мне кажется, Яндекс должен распознать копию и оригинал. Но нет.

Второй пример - при поиске по картинкам по запросу, например, "пробка на МКАД" Яндекс выдает первой вот эту мою фотографию: http://veefore.ru/picture.php?id=1742 (хотя у вас, может, другую?) Фотография сделана в 2010 году и с тех пор висит у меня на сайте. Проблема в том, что хоть она и выдается первой в Яндексе, но это не оригинал, а копия, и моего сайта в выдаче нет вообще. Ну то есть если поискать "другие размеры", то выдается несколько десятков сайтов, куда была скопирована фотография, а моего - нет.

Ну и сам поиск Яндекса по картинкам явным образом не способствует тому, чтобы люди переходили на сайт. В логах множество запросов к картинкам, но переходов на страницы сайта - практически ноль. Яндекс на халяву получает контент, пользователи получают контент, а производители контента ничего не получают.

Все это приводит к тому, что оригинальный авторский контент исчезает, на смену ему появляется копипаста и генерация бессмысленного контента, потому что это в итоге намного более эффективно. Исчезает не в том смысле, что люди меньше пишут, а в том, что его становится сложнее найти. По поводу контента напишу еще в одном из следующих постов.

Третий момент - Яндекс заявляет, что при поиски обращает внимание на поведние пользователей. То есть, грубо говоря, человек перешел по ссылке, задержался на странице - хорошая страница. Быстро ушел со страницы - плохая страница. Все бы ничего, но при такой схеме выше будут выдаваться популярные страницы, что еще больше добавляет им популярности. А менее популярные будут уходить вниз. Все бы ничего, но это означает, что страницы, куда не переходили люди - они никогда не вылезут в поиске. Потому что Яндекс не будет их показывать. Замкнутый круг. Вот такие у меня мысли возникают, хотя заметка вообще не про то.
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Profile

veefore: (Default)
Andre Erofeev

June 2025

S M T W T F S
1234567
891011121314
151617 18192021
22232425262728
2930     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 19th, 2025 03:38 pm
Powered by Dreamwidth Studios