Медиановости
/ Интернет

5 марта 2015 20:59

Google будет ранжировать страницы по достоверности

Поисковый алгоритм, который разрабатывает команда Google, будет ранжировать страницы в зависимости от количества и достоверности фактов на них.

Предложенный учёными метод носит названием KBT - «Knowledge-Based Trust», то есть «траст, основанный на знаниях». В таких случаях «трастом» называют «доверие» поисковой системы к сайту, сообщает TJournal.

Качество веб-ресурсов традиционно оценивалось с использованием экзогенных [внешних] сигналов вроде структуры гиперссылок. Мы предлагаем новый подход, который основан на эндогенных [внутренних] сигналах, а конкретно — корректности фактической информации, предоставленной источником. Источник, несущий в себе лишь небольшое количество ложных фактов, считается надёжным.

Уникальный механизм основан на информации, которую Google годами автоматически собирала в базы Knowledge Graph (только проверенные источники) и Knowledge Vault (все доступные источники).

Находя в тексте факты и сравнивая их с миллиардами записей из Knowledge Vault, поисковик сможет определять степень достоверности определённых фрагментов. Более того, если на нужной странице будет недостаточно данных для анализа, то система исследует весь ресурс и при ранжировании будет отталкиваться от его комплексной оценки.

В рамках эксперимента исследователи извлекли из сети порядка 2,8 миллиарда «фактических элементов» и с их помощью предсказали надёжность 119 миллионов веб-страниц и 5,6 миллиона сайтов.

Создатели технологии отметили, что она не является полностью универсальной: некоторые сайты просто не созданы для того, чтобы нести в себе достоверную информацию. Поэтому алгоритм, скорее всего, дополнит уже существующую систему ранжирования ссылок, нежели заменит её.

На момент написания заметки поиск Google помимо базового ссылочного ранжирования (выше поднимаются те источники, на которые чаще ссылаются) оценивает ещё порядка двухсот факторов, включая местоположение пользователя и историю его запросов.

Представители «Яндекса» усомнились в том, что метод Google действительно поможет оценить правдивость информации в сети.

Называть фактами всё, что опубликовали в интернете и никто не проверял на правдивость, по меньшей мере, странно. Скорее, речь идёт об оценке уникальности контента. В «Яндексе» с августа 2011 года существует инструмент, который позволяет вебмастерам заявить об авторстве своих материалов и быть в результатах поиска «Яндекса» выше тех, кто позаимствовал их тексты.

Сам «Яндекс» в конце 2013 года объявил от отказе «ссылочного ранжирования» коммерческих сайтов, таким образом обвалив целую индустрию продвижения интернет-страниц в сети.

Теги:  google