Google

Google PageRank

Общая теория и практические советы

Полный курс

Статьи

Компоненты пакета

В начало
Содержание
Глава 7. Внешние факторы: ссылочная популярность. Общая теория.
7.1 Зачем нужен учет ссылок.
7.2 Типы внешних ссылок.
7.3 Google PageRank.
7.4 ТИЦ и ВИЦ Яндекс.

Google PageRank

Теоретические основы. Компания Гугл первая внедрила учет ссылочных факторов. Алгоритм получил название Google PageRank и совершил переворот в качестве поиска. В основу алгоритма легла идея цитируемости, принятая в научном мире. Чем чаще цитируют и ссылаются на ученого в своих работах другие ученые – тем, соответственно, больший вес имеет «цитируемый» человек. То же самое и с сайтами – чем больше ссылок на данный ресурс, тем выше его вероятная ценность.


Понятно, что учитывать требуется не только количество ссылок, но и их качество. «Голос» с сайта Майкрософт куда более весом, чем голос домашней странички Васи Пупкина.

В алгоритме PageRank используется модель перехода пользователя по ссылкам на сайтах. Предполагается, что первую страницу человек выбирает случайным образом из всех страниц Интернета. В жизни это, конечно, не так – есть сайты популярные и именно с них начинается работа в сети. Но в нашей математической модели мы все страницы изначально считаем равными.

Далее посетитель по ссылкам переходит на другие сайты. Опять таки, мы не учитываем, что одни ссылки более заметны, а другие «спрятаны» внизу страницы однопиксельным шрифтом. Все ссылки мы считаем равными, и вероятность перехода по каждой обратно пропорциональна их количеству. Если на странице 10 ссылок, то вероятность клика по любой из них 1/10. Также вводится «коэффициент затухания»: полагаем, что с вероятностью 15% человек не будет вообще переходить по ссылкам, а просто закроет страницу и начнет просмотр с новой, случайно выбранной.




Теперь давайте разберем работу алгоритма на примере. Пусть у нас есть три блогера.

1. Ваня Иванов. Ему 10 лет и вчера родители купили ему книгу по HTML, после чего Ваня сделал свою первую Интернет-страницу.

2. Петя Петров. Он уже несколько лет активно пишет в своем блоге. Правда особой популярности не достиг, но порой выдает кое-какую полезную информацию и его изредка, но все же читают.

3. Артемий Лебедев. Если мне не изменяет память, то одно время считался самым популярным блогером Рунета.

На первом шаге все три страницы имеют равный «вес». Допустим 100 единиц веса каждая. Обратите внимание, что у Вани Иванова на странице 2 ссылки, и каждая из них передает 50 единиц веса. А у Темы Лебедева 30 ссылок, и каждая «весит» всего лишь 3 единицы.

Запускаем алгоритм расчета PageRank и обрабатываем все страницы Интернета и связи между ними. После полного пересчета мы получим уже совсем иную картину, чем была вначале.

Вес Вани Иванова, на которого никто не ссылается вообще, как был, так и остался 100 единиц. Вес блога Пети Петрова стал 500 единиц, т.к. Петю все таки иногда «цитируют» в сети. Вес блога Артемия Лебедева стал равным 10 тыс. единиц – учлись ссылки с множества различных источников.

Т.е. после первого пересчета мы получили грубую, но все таки оценку авторитетности сайтов. Конечно, результаты далеки от идеала, т.к. на первом шаге у нас была заложена чудовищная неточность (Ваня Иванов = Петя Петров = Артемий Лебедев). Поэтому мы запускаем второй пересчет или, говоря математическим языком, вторую итерацию. На этот раз мы работаем с теми весами, которые рассчитали на первом шаге. Обратите внимание, ссылка Вани Иванова по прежнему «весит» 50 единиц. А вот ссылка Артемия вместо 3 единиц веса стала передавать 300!

После определенного количества итераций веса сайтов практически перестанут изменяться. Т.е. цифры, полученные на текущем и на предыдущем шаге, будут почти равными. Это означает, что расчеты можно заканчивать – мы смогли измерить «вес» и авторитетность каждой страницы, с учетом структуры всех ссылок Интернета.



Практическая реализация. Конкретное значение Гугл PageRank можно увидеть с помощью Google Toolbar (см. скриншот).


Тут следует сказать, что «тулбарный» PR рассчитывается по логарифмической шкале. Т.е. если для получения «зелененькой» единички на тулбаре нужно иметь 1000 единиц реального веса, то тулбарная двойка обойдется не в 2 тыс., как можно было бы подумать, а в 20 тыс. А тройка – и вовсе в 500 тыс. условных весовых единиц. Все цифры приведены для примера, но я думаю суть вы поняли. Каждый следующий шаг по тулбарной лестнице в разы сложнее предыдущего.

PR позволяет наглядно оценить ссылочную популярность сайта. Грубо можно ориентироваться на такие цифры:

PR 1 Любой сайт, над которым ведутся хотя бы минимальные работы
PR 2-3 Наиболее здоровый «показатель» для большинства коммерческих сайтов
PR 4-5 Серьезно раскрученные, популярные ресурсы
PR 6 и выше Для обычных сайтов почти недостижимая цифра. Такой PR получают очень серьезные проекты, которые можно по пальцам пересчитать.

Для сравнения:

Данный сайт (www.semonitor.ru) - PR 4
SearchEngines.ru – PR 6
Google.ru – PR 7
Yandex.Ru – PR 8

Следует отметить, что в англ. Интернете цифры PR обычно на единичку выше, чем в рунете, видимо какие-то особенности расчетов.

Практическое применение. Теперь посмотрим, какую пользу мы можем извлечь из Google PageRank для продвижения сайта.

Самое первое, что приходит на ум – это покупка и размещение ссылок. Чем выше PR страницы, тем больший вес передаст нам ссылка с этой страницы. Собственно именно таким образом и используют PR.

Несколько лет назад раскрутка сайта на этом показателе и строилась. Кто купил больше ссылок с более высоким PageRank, тот и оказался в ТОПе Гугла. Сейчас все радикальным образом изменилось.

- хотя реальный вес страниц пересчитывается постоянно, его тулбарный эквивалент обновляется очень редко. Раз в год примерно. Т.е. значения PR, которые мы видим, напоминают свет далеких звезд. Смотрим мы на небо и видим свет, отправившийся в путешествие тысячу лет назад.

- «классический» PageRank уже очень давно вообще не влияет на ранжирование. Для любой ссылки учитывается масса различных показателей – близость тематик донора и акцептора, расположение на странице, анкорный текст, количество живых переходов по этой ссылке и т.д. и т.п. PageRank же меряет статический вес страницы, без учета всех этих факторов.

На деле ссылка с PR 0 может оказаться полезной для продвигаемого сайта, а PR 5 лишь поднимет красный флажок спама для поисковой системы.

Таким образом, Google PageRank является ОДНИМ ИЗ показателей, которые мы будем принимать во внимание при поиске «доноров» для простановки ссылок на наш ресурс.


Моя книга издана в бумажном варианте. Если этот учебник оказался для вас полезным - то вы можете отблагодарить меня не только морально, но и вполне осязаемо.
Для этого нужно перейти на Озон.Ру или Лабиринт.Ру и выставить книге оценку или написать отзыв.
Для вас это бесплатно (всегда приятно сделать что-то хорошее без лишних затрат :-)), а для нас очень важно, т.к. поможет нам поднятся в рейтингах. Надесюь на вашу поддержку!

А вот купить книгу - дешевле всего непосредственно на сайте издательства Инфра-Инженерия




Читать далее >>


Если мой труд заслуживает "спасибо", то буду рад вашим "лайкам" и "гуглоплюсам"!





 

Semonitor (R) - программы для раскрутки и продвижения сайта