Модуль "HTML анализатор"

Анализ содержимого html страниц
Разбор html

Полный курс

Статьи

Компоненты пакета

Online справка
Общие аспекты работы
Модуль "Определение позиций"
Модуль "Внешние ссылки"
Модуль "Индексация сайта"
Модуль "Лог-анализатор"
Модуль "PageRank анализатор"
Модуль "Подбор ключевых слов"
Модуль "HTML-анализатор"
Модуль "Google дата-центры"
Модуль "Работа со сниппетами"

Настройки проекта

Онлайн проект - здесь задается адрес сайта для анализа. Страницы сайта будут скачаны, а затем проанализированы. Рекомендуется задавать корень сайта (домен), остальные страницы будут найдены по ссылкам.

Оффлайн проект (локально) - здесь задается список локальных html файлов для анализа.

Число потоков поиска - задает, сколько страниц сайта будут скачиваться одновременно

Ссылочная глубина. Скачав главную страницу сайта, HTML анализатор выявляет все ссылки на ней и выделяет среди них те, которые ведут на другие страницы данного сайта (т.е. принадлежащие данному домену). Ссылки на другие ресурсы в сети, не относящиеся к заданному сайту, не обрабатываются. После того, как список ссылок сформирован, происходит скачивание новых страниц, которые в свою очередь анализируются на наличие ссылок на другие страницы сайта. Ссылочная глубина задает до какого уровня следует обрабатывать ссылки. Например, глубина 3 (заданная по умолчанию) означает, что будут проанализированы 1) главная страница сайта, 2)все страницы, на которые есть ссылки с главной, а также 3)все страницы, на которые будут найдены ссылки во втором пункте.

Анализировать - позволяет начать анализ

Остановить - остановить анализ

Настройки->Анализировать сохраненные страницы (для оффлайн-проектов) - в случае, если анализировался удаленный проект (т.е. какой-либо сайт в Интернет), то скачанные страницы будут сохранены и при загрузке проекта будет произведен их анализ. Если же анализировались локальные страницы, то при загрузке проекта возможны два варианта:

- провести повторный анализ страниц, входящих в проект. В этом случае будут учтены все изменения, которые произошли в страницах, со времени последнего анализа. Такой способ анализа применяется по умолчанию
- показать результаты предыдущего анализа. В этом случае при загрузке проекта будут показаны те же данные, что были на момент предыдущего анализа (таким образом, новые изменения существующих на диске страниц не будут учтены).

Слова по страницам

В списке слева перечисляются все проанализированные страницы. В таблице же представлен список всех слов, содержащихся на этой странице и их параметров.

Count (Количество) - сколько всего раз слово встретилось на странице. Здесь учитывается не только текст страницы, но тег TITLE, мета-теги Keywords и Description, теги Alt для изображений.

Weight (Вес). Слова и фразы, присутствующие на странице оцениваются поисковыми системами по некоторому алгоритму. Учитывается общее количество вхождений ключевого слова, теги в которых оно стоит (например, присутствует ли слово в заголовке, выделено ли оно жирным шрифтом), расстояние от начала текста и другие параметры. Основываясь на тех же принципах, что и поисковые системы, HTML анализатор присваивает каждому слову некоторое численное значение - его вес, который позволяет оценить, насколько значимо данное слово для данной страницы.

Density (Плотность) показывает процентное отношение числа вхождений заданного ключевого слова к общему числу слов на странице. Плотность ключевых слов является важным параметром, на который следует обращать внимание при оптимизации сайта. Слишком малая плотность приведет к тому, что поисковая система будет считать страницу нерелевантной запросу. Слишком высокая плотность ключевых слов может привести к срабатыванию поискового спам-фильтра, в результате чего страница также не попадет в выдачу.

Text (Текст) В этой колонке показывается общее число вхождений заданного слова в читабельный текст, т.е. непосредственно в текст страницы. Не считаются вхождения ключевого слова в теги TITLE, мета-теги и теги Alt. Учитываются вхождения слова, если оно находится между какими-либо тегами оформления (жирный, курсив), либо является ссылочным текстом (anchor).

Title (Название) - показывает, сколько раз встретилось заданное слово в теге TITLE, т.е. в заголовке страницы.

Bold (Жирный) - показывает, сколько раз ключевое слово было выделено жирным шрифтом.

Italic (Курсив) - показывает, сколько раз ключевое слово было выделено курсивом.

Header (Заголовок) - показывает, находится ли слово в заголовках, т.е. выделено ли оно тегами "Hx " и "/Hx "

Anchor (Якорный текст, Текст ссылки) На странице могут присутствовать ссылки на другие ресурсы. Как правило, ссылка имеет некоторый описательный текст (текст между тегами "a href=..." и "/a"), который называется якорным или ссылочным текстом (anchor text). В данной колонке отображается, сколько раз заданное слово входило в текст ссылки.

Alt (Теги Alt для изображений). Любое изображение на странице может иметь некоторый альтернативный текст, который показывается в том случае, если изображение не удалось загрузить. В данной колонке показывается, встречалось ли заданное слово в тегах Alt изображений.

MetaK (мета-тег Keywords). Изначальное предназначение мета тега Keywords - указать список ключевых слов, релевантных содержанию страницы. Этот список слов должен был использоваться поисковыми системами для определения темы страницы. В настоящее время этот мета-тег игнорируется большинством поисковых систем, однако его применение на странице все же рекомендуется.

MetaD (мета-тег Description). Когда поисковая система формирует выдачу результатов по некоторому поисковому запросу, то она выдает не только ссылки на ресурсы, но также и краткое их описание. Как правило, описание формируется на основе текста, находящегося на странице. Предназначение мета тега Description - дать поисковой системе возможность использовать описание, предоставленное автором страницы. Данный мета тег далеко не всегда используется поисковыми системами, однако его применение на странице все же рекомендуется.

Страницы по словам

Данный отчет аналогичен предыдущему, с той разницей, что в списке слева выбирается ключевое слово, а в таблице показывается список всех страниц, на которых оно встречается.

Фразы по страницам

В списке слева перечисляются все проанализированные страницы. В таблице же представлен список фраз, содержащихся на этой странице и их параметров.

С точки зрения поисковой системы, фраза - это некоторый набор слов, встречающихся на странице. Любое их сочетание (возможно бессмысленное для человека) является фразой для поисковой системы. Однако при поиске по фразам предпочтение отдается тем страницам, которые содержат заданные слова в заданной последовательности (т.е. встречаются в тексте как фраза уже в понимании человека). HTML анализатор проверяет все встретившиеся словосочетания и присваивает им некоторый вес, который позволяет оценить привлекательность фразы для поисковой системы.

Вес фразы зависит от ряда параметров. Прежде всего он базируется на весах слов, составляющих фразу (см. выше), т.е. учитываются число слов, их оформление, присутствие в тегах TITLE, мета-тегах и т.д. Вторая составляющая веса фразы основана на том, сколько раз в тексте встретилась эта фраза. Понятно, что кроме тех случаев, когда фраза встретилась в тексте именно как фраза (т.е все слова подряд), возможны ситуации, когда слова составляющие фразу, встречаются в тексте сами по себе. Чем больше в тексте вхождений непосредственно фразы (все слова подряд), тем больше будет вторая составляющая веса фразы. Третья составляющая веса позволяет оценить кучность заданного набора слов на странице. Очевидно, что если слова, входящие во фразу, разбросаны по странице на большом расстоянии, то это снижает релевантность страницы по отношению к этой фразе. В то же время, если слова стоять рядом друг с другом (например в одном абзаце), то это повышает релевантность страницы. Таким образом третья составляющая веса позволяет оценить расположение слов фразы на страницы. Итоговый вес, который отображается в таблице, базируется на трех описанных составляющих.

Count (Количество) - сколько всего раз фраза встретилась на странице (точным совпадением)

Weight (Вес фразы) - отображает значение веса фразы, описанное выше

Показывать слова - позволяет просматривать детальную информацию по каждому из слов, входящих во фразу

Страницы по фразам

Отчет аналогичен предыдущему, с той разницей, что в списке слева выбирается ключевая фраза, а в таблице отображается список всех страниц, на которых она встречается.

Статистика слов по сайту

В этом отчете отображаются все слова, которые встречаются на сайте. Указывается общее число вхождений (по всему сайту, на все страницах), а также суммарный вес слова (по всему сайту).

Информация о сайте

В этом отчете показывается общая информация по всем проанализированным страницам. Для каждой страницы указывается общее число слов на ней (включая текст, а также служебные теги, тег TITLE, мета-теги и пр.), а также число "читабельных" слов для данной страницы, т.е. слов, непосредственно входящих в видимый текст. Кроме того, указывается размер страницы в килобайтах.



seo tools - english version
 

Semonitor - программа для раскрутки сайта