09.11.2008

Xenu's Link Sleuth — исправляем битые ссылки

Вчера я обещал познакомить читателей с одним хорошим инструментом для поиска битых и «мертвых» ссылок. Встречайте — Xenu's Link Sleuth. Данная утилита позволит вам всегда быть в курсе, какие ссылки на вашем блоге прописаны корректно, какие нет, какие ведут на «живые» ресурсы, а какие на давно почившие. Перед инструкцией, позвольте привести официальную аннотацию программы.


Xenu проверяет сайты на неработающие ссылки. Проверка на валидность производится по обычным ссылкам, изображениям, фреймам, плагинам, фонам, картам ссылок, стилям, скриптам и Java-апплетам. Итоговый список ссылок можно сортировать по:

  • URL
  • статусу проверки
  • типу URL
  • размеру
  • тайтлу
  • дате
  • уровню вложенности
  • исходящим ссылкам
  • входящим ссылкам
  • серверу
  • ошибкам
  • времени проверки

После проверки можно сформировать отчет, и отправить его по емейл, залить на фтп, сохранить на диске.

Особенности программы:

  • Программа полностью бесплатна
  • Простой пользовательский интерфейс
  • Возможность повторной проверки отдельных ссылок
  • Простой формат отчета
  • Маленький исполняемый файл самой программы
  • Поддержка SSL ("https:// ")
  • Частичное тестирование ftp и gopher протоколов
  • Обнаружение и отчеты по адресам с перенаправлением
  • Карта сайта

Давайте попробуем протестировать пару сайтов. После того, как вы скачали и установили программу, запустите ее и перейдите в настройки (Options-Preferences) и отметьте в правой колонке Reports галочками все пункты, затем перейдите на закладку Advanced и в поле Retries установите значение 3

Настройки Xenu

Настройки Xenu

Начните новую проверку, введите адрес для проверки.

Xenu - новая проверка

Xenu - новая проверка

Там же вы можете указать, на какой емейл будет отправлен отчет после проверки.

Xenu - отчет на емейл

Xenu - отчет на емейл

Начнем проверку. Для проверки был выбран блог Жомарта. Программа не умеет корректно работать с кириллицей, так что не удивляйтесь кракозябрам в тайтлах страниц.
Судя по итогу проверки, на блоге Жомарта всего 642 ссылки, из них 8 не ответили на запросы программы. На скриншоте ниже сортировка по ошибкам. Первая весьма интересна=)

Xenu - итог проверки

Xenu - итог проверки

Последние две, как вы видите, ссылки на википедию, которая в URL использует кириллицу, поэтому это не стоит считать за ошибки — просто программа не умеет работать с такими адресами. Еще три ошибки выше показывают timeout, то есть вышло время ожидания, отведенное для проверки ссылки, и ответ за это время получен не был.

Их можно перепроверить: нажмите на них второй клавишей мышки, и в выпадающем меню выберите Resent Entry. В выпадающем меню вы также можете:

  • копировать URL в буфер обмена
  • открыть URL в браузере
  • просмотреть страницу в кеше Google
  • просмотреть страницу в Wayback Machine
  • просмотреть страницу в Alexa
  • заглянуть в свойства этой ссылки

Так как ни повторная проверка, ни открытие страницы в браузере нам не помогло, именно в свойства сейчас заглянуть и стоит, чтобы выяснить, какая страница блога Жомарта ссылается на этот не отвечающий ресурс.

Xenu - свойства ссылки

Xenu - свойства ссылки

В свойствах вы видите URL проверяемой ссылки; тайтл, который в данном случае ни о чем нам не говорит, так как кириллица не поддерживается программой; ссылки, которые есть на проверяемой странице; ссылки, которые ведут с блога Жомарта на данный URL. Согласно проверке, на неотвечающий ресурс стоит ссылка со страницы itkaz.ru/reklama-v-kazaxstanskix-blogax/ и, как я вчера и говорил, — из постового.

Блог Жомарта не показатель, так как ошибок в ссылках у него почти нет, но вообще, мертвых ссылок в постовых достаточно много. Давайте проверим еще блог Татьяны Какуниной:

  • Всего ссылок — 3264
  • Ошибок — около 50 (перемещенные страницы, неправильно набранные адреса)

Иногда бывает сложно выяснить, на какой из ваших страниц находится «мертвая» ссылка. Если в свойствах ошибочного URL вы не видите, какая из ваших страниц содержит плохую ссылку, то перейдите в панель управления своего блога, зайдите на закладку Управление-Записи и в поле «Поиск записей» введите проблемный URL

Поиск записей

Поиск записей

Поиск выдаст вам все записи, содержащие указанный вами URL, и вы сможете его исправить. Если вам нужно сменить один URL на другой, то лучше воспользоваться плагином Search and Replace, о котором я недавно говорил.

Используя данную утилиту и еженедельно проверяя свой блог на битые ссылки, вы сможете вовремя избавляться от балласта, который, во-первых, мешает вашим читателям, а во-вторых, снижает доверие поисковых систем к вашему блогу. Первая чистка займет какое-то время, но в дальнейшем устранение неисправностей будет проходить быстрее.

Попробуйте проверить свой блог, думаю, результат вас удивит. Скачать программу можно на странице Xenu's Link Sleuth. Есть аналогичные продукты, позволяющие проверить ссылки своих ресурсов, но так как за полчаса поисков ни один бесплатный сервис или софт найти мне не удалось, приводить их не вижу смысла.

Статьи по теме:


Комментариев: 21

  1. Татьяна | Ноябрь 9, 2008 в 19:26 | @

    Афтар, спасибо за пост!

    Очень полезный и актуальный =)) Прогу скачала, запустила (все, как в посте рассказывается) и жду окончания проверки сижу! СтОООООлько ссылок мнОгО!

  2. Жомарт | Ноябрь 9, 2008 в 21:29 | @

    Спасибо! Пошёл искать ошибку, там вроде точки нету перед kz.

  3. Волотко Дмитрий | Ноябрь 9, 2008 в 21:53 | @

    На убунте работает на ура — уже запустил. Спасибо — проверим-с, сколько битых ссылок.

  4. AlexNote | Ноябрь 9, 2008 в 22:48

    Татьяна:

    Простота софта позволяет работать с ним даже блондинкам=)

    Жомарт:

    Там не точка, а урл, в котором кроме «---» нет ничего.

    Волотко Дмитрий:

    У меня юниксов не стоит, так что кроссоперационность проверить не мог. Выходит, что под ними тоже можно работать, здорово.

    Я еще думал написать админам блогуна, спросить насчет «мертвых» ссылок в постовых, можно ли снимать ссылку, если ресурс заказчика не отвечает. Потом решил, что работающие с ним и сами узнают, коли нужно будет.

  5. Zer0CooL | Ноябрь 9, 2008 в 23:01 | @

    Хорошая прожка ;-)

    в закромах валяется уже давненька =) (редко используемая) если ручки прямые :-D

    Ну серавно МОЛОДЦОМ !

  6. Татьяна | Ноябрь 9, 2008 в 23:28 | @

    Проверочку свою завершила:

    1. так много ссылочек у меня, потому что каждая картинка — ссылочка (а то и две — увеличение по клику), а картинки я люблю :)) если сейчас 284 записи * 2 (две картинки) * 5 (ссылок в посте) = 2840 ссылки как минимум, на самом деле их 3275;

    2. некоторые блоги упали/лежат/не оплатили хостинг, так что вины моей в этом нет (хотя, согласна, читателей это может не порадовать);

    3. от некоторых блогов прожка не дождалась ответа, если открыть эти ссылки в браузере, то они открываются (хоть и не очень быстро).

    Отличная прожка! Загрузила хост по полной своей проверкой =))

  7. Zer0CooL | Ноябрь 10, 2008 в 00:00 | @

    Решил поставить в очередной раз =)))

    как раньше не все корректно было так и осталось =)) есть ссылки реально рабочие =)

    а она орет что нету их =))

    ну без погрешностей как известно ничег оне бывает :-D

  8. AlexNote | Ноябрь 10, 2008 в 00:01

    Татьяна:

    Тут и не говорится, что если есть ошибки, то непременно вина автора. Бывает, конечно, что пропустил по невнимательности пару символов, и ссылка уже не ссылка, а невесть что. Тут речь о том, что и читателям и поисковикам без разницы кто виноват — ушедший в мир вечного аптайма сайт, или невнимательный автор — и те, и те сочтут это ошибками. А они отрицательно влияют на восприятие блога и живым человеком, и машиной.

    А вот что делать, если оплатили ссылку навсегда в блогуне, а сайт не продлили у хостера, вопрос. Тут вроде и ссылка уже ни к чему, и заплачено за вечное размещение.

    То, что ответа не дождалась — это 30-секундный таймаут, параметр можно увеличить, или повторить проверку конкретной ссылки. Бывает, к сожалению такое.

  9. Татьяна | Ноябрь 10, 2008 в 00:06 | @

    Так здорово все объясняешь — разобралась!

    Спасибо :)

  10. AlexNote | Ноябрь 10, 2008 в 00:15

    Zer0CooL:

    Да, где требуется определение агента, она пишет ошибку, ошибается, если вышел срок ожидания ответа, кириллица не работает. Но — понедельники тоже ошибка природы — и ничего, живем=)

  11. Zer0CooL | Ноябрь 10, 2008 в 00:24 | @

    В общем после речеков (полезная кнопа Retry Broken Links)

    Вывод у нас все живое ;-)

    Ну кроме лажачих блогов и как AlexNote сказал там где чекается браузер :-)

    ( например миртесен_ру)

    Мы ЧИСТЫ =)) даешь PAGERANK 20ать :lol:

  12. Valentin | Ноябрь 10, 2008 в 10:14 | @

    Почему бы им не сделать web вариант этой программы? Слил ему адрес и пусть сканирует сколько угодно. Зашёл через часок и посмотрел результат.

  13. AlexNote | Ноябрь 10, 2008 в 10:26

    Valentin:

    Я думаю потому, что проверка ссылок это запрос и получение ответа. Нагрузка на сервер будет большая, если люди начнут свободно проверять свои сайты. Да и дектопный вариант вполне достаточен — за полчаса можно проверить сайт с 3000+ ссылок.

  14. Максим | Ноябрь 10, 2008 в 13:11 | @

    Посмотрим-с че оно мне скажет (:

  15. Илья Рабченок | Ноябрь 12, 2008 в 17:34

    Для блогов половина таких ссылок будет от комментаторов?

  16. AlexNote | Ноябрь 12, 2008 в 17:52

    Илья Рабченок:

    Ваш коммент, Илья, оказался в спаме. Пишите Акимету (akismet.com/contact) об ошибочном занесении вас в черный список, и мониторьте появление ваших комментариев в других блогах. В случае не появления — пишите автору с просьбой проверить спам.

    А по теме — нет, если вы имеете ввиду ссылки в имени комментатора. У меня по-крайней мере, из комментариев ни одной битой ссылки не было.

  17. Jfoton | Декабрь 19, 2008 в 16:34 | @

    Алексей, приветствую!

    Работаю с Xenu's Link Sleuth, спасибо за совет.

    Если есть возможность подскажите, как избавиться от «иероглифов» при выгрузке репорта?

  18. AlexNote | Декабрь 19, 2008 в 17:10

    Jfoton:

    Увы, никак. Программа корректно работает со всеми сайтами, правильно проверяет пути, но показывать тайтлы на кириллице не умеет.

  19. Jfoton | Декабрь 20, 2008 в 00:19 | @

    AlexNote:

    Ок, понял.

    На семинаре Сергея Кошкина, он говорил, что вылечить можно, но не сказал как.)

    Если вдруг «таблетка» найдется, напишите здесь, заглядываю частенько к вам.)

  20. AlexNote | Декабрь 20, 2008 в 02:07

    Jfoton:

    Я вряд ли найду ее — мне она не нужна. Проблема с заголовками не особо мешает определить битые ссылки и не относится к разряду критчных. Кроме того, можно попробовать плагин в соседнем посте, он выполняет те же функции.

Трекбеки

  1. Плагин Broken Link Checker | AlexNote

    [...] я познакомил (тех, кто еще не был знаком) с хорошей дектопной утилитой для проверки ссылок вашего блога или сайта. А сегодня [...]

Вам есть, что сказать? Так не молчите!

 

Комментарии по RSS Трекбек URL