Проверка и удаление битых ссылок на сайте

Битые ссылки — что это и как они появляются на сайте?

Как удалить битые ссылки

Битые — это ссылки, ведущие в никуда, то есть на несуществующую страницу или несуществующий сайт.

Пути их появления:

  • Ошибка при написании адреса
  • Статья, на которую ссылаются, была удалена или перемещена
  • Сайт (блог) прекратил своё существование.

Но не столь важно, как они появляются, важнее знать, как их найти и удалить.

Почему нужно удалять битые ссылки?

В первую очередь потому, что это ухудшает поведенческие факторы на Вашем сайте. Представьте сами то разочарование, которое получает посетитель, кликнув на заинтересовавшее его название, а попав на страницу 404. Даже если эта страница призывает его посмотреть что-то другое, на ту же тему, не факт, что он будет читать это другое, а не уйдет с Вашего сайта. И хорошо еще, если уйдёт не навсегда.

Как искать битые ссылки?

Я знаю, что многие для этих целей устанавливают соответствующий плагин. Но я предпочитаю обходиться без плагинов там, где это возможно. Тем более, что мне не раз задавали вопросы в комментариях: почему плагин выдает вот такие-то ссылки как битые, хотя они рабочие. А просто любой плагин может некорректно работать с какой-то темой или конфликтовать с другими установленными плагинами.

Поэтому я использую вместо плагина онлайн-сервис Free Broken Link Checker , привыкла к нему, и он меня устраивает (хотя сначала показался не совсем простым).

Алгоритм поиска битых ссылок:

  1. Заходим на сервис brokenlinkcheck.com.Сервис проверки битых ссылок
  2. Вводим в форму имя домена (обращаем внимание, чтобы не было удвоения http и удаляем все слэши).
  3. Нажимаем кнопку «Find Broken Links».
  4. Вводим каптчу.Вводим каптчу на сервисе
  5. Ставим точку во второй позиции, чтобы нам сообщалось обо всех вхождениях неправильного адреса.
  6. Нажимаем кнопку «Find Broken Links Now».
  7. Ждем, когда поиск закончится.
  8. После окончания процесса поиска мы видим таблицу вида:Выдача битых ссылок
    • во втором столбике мы найдем URL несуществующих (или по другой причине не найденных) страниц
    • в третьем столбце Url и Src (щелкнув по Url, мы зайдем на страницу сайта, на которой обнаружен ошибочный адрес; щелкнув по Src, получим исходный код этой страницы, в котором поиском можно найти нужный адрес)
    • в последнем столбце нам выдается код ответа сервера. В частности, 404 – это, как Вы знаете, страница не существует, а 414, который мы видим в моём случае, – слишком длинный URL (у меня эта ошибка возникает из-за русских букв в урлах, от которых я избавляюсь, но пока еще не избавилась до конца).

Как удалить битые ссылки?

Я покажу, как найти на сайте и исправить эти ошибки.

  1. Первая строка (код ответа сервера 414):
    • Нажимаю на Url, попадаю на карту блога, в которой найти ошибочную ссылку нереально.
    • Поэтому я жму на Src, получаю исходный код страницы.Поиск ошибочного адреса в коде страницы
    • Во втором столбце таблицы «горячими клавишами» Ctrl+A выделяю всю ссылку (она у меня о-очень длиннаяLaughing), и CTRL+C копирую её.
    • Иду в исходный код. Ctrl+F – вызываю окно поиска, Ctrl+V – копирую ссылку в это окно.
    • Сразу же выделяется искомый адрес. Теперь нужно понять, к чему он относится. Я вижу, что это у меня вложенные категории, которые названы кириллицей и интерпретируются длинным кодом из непонятных символов (о чем я писала в статье про ЧПУ и плагин RusToLat). Иду на сайт и исправляю адреса всех категорий на латиницу.
  2. Следующую строку я возьму, для примера, с кодом ответа сервера  404:
    • Нажимаю на Url и ищу на открытой странице ссылку. А поскольку она с чужим адресом, то, скорее всего, её надо искать в комментариях, так что идем туда. Возможны два варианта:
      • Имя комментатора является ссылкой на сайт, которого уже не существует в сети. В этом случае нажимаем на «Редактировать комментарий», удаляем там URL, нажимаем на «Обновление», и проблема решена.
      • Ссылка на статью, которой уже нет, оставлена с помощью плагина CommentLuv. В прошлой статье я описала, как изменить комментарий в этом случае (второй путь).
  3. Возможен вариант, когда Вы при перелинковке сделали ссылку на какую-то свою статью, а потом эту статью удалили. Тогда в режиме редактирования статьи эта ссылка просто удаляется.
  4. После исправления всех ошибок снова запускайте проверку на сервисе Free Broken Link Checker, чтобы убедиться, что Вы ничего не пропустили.
  5. Регулярно делайте такие проверки.

Вот так мы избавляемся от битых ссылок на сайте.

TEXT.RU - 100.00%

И в заключение статьи — видеоролик о братьях наших меньших:

Проверка и удаление битых ссылок на сайте: 45 комментариев

  • 15 октября 2013 в 21:48
    Permalink

    Я также использую сервис Broken Link Checker. Это отличный помощник для вебмастера! Самое интересное, что сервис и плагин выдают иногда разные результаты.Спасибо за полезную информацию.

    • 16 октября 2013 в 12:41
      Permalink

      Плагин иногда показывает битые ссылки там, где их нет. За сервисом я такого не замечала.

  • 16 октября 2013 в 17:29
    Permalink

    A у меня почти все страницы показал как 404…я уже устала от мелькания и просто нажала на кнопку «стоп»
    Но ведь такого просто быть не может…

    • 16 октября 2013 в 22:27
      Permalink

      Мила, у Вас сервис выдает несуществующие теги (метки). То есть, они есть в перечислении под статьями, а в перечне самих меток их, по-видимому, нет. Например, метки: соус, помидоры… Проверьте. Не останавливайте сервис, не обязательно на него смотреть во время работы. Либо проверяйте по небольшим частям. Но битых ссылок у Вас на сайте много, придется их все вылавливать.

  • 17 октября 2013 в 16:49
    Permalink

    Спасибо, очень полезная и информативная статья, даже не задумывался об этом раньше.

  • 22 октября 2013 в 11:20
    Permalink

    Спасибо за информацию. У меня в двух случаях вышел код 502 и в одном «плохой хозяин». Что бы это значило, не подскажете?

    • 22 октября 2013 в 13:38
      Permalink

      Николай, чаще всего, это временные ошибки, и не Ваши, а сервера. Попробуйте открыть эти ссылки напрямую и посмотрите, открываются ли они. И если не открываются и это ссылки с Вашего сайта, то пишите хостеру. А если не открываются, и не Ваши, можно их удалить сразу, а можно переждать какое-то время и проверить ешё раз

  • 24 января 2014 в 22:18
    Permalink

    Огромное спасибо за интересную информацию !
    Желаю Вам всех благ !
    С уважением Анатолий.

  • 6 февраля 2014 в 8:54
    Permalink

    Я о битых ссылках вообще не знал. Слышал ухом кое-что. Решил побольше узнать об этом. Многие мои статьи были на первых
    страницах. Сейчас вообще их не вижу. Придеться заняться битыми ссылками. Вылавливать уже пробовал сервером brokenlinkcheck.com но удалять пока не получилось еще.
    Очень полезная информация спасибо.

  • 21 февраля 2014 в 0:21
    Permalink

    Спасибо за полезный материал. Сам пользуюсь плагин и у самого много битых ссылок из-за того что все картинки на русском языке, а это считается битая ссылка. В вашей статье узнал новую для себя информацию. Сегодня попробую испробовать данный сервис для уменьшение планирования на своём сайте, на один 🙂 заодно и проверю работ способность сервиса.

  • 28 февраля 2014 в 18:45
    Permalink

    Битые ссылки надо постоянно удалять, спасибо за подробную инструкцию. Будем применять!

  • 2 марта 2014 в 21:54
    Permalink

    Спасибо за статью, сразу проверил. Нашёл 1 битую ссылку. Сервис взял в закладки. Сам пользуюсь плагином Broken Links. Буду его отключать.

  • 28 апреля 2014 в 18:41
    Permalink

    спасибо, весь инет перелопатил, и только у Вас нашел такой полезный сервис, сразу в Закладки))) Спасибо еще раз…

  • 30 апреля 2014 в 11:31
    Permalink

    Нина, этот же сервис, после проверки на битые ссылки, выдал мне совет оптимизировать карту сайта и тут же на сервисе они её и создают. Стоит ли доверять этому предложению- Вы сталкивались с подобным ?

    • 30 апреля 2014 в 19:48
      Permalink

      Впервые слышу о чем-то подобном. Поэтому даже и не знаю, как ответить на Ваш вопрос. У меня карту сайта создает плагин, надеюсь, что какую надо. Существуют скрипты, чтобы создать ее без плагина, так что зачем нам посторонний сервис для этого. Битые ссылки он ищет замечательно, вот пусть этим и занимается. Такое мое мнение.

  • 9 мая 2014 в 9:38
    Permalink

    Спасибо большое. Тоже проверил при помощи данного сервиса свой блог.

  • 28 мая 2014 в 7:32
    Permalink

    Малоинформативно, сервис гавно, просто пиар. Удалить ссылку, да ничкто прямую ссылку не ставит, а гугл может приписать если ресурс даже был удален.

    Дизлайк

    • 28 мая 2014 в 16:21
      Permalink

      Вы вообще понимаете, что такое битые ссылки? При чем тут: ставит кто прямые ссылки или нет. Я регулярно удаляю битые ссылки из комментариев: человек написал комментарий, поставив УРЛ своего сайта, а потом его забросил… Это самая частая причина появления битых ссылок..
      Малоинформативно? А какая еще Вам нужна информация, когда всё по шагам расписано?
      Сервис Вам не нравится? Это Ваше личное мнение: не нравится, и ладно.
      Пиар? Пиар чего? Мне что, за рекламу этого сервиса деньги платят? Просто даже смешно!..
      Да сколько угодно ставьте свои дизлайки, кому нравятся мои статьи, те будут их читать. А кому не нравятся, значит, не мои читатели. Ищите другие сайты, которые понравятся

  • 7 июля 2014 в 13:00
    Permalink

    Спасибо за полезную информацию. занесла сайт в закладки.

  • 24 июля 2014 в 10:55
    Permalink

    Относительно битых ссылок на сайте также есть неплохая статья тут kvinta-a.ru/bitye-ssylki-na-sayte

  • 11 августа 2014 в 22:18
    Permalink

    Нина, я опять к Вам за помощью. 😳 Проверила блог на этом сервисе, хотя думала, раз блог совсем молодой, битых ссылок быть не должно. Но было найдено целых 75 404-х ошибок, причем все выглядят вот так: _http://zolushka-new.com/comments/feed. А одна строчка отличалась, и около нее было написано не 404-я ошибка, а «bad host». Прокомментируйте, пожалуйста, если можно.

    • 12 августа 2014 в 16:32
      Permalink

      Алевтина, встречный вопрос: Вы проводили какие-то мероприятия по удалению дублей, о которых писал Александр Борисов? Если да, то Ваши 404 ошибки — это отголоски этих мероприятий и ничего с этим делать не нужно.
      «bad host» означает, что в момент проверки на том хостинге были какие-то проблемы. Запишите себе эту ошибку и дату проверки. В следующий раз, когда будете проверять (рекомендую это делать регулярно), посмотрите, останется ли та ошибка. Если останется, например, через неделю, тогда удаляйте эту ссылку как битую. Но думаю, что все нормализуется.

  • 12 августа 2014 в 17:08
    Permalink

    Спасибо огромное, Нина, успокоили. Да, действительно, дубли удаляла.

  • 27 августа 2014 в 15:25
    Permalink

    Вау, а я только плагином пользовался и он не совсем корректно работал!) Про сервис не знал, спасибо за наводку!
    Статью добавил в закладки!))

  • 29 августа 2014 в 16:38
    Permalink

    А я недавно поставила плагин и вчера тоже смотрела битые ссылки на сайте. Многие-от того, что знакомые забросили свои блоги. Есть и в комментариях тоже битые ссылки. надо посмотреть этот сервис, если что-просто плагин удалить потом, да? Нина, а если я, например, писала в своей статье и давала ссылки на те блоги, которых нет, что надо тоже эти ссылки удалять?

    • 29 августа 2014 в 17:01
      Permalink

      Да, Оля, все ссылки, ведущие в никуда, надо удалять. Плагин можно удалить, он часто глючит

  • 29 августа 2014 в 16:45
    Permalink

    попробовала войти на сервер-ввела доменное имя сайта. Нажала на кнопку, но ничего не происходит. написано-подтвердите действие -нажала Ок, но не было ни капчи, ничего. Попробую еще позже.

    • 29 августа 2014 в 17:02
      Permalink

      Оля, я сейчас вошла на сервис, все нормально. Работает

  • 21 ноября 2014 в 21:04
    Permalink

    Онлайн сервисы конечно просты тем, что ничего не надо скачивать и ставить себе на компьютер. Но они хороши для маленьких проектов. Для больших там просят либо заплатить за платный аккаунт, либо обработка будет идти ооочень долго.
    Я предпочитаю все-таки десктопные приложения для целей проверки сайта на предмет битых ссылок. Очень нравится инструмент Xenu. Также некоторые интересные приемы описаны в книге «Поисковая оптимизация. Практическое руководство по продвижению сайта в Интернете» (http://goo.gl/G5b1ar)

    • 22 ноября 2014 в 9:48
      Permalink

      Не сомневаюсь, что для любой задачи существует не одно-единственное решение. Но, во-первых, мой блог все-таки для начинающих, а среди них вряд ли есть владельцы крупных проектов. А во-вторых, я пишу только о том, чем пользуюсь сама, а Xenu я не пользовалась. Но за совет спасибо, может, кому-то и пригодится.

  • 6 декабря 2014 в 6:12
    Permalink

    Нина, спасибо за науку по удалению битых ссылок. Проверила свой сайт… О, Боже, надо будет плотно поработать 🙁

  • 7 мая 2015 в 18:06
    Permalink

    Спасибо за интересную статью, попробую поиграться со своим сайтом) 😛

    • 8 мая 2015 в 14:42
      Permalink

      Поиграйтесь 🙂 Если давно не проверяли на «битые» ссылки, думаю, много «интересного» найдете

  • 8 мая 2015 в 14:47
    Permalink

    Вы знаете все не так плохо, всего 6 ссылок нашел плагин! Ну и на этом спасибо 😯

    • 8 мая 2015 в 15:16
      Permalink

      Плагин или сервис? Я-то, вроде, про сервис писала 🙂 Ну что ж, 6 — это немного, у меня в первый раз было гораздо больше

  • 15 июня 2015 в 21:38
    Permalink

    Всем привет. Пару месяцев назад взял на продвижение сайт. В индексе гугла было всего 100 страниц (в яндексе пару тыс) и соответственно нет трафика. У вебмастере писалось о наложении санкций. После внутренней оптимизации санкции странным образом сразу пропали, но страницы в индекс не добавились. Сначала думал до оптимизации что дело в поломанной карте сайта, но исправление не помогло. Полез в ссылочную, оказалось что скорее всего санкции были за пару тыс ссылок с двух гс, блоки со ссылками спрятаны через css, ведут на уже несуществующие страницы сайта, большая часть c анкорами «(число-цена) р.». Закинул в disallow. Пока ничего не помогает, одни и те же страницы в индексе, остальные не добавляются, с роботсом все норм, яндекс хорошо индексирует и трафик норм. Щас думаю еще попробовать сделать редирект всех несуущ. страниц, на которые идут ссылки, на главную или так как сайты гс — на 404 страницу, чтоб не добавлялись ошибки в вебмастере о невозможности проиндексировать страницы. Какие могут быть еще варианты? Буду благодарен за советы

    • 16 июня 2015 в 15:24
      Permalink

      С такой ситуацией я не сталкивалась. Думаю, что ссылки на несуществующие статьи надо удалить из индексирования в вебмастере гугла (хотя пару тысяч страниц удалять вручную — не представляю даже) и редирект на страницу 404 тоже сделать. Только знаю по опыту, что гугл очень долго реагирует на любые исправления, поэтому однажды (и не однажды) удаленные ссылки вдруг возникают в индексе снова. Возможно, у кого-нибудь из читателей найдется лучший вариант.

  • 16 июня 2015 в 18:32
    Permalink

    Поправка — ссылающиеся сайты не гс, а достаточно посящаемые и с хорошими показателями (санкции скорее всего были за спрятанные ссылки и анкоры). Ссылок на несущ страницы и так нет в индексе, но ошибок куча в вебмастере о невозможности проиндексировать эти страницы.

    • 16 июня 2015 в 21:20
      Permalink

      Тогда, видимо, только редирект. А куда: на 404 или главную — это Вам решать. Мне кажется, что все-таки 404, две тысячи редиректов на главную гуглу может не понравиться

  • 21 мая 2016 в 20:54
    Permalink

    Лично я для проверки битых ссылок на сайте предпочитаю Smart SEO Tool. Эта программа её много всякого разного проверяет. Ещё использую её для анализа сайтов конкурентов. Раньше тоже любил Xenu Link, потом был Netpeak Spider. Сейчас ими не пользуюсь.

Обсуждение закрыто.