Битые ссылки – что это и как они появляются на сайте?
Битые – это ссылки, ведущие в никуда, то есть на несуществующую страницу или несуществующий сайт.
Пути их появления:
- Ошибка при написании адреса
- Статья, на которую ссылаются, была удалена или перемещена
- Сайт (блог) прекратил своё существование.
Но не столь важно, как они появляются, важнее знать, как их найти и удалить.
Почему нужно удалять битые ссылки?
В первую очередь потому, что это ухудшает поведенческие факторы на Вашем сайте. Представьте сами то разочарование, которое получает посетитель, кликнув на заинтересовавшее его название, а попав на страницу 404. Даже если эта страница призывает его посмотреть что-то другое, на ту же тему, не факт, что он будет читать это другое, а не уйдет с Вашего сайта. И хорошо еще, если уйдёт не навсегда.
Как искать битые ссылки?
Я знаю, что многие для этих целей устанавливают соответствующий плагин. Но я предпочитаю обходиться без плагинов там, где это возможно. Тем более, что мне не раз задавали вопросы в комментариях: почему плагин выдает вот такие-то ссылки как битые, хотя они рабочие. А просто любой плагин может некорректно работать с какой-то темой или конфликтовать с другими установленными плагинами.
Поэтому я использую вместо плагина онлайн-сервис Free Broken Link Checker , привыкла к нему, и он меня устраивает (хотя сначала показался не совсем простым).
Алгоритм поиска битых ссылок:
- Заходим на сервис brokenlinkcheck.com.
- Вводим в форму имя домена (обращаем внимание, чтобы не было удвоения http и удаляем все слэши).
- Нажимаем кнопку «Find Broken Links».
- Вводим каптчу.
- Ставим точку во второй позиции, чтобы нам сообщалось обо всех вхождениях неправильного адреса.
- Нажимаем кнопку «Find Broken Links Now».
- Ждем, когда поиск закончится.
- После окончания процесса поиска мы видим таблицу вида:
- во втором столбике мы найдем URL несуществующих (или по другой причине не найденных) страниц
- в третьем столбце Url и Src (щелкнув по Url, мы зайдем на страницу сайта, на которой обнаружен ошибочный адрес; щелкнув по Src, получим исходный код этой страницы, в котором поиском можно найти нужный адрес)
- в последнем столбце нам выдается код ответа сервера. В частности, 404 – это, как Вы знаете, страница не существует, а 414, который мы видим в моём случае, – слишком длинный URL (у меня эта ошибка возникает из-за русских букв в урлах, от которых я избавляюсь, но пока еще не избавилась до конца).
Как удалить битые ссылки?
Я покажу, как найти на сайте и исправить эти ошибки.
- Первая строка (код ответа сервера 414):
- Нажимаю на Url, попадаю на карту блога, в которой найти ошибочную ссылку нереально.
- Поэтому я жму на Src, получаю исходный код страницы.
- Во втором столбце таблицы «горячими клавишами» Ctrl+A выделяю всю ссылку (она у меня о-очень длинная
), и CTRL+C копирую её.
- Иду в исходный код. Ctrl+F – вызываю окно поиска, Ctrl+V – копирую ссылку в это окно.
- Сразу же выделяется искомый адрес. Теперь нужно понять, к чему он относится. Я вижу, что это у меня вложенные категории, которые названы кириллицей и интерпретируются длинным кодом из непонятных символов (о чем я писала в статье про ЧПУ и плагин RusToLat). Иду на сайт и исправляю адреса всех категорий на латиницу.
- Следующую строку я возьму, для примера, с кодом ответа сервера 404:
- Нажимаю на Url и ищу на открытой странице ссылку. А поскольку она с чужим адресом, то, скорее всего, её надо искать в комментариях, так что идем туда. Возможны два варианта:
- Имя комментатора является ссылкой на сайт, которого уже не существует в сети. В этом случае нажимаем на «Редактировать комментарий», удаляем там URL, нажимаем на «Обновление», и проблема решена.
- Ссылка на статью, которой уже нет, оставлена с помощью плагина CommentLuv. В прошлой статье я описала, как изменить комментарий в этом случае (второй путь).
- Нажимаю на Url и ищу на открытой странице ссылку. А поскольку она с чужим адресом, то, скорее всего, её надо искать в комментариях, так что идем туда. Возможны два варианта:
- Возможен вариант, когда Вы при перелинковке сделали ссылку на какую-то свою статью, а потом эту статью удалили. Тогда в режиме редактирования статьи эта ссылка просто удаляется.
- После исправления всех ошибок снова запускайте проверку на сервисе Free Broken Link Checker, чтобы убедиться, что Вы ничего не пропустили.
- Регулярно делайте такие проверки.
Вот так мы избавляемся от битых ссылок на сайте.
И в заключение статьи – видеоролик о братьях наших меньших:
Комментарии
Я также использую сервис Broken Link Checker. Это отличный помощник для вебмастера! Самое интересное, что сервис и плагин выдают иногда разные результаты.Спасибо за полезную информацию.
Плагин иногда показывает битые ссылки там, где их нет. За сервисом я такого не замечала.
A у меня почти все страницы показал как 404…я уже устала от мелькания и просто нажала на кнопку “стоп”
Но ведь такого просто быть не может…
Мила, у Вас сервис выдает несуществующие теги (метки). То есть, они есть в перечислении под статьями, а в перечне самих меток их, по-видимому, нет. Например, метки: соус, помидоры… Проверьте. Не останавливайте сервис, не обязательно на него смотреть во время работы. Либо проверяйте по небольшим частям. Но битых ссылок у Вас на сайте много, придется их все вылавливать.
Спасибо, очень полезная и информативная статья, даже не задумывался об этом раньше.
Нина, этот сервис мне нравится, буду проверять свой сайт.
Мне тоже он нравится, потому им и пользуюсь
Спасибо за информацию. У меня в двух случаях вышел код 502 и в одном “плохой хозяин”. Что бы это значило, не подскажете?
Николай, чаще всего, это временные ошибки, и не Ваши, а сервера. Попробуйте открыть эти ссылки напрямую и посмотрите, открываются ли они. И если не открываются и это ссылки с Вашего сайта, то пишите хостеру. А если не открываются, и не Ваши, можно их удалить сразу, а можно переждать какое-то время и проверить ешё раз
Огромное спасибо за интересную информацию !
Желаю Вам всех благ !
С уважением Анатолий.
Я о битых ссылках вообще не знал. Слышал ухом кое-что. Решил побольше узнать об этом. Многие мои статьи были на первых
страницах. Сейчас вообще их не вижу. Придеться заняться битыми ссылками. Вылавливать уже пробовал сервером brokenlinkcheck.com но удалять пока не получилось еще.
Очень полезная информация спасибо.
Спасибо за полезный материал. Сам пользуюсь плагин и у самого много битых ссылок из-за того что все картинки на русском языке, а это считается битая ссылка. В вашей статье узнал новую для себя информацию. Сегодня попробую испробовать данный сервис для уменьшение планирования на своём сайте, на один
заодно и проверю работ способность сервиса.
Битые ссылки надо постоянно удалять, спасибо за подробную инструкцию. Будем применять!
Спасибо за статью, сразу проверил. Нашёл 1 битую ссылку. Сервис взял в закладки. Сам пользуюсь плагином Broken Links. Буду его отключать.
спасибо, весь инет перелопатил, и только у Вас нашел такой полезный сервис, сразу в Закладки))) Спасибо еще раз…
Я очень рада, Сергей, что помогла Вам
Нина, этот же сервис, после проверки на битые ссылки, выдал мне совет оптимизировать карту сайта и тут же на сервисе они её и создают. Стоит ли доверять этому предложению- Вы сталкивались с подобным ?
Впервые слышу о чем-то подобном. Поэтому даже и не знаю, как ответить на Ваш вопрос. У меня карту сайта создает плагин, надеюсь, что какую надо. Существуют скрипты, чтобы создать ее без плагина, так что зачем нам посторонний сервис для этого. Битые ссылки он ищет замечательно, вот пусть этим и занимается. Такое мое мнение.
Спасибо большое. Тоже проверил при помощи данного сервиса свой блог.
Малоинформативно, сервис гавно, просто пиар. Удалить ссылку, да ничкто прямую ссылку не ставит, а гугл может приписать если ресурс даже был удален.
Дизлайк
Вы вообще понимаете, что такое битые ссылки? При чем тут: ставит кто прямые ссылки или нет. Я регулярно удаляю битые ссылки из комментариев: человек написал комментарий, поставив УРЛ своего сайта, а потом его забросил… Это самая частая причина появления битых ссылок..
Малоинформативно? А какая еще Вам нужна информация, когда всё по шагам расписано?
Сервис Вам не нравится? Это Ваше личное мнение: не нравится, и ладно.
Пиар? Пиар чего? Мне что, за рекламу этого сервиса деньги платят? Просто даже смешно!..
Да сколько угодно ставьте свои дизлайки, кому нравятся мои статьи, те будут их читать. А кому не нравятся, значит, не мои читатели. Ищите другие сайты, которые понравятся
Спасибо за полезную информацию. занесла сайт в закладки.
Относительно битых ссылок на сайте также есть неплохая статья тут kvinta-a.ru/bitye-ssylki-na-sayte
А у меня что, плохая или недостаточно полная?
Нина, я опять к Вам за помощью.
Проверила блог на этом сервисе, хотя думала, раз блог совсем молодой, битых ссылок быть не должно. Но было найдено целых 75 404-х ошибок, причем все выглядят вот так: _http://zolushka-new.com/comments/feed. А одна строчка отличалась, и около нее было написано не 404-я ошибка, а “bad host”. Прокомментируйте, пожалуйста, если можно.
Алевтина, встречный вопрос: Вы проводили какие-то мероприятия по удалению дублей, о которых писал Александр Борисов? Если да, то Ваши 404 ошибки – это отголоски этих мероприятий и ничего с этим делать не нужно.
“bad host” означает, что в момент проверки на том хостинге были какие-то проблемы. Запишите себе эту ошибку и дату проверки. В следующий раз, когда будете проверять (рекомендую это делать регулярно), посмотрите, останется ли та ошибка. Если останется, например, через неделю, тогда удаляйте эту ссылку как битую. Но думаю, что все нормализуется.
Спасибо огромное, Нина, успокоили. Да, действительно, дубли удаляла.
Вау, а я только плагином пользовался и он не совсем корректно работал!) Про сервис не знал, спасибо за наводку!
Статью добавил в закладки!))
Да, на этот плагин многие жалуются
А я недавно поставила плагин и вчера тоже смотрела битые ссылки на сайте. Многие-от того, что знакомые забросили свои блоги. Есть и в комментариях тоже битые ссылки. надо посмотреть этот сервис, если что-просто плагин удалить потом, да? Нина, а если я, например, писала в своей статье и давала ссылки на те блоги, которых нет, что надо тоже эти ссылки удалять?
Да, Оля, все ссылки, ведущие в никуда, надо удалять. Плагин можно удалить, он часто глючит
попробовала войти на сервер-ввела доменное имя сайта. Нажала на кнопку, но ничего не происходит. написано-подтвердите действие -нажала Ок, но не было ни капчи, ничего. Попробую еще позже.
Оля, я сейчас вошла на сервис, все нормально. Работает
Онлайн сервисы конечно просты тем, что ничего не надо скачивать и ставить себе на компьютер. Но они хороши для маленьких проектов. Для больших там просят либо заплатить за платный аккаунт, либо обработка будет идти ооочень долго.
Я предпочитаю все-таки десктопные приложения для целей проверки сайта на предмет битых ссылок. Очень нравится инструмент Xenu. Также некоторые интересные приемы описаны в книге “Поисковая оптимизация. Практическое руководство по продвижению сайта в Интернете” (http://goo.gl/G5b1ar)
Не сомневаюсь, что для любой задачи существует не одно-единственное решение. Но, во-первых, мой блог все-таки для начинающих, а среди них вряд ли есть владельцы крупных проектов. А во-вторых, я пишу только о том, чем пользуюсь сама, а Xenu я не пользовалась. Но за совет спасибо, может, кому-то и пригодится.
Нина, спасибо за науку по удалению битых ссылок. Проверила свой сайт… О, Боже, надо будет плотно поработать
Спасибо за интересную статью, попробую поиграться со своим сайтом)
Поиграйтесь
Если давно не проверяли на “битые” ссылки, думаю, много “интересного” найдете
Вы знаете все не так плохо, всего 6 ссылок нашел плагин! Ну и на этом спасибо
Плагин или сервис? Я-то, вроде, про сервис писала
Ну что ж, 6 – это немного, у меня в первый раз было гораздо больше
Всем привет. Пару месяцев назад взял на продвижение сайт. В индексе гугла было всего 100 страниц (в яндексе пару тыс) и соответственно нет трафика. У вебмастере писалось о наложении санкций. После внутренней оптимизации санкции странным образом сразу пропали, но страницы в индекс не добавились. Сначала думал до оптимизации что дело в поломанной карте сайта, но исправление не помогло. Полез в ссылочную, оказалось что скорее всего санкции были за пару тыс ссылок с двух гс, блоки со ссылками спрятаны через css, ведут на уже несуществующие страницы сайта, большая часть c анкорами “(число-цена) р.”. Закинул в disallow. Пока ничего не помогает, одни и те же страницы в индексе, остальные не добавляются, с роботсом все норм, яндекс хорошо индексирует и трафик норм. Щас думаю еще попробовать сделать редирект всех несуущ. страниц, на которые идут ссылки, на главную или так как сайты гс – на 404 страницу, чтоб не добавлялись ошибки в вебмастере о невозможности проиндексировать страницы. Какие могут быть еще варианты? Буду благодарен за советы
С такой ситуацией я не сталкивалась. Думаю, что ссылки на несуществующие статьи надо удалить из индексирования в вебмастере гугла (хотя пару тысяч страниц удалять вручную – не представляю даже) и редирект на страницу 404 тоже сделать. Только знаю по опыту, что гугл очень долго реагирует на любые исправления, поэтому однажды (и не однажды) удаленные ссылки вдруг возникают в индексе снова. Возможно, у кого-нибудь из читателей найдется лучший вариант.
Поправка — ссылающиеся сайты не гс, а достаточно посящаемые и с хорошими показателями (санкции скорее всего были за спрятанные ссылки и анкоры). Ссылок на несущ страницы и так нет в индексе, но ошибок куча в вебмастере о невозможности проиндексировать эти страницы.
Тогда, видимо, только редирект. А куда: на 404 или главную – это Вам решать. Мне кажется, что все-таки 404, две тысячи редиректов на главную гуглу может не понравиться
Лично я для проверки битых ссылок на сайте предпочитаю Smart SEO Tool. Эта программа её много всякого разного проверяет. Ещё использую её для анализа сайтов конкурентов. Раньше тоже любил Xenu Link, потом был Netpeak Spider. Сейчас ими не пользуюсь.