Как удалить дубли страниц replytocom WordPress
Сегодня я собиралась написать статью совсем на другую тему. Но «подкинули» ссылку про дубли страниц replytocom, которую я не смогла проигнорировать.
Дело в том, что на обоих моих блогах WordPress количество проиндексированных Google страниц очень сильно превышает количество статей и страниц вместе взятых.
Я уже давно понимала, что дело в дублях, только понять не могла, откуда они берутся, ведь я все-все лишнее закрыла в файле robots.txt.
Так вот, я очень сильно заблуждалась относительно этого (и знаю, что так же заблуждаются почти все блоггеры: начинающие и не совсем). Оказывается, не все надо закрывать в файле robots.txt, а, скорее, наоборот.
Почему я так, на 100% поверила автору? Потому что автор – известная в блогосфере личность: Александр Борисов. Кто его не знает, как раз будет возможность познакомиться
Я очень внимательно прочитала статью, посмотрела видео, которое находится в статье и пошла проверять свои блоги так, как он показал. Но интересно то, что когда я проверила свои блоги, набрав в браузере
site:mojbiznes.ru replytocom,
то получила сообщение, что дублей с replytocom нет:
То же самое и с другим блогом. Однако, открывая ссылку “Ответить” в комментариях, я получала полную копию статьи, только с другим URL, из чего следует, что дубли все-таки есть.
Поэтому я не успокоилась этим сообщением, а пошла в инструменты вебмастера Google. Нажав в меню Сканирование → Параметры URL, я получила, что количество отслеживаемых URL, содержащих в названии replytocom, – 1353.
Это подтвердило, что дубли страниц replytocom есть, но почему-то Google не показывает их по запросу. Это ведомо только ему одному, наверно
На этом я свою прелюдию заканчиваю, и предоставляю слово автору статьи.
Уверена, что статья окажется Вам полезной, и Вы скажете спасибо Александру (и мне за то, что навела Вас на неё).
Комментарии
Добрый день, Нина! Спасибо за статью. Я, конечно, предупреждена была А. Борисовым (я подписана и на его рассылку) еще раньше, чем появилась статья, но все равно я благодарна тебе за то, что ты также, как и он, спешишь предупредить людей об опасности. На одном из сайтов о нем один из посетителей отзывался несправедливо. Я вступилась за А. Так мне сказали, что можно дублей избежать, лишь поставив 301 редирект. Честно говоря, я не поняла, о чем идет речь. Может и такой способ хорош для борьбы с дублями? Я свой блог проверила в Гугле, он показал, что у меня тоже ничего не найдено. Правда, у меня и опубликовано-то лишь 26 статей. Но теперь, почитав твою статью, пойду проверю через инструменты вебмастера.
Про 301 редирект и Александр тоже пишет. Но это только один из способов, который старые дубли не удаляет из индекса.
А по поводу того, что кто-то плохо о нем написал… Каждый хочет быть ГУРУ и не хочет, чтобы таковым считали кого-то другого
Вот и у меня Гугл отвечает, что дублей нет…Но то , что проблема есть- чувствую нутром, а разобраться пока что ума не хватает
Я тоже после выхода его статьи занималась исправлением роботса, и прописыванием редиректов. Так как и ты, видела что в гугле проиндексированных страниц намного больше, чем статей, и тоже ломала голову откуда взялись эти страницы. А ты уже исправила свои блоги? Я вижу ты не отключала древовидные комментарии. Я отключила, и поставила плагин для ответов. Очень удобный, в настройках можно задавать цвет фона по своему усмотрению. Правда дата отображается не корректно, думаю вообще её убрать из ответов.
Я не отключила древовидные комментарии, потому что прописала в вебмастере гугла удаление файлов replytocom и в файл .htaccess вставила редирект. Я думаю, что этих мер вполне достаточно. Новые дубли не будут образовываться из-за редиректа, а старые удалятся в вебмастере.
/dubli-stranic-replytocom-wordpress.html#respond
/dubli-stranic-replytocom-wordpress.html#comment-7304
Вот две твои одинаковые страницы с разными адресами. Ты какой редирект прописала 301 или 404?
Ира, выудила твой коммент. Хорошо хоть, что ушел на модерацию, а не в спам, потому что спам я перестала просматривать, а удаляю, не глядя.
Теперь по сути вопроса. Я задавала вопрос Борисову относительно #respond. И были такие же вопросы от других. Он отвечает всем, что то, что после #, поисковики не индексируют, то есть дублей в этом случае нет. Дубли создаются конструкцией ?replytocom. Поверим ему, так как ничего другого не остается
Отлично! Поверим Борисову на слово. Тем более, что на него работают профессионалы своего дела.
Нина, а как ты удалила replytocom в панели веб мастера. Или ты не удаляла? У меня стоит сканирование на усмотрение робота, а у тебя какой параметр?
Ира, я не удаляла. подразумевается, что они удалятся постепенно сами. Но, чувствую, что это постепенно будет очень долго. Впрочем, и Борисов об этом пишет. На усмотрение робота стоит по умолчанию. Борисов тоже рекомендует так же поставить. Все остальные авторы, статьи которых мне попадались на эту тему, рекомендуют поставить “Никакие URL”. Честно говоря, не знаю, кому верить. И думаю, что невозможно 100%-но сказать, как будет правильнее, потому что надо разбираться очень глубоко в алгоритмах работы поисковых роботов. А разбираются в этом, наверно, только те, кто эти алгоритмы программировал, да и то только в части своего куска. Так что, я поставила, как советует большинство: “Никакие уРЛы”.
Хорошо, теперь будем отслеживать количество страниц в инструментах веб мастера. И делиться результатами. Если у тебя эти страницы уйдут быстрее, то я тоже поставлю как у тебя. А если мои быстрее, то ты поставишь на усмотрение робота. Договорились?
Нина, у меня к тебе ещё вопрос. Я читаю твои твиты, у тебя все комментарии с блога попадают в твиттер. Ты это так специально сделала? И как, с помощью плагина или скрипта?
Ира, об этом я написала здесь: /kak-dobavit-kommentarii-v-widget-ot-twitter.html
Эти сопли replytocom просто убивают блог
Спасибо большое, что рассказали еще и о таком … сюрпризе. Надо заняться исправлением.
Все никак не дойду до удаления дублей. Я зашла, посмотрела, записала цифору и пока наблюдаю, насколько быстро они увеличиваются.
Кстати гугл индексирует быстро, а вот из поиска от него число посетителей резко уменьшилось за полгода. да и в ТОпе число страниц упало резко. так что торопиться мне надо. Вот дела в реале порешаю и сяду за техпроблемы блога. До сентября успеть надо. А то планирую конкурсы проводить. там уже будет не до этого.
Я читала статью Борисова, как убрать дубли страниц. Поставила другой плагин для комментирования. А вот с роботсом еще не разбиралась. столько надо всего делать, просто ужас. Дел на блоге много, но руки не доходят до всего, к сожалению.
Да, с блогами работы много. А я купила его курс, так по нему еще больше! Тоже руки не доходят, начала с мусором воевать, не все еще сделала.
Покуда не прочитал статью я думал что это проделки вируса, теперь я уже знаю в чем проблема благодаря Вашей статьи – спасибо