Choisir entre Robots.txt et NoindexChoisir entre Robots.txt et Noindex

Choisir entre Robots.txt et Noindex pour la Gestion des Informations de Votre Site

Ce qui est en jeu ici, ce n’est autre que le choix entre robots.txt et noindex pour administrer les renseignements sur votre site web que vous ne dĂ©sirez pas voir indexĂ©s, encore moins crawlĂ©s par les engins de recherche.

Compréhension de Robots.txt et Noindex

Quelques Ă©claircissements sont nĂ©cessaires Ă  propos des disparitĂ©s entre robots.txt et noindex. Le robots.txt, c’est en fait un dossier textuel qui se situe Ă  la base du site et qui va dispenser un certain nombre de consignes de type Disallow : qui vont donc prohiber le crawl aux secteurs qui sont rĂ©fĂ©rencĂ©s via ces consignes Disallow : . Parfois, on peut Ă©galement apercevoir du Allow: pour autoriser le crawl Ă  l’intĂ©rieur d’une zone qui est interdite d’accès, et donc permettre l’accès Ă  des sous-secteurs aux engins de recherche.

L’UtilitĂ© de Robots.txt et Noindex

Ainsi, le robots.txt va interdire le crawl par les robots aux secteurs qui sont Ă©numĂ©rĂ©s par les consignes Disallow:. D’autre part, la balise meta robots noindex est une balise html, une consigne aussi, qui va requĂ©rir aux engins de recherche, après avoir crawlĂ© la page, de ne pas indexer celle-ci. Donc avec la balise meta robots noindex, il y a crawl, mais on requiert que l’indexation ne soit pas effectuĂ©e.

La Nuance Majeure entre Robots.txt et Noindex

La diffĂ©rence majeure entre le robots.txt et le noindex, c’est qu’avec le robots.txt il n’y a pas de crawl. Ainsi, si tout va bien – on pourrait en discuter mais thĂ©oriquement il n’y a pas d’indexation, alors qu’avec le noindex, il y a un crawl par les robots et par la suite donc il n’y a pas d’indexation. La diffĂ©rence majeure, c’est le crawl en fait entre les deux.

L’Application du Robots.txt

Quand peut-on favoriser le robots.txt ? En rĂ©alitĂ©, c’est la plupart du temps lorsque l’on souhaite demander Ă  Google de ne pas crawler un grand nombre de pages, par exemple dans un rĂ©pertoire ou souvent lorsque l’on a un schĂ©ma d’url rĂ©current.

Exemples d’Application du Robots.txt

J’ai placĂ© quelques illustrations ici : search?qu=[mot clĂ©] : ce sont les pages de rĂ©sultats du moteur de recherche interne. Typiquement, c’est le robots.txt de manière Ă©vidente. Si vous ne voulez pas faire indexer ou voir crawlĂ©s vos pdf, vous les placez tous dans un rĂ©pertoire qui se nomme /pdf/ et puis vous l’interdisez via le robots.txt.

Lire aussi : Google Shopping et Fichier robots.txt 

L’Usage du Noindex

Avec le noindex, on va plutĂ´t travailler au niveau de la page, par exemple on crĂ©e des articles qui sont longs et puis on a un article qui est trop court pour avoir un intĂ©rĂŞt en SEO, donc cet article-lĂ , on va le mettre en noindex. Ou alors une page de test, qu’on ne veut pas voir indexĂ©e par les moteurs de recherche parce qu’on fait un test d’A/B testing ou quelque chose comme ça, on va aussi mettre une balise meta noindex.

LIRE AUSSI  4 astuces pour gagner du temps en SEO

Avantages et DĂ©savantages

Il existe des avantages et des dĂ©savantages dans les deux : le robots.txt, les avantages c’est qu’on peut très facilement traiter une zone entière d’un site web, c’est assez facile Ă  maintenir parce que finalement ce n’est qu’un dossier texte. Cependant, les dĂ©savantages du robots.txt, c’est que parfois, sur certains CMS, on n’y a pas toujours accès.

La balise noindex, l’avantage c’est qu’on peut travailler vraiment au niveau de la page. Les inconvĂ©nients, c’est que on n’y a pas toujours accès. On y accès sur la plupart des CMS mais il faut que le CMS bien sĂ»r donne accès au noindex.

En somme

Le robots.txt permet de faire le gros Ĺ“uvre, d’interdire au crawl un maximum de pages et puis ensuite on va affiner avec le noindex Ă  l’Ă©chelle de la page pour demander une non-indexation, avec quand mĂŞme un crawl qui est fait. Le gros Ĺ“uvre pour le robots.txt et puis on affine ensuite avec le noindex ! VoilĂ  pour cette petite prĂ©sentation, la dernière donc de l’annĂ©e 2021.

CAPSULES-SEO

By Dave

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *