Rejoignez-nous
Divers

Des documents sur l'algorithme de recherche Google ont été divulgués. Voici ce que disent les experts.

Pierre

Date de publication :

le

Des documents sur l'algorithme de recherche Google ont été divulgués.  Voici ce que disent les experts.

C'est gros.

La clé du succès en ligne dépend généralement d'un facteur majeur avant tout : le classement de votre site Web dans la recherche Google.

Depuis des décennies maintenant, toute une industrie – l’optimisation des moteurs de recherche ou « SEO » – s’efforce de déchiffrer le code qui fait monter une page donnée dans les classements pour diverses requêtes de recherche par mot clé sur Google.

Cette semaine, ce « code », ou plus précisément les secrets de l’algorithme du moteur de recherche de Google, ont été divulgués.

« Au cours du dernier quart de siècle, aucune fuite d'une telle ampleur ou d'un tel détail n'a jamais été signalée par la division de recherche de Google », a déclaré Rand Fishkin, PDG de Sparktoro, une figure influente de longue date dans l'industrie du référencement.

Fishkin travaille dans l'industrie depuis des années et a fondé la société de référencement bien établie, Moz. La longue histoire de Fishkin en matière de référencement est probablement la raison pour laquelle une personne anonyme a choisi de lui envoyer le document interne « Content API Warehouse » de Google. Ce document de 2 500 pages détaille une multitude de connaissances jusque-là inconnues ou non confirmées sur la manière dont Google décide de classer les sites Web sur son moteur de recherche.

Bien que Google n'ait pas confirmé la légitimité de la fuite, Fishkin a déclaré qu'un employé de Google l'avait contacté afin de modifier la caractérisation de certains des détails qu'il avait publiés dans son analyse du document. Fishkin et un certain nombre d'autres leaders du référencement et du marketing numérique ont également examiné les pages et estiment que la fuite est légitime.

Il y a beaucoup d'informations techniques dans le document, qui semblent être davantage destinées aux développeurs et aux professionnels techniques du référencement qu'au profane ou même aux professionnels du référencement spécialisés dans la création de contenu. Cependant, il y a quelques détails extrêmement intéressants avec lesquels tout le monde peut repartir de cette fuite.

Google utilise évidemment Chrome pour classer les pages

Ceci est particulièrement intéressant car Google a déjà nié utiliser Chrome pour classer les sites Web.

Selon les documents analysés par des experts comme Fishkin, il semble que Google suit le nombre de clics qu'une page Web reçoit des utilisateurs dans son navigateur Web, Chrome, afin de choisir les pages d'un site Web à inclure dans son plan de site de requête de recherche.

Ainsi, même s'il ne semble pas que Google utilise ces informations pour décider où classer un site entier, les analystes ont supposé que la société utilise l'activité de Chrome afin de décider quelles pages internes afficher dans la recherche sous la page d'accueil du site Web.

Google balise les « petits sites personnels » pour une raison quelconque, semble-t-il

L'expert SEO Mike King d'iPullRank a signalé celui-ci, et cela a suscité plus de questions que de réponses.

Selon l'analyse du document interne de Google, l'entreprise attribue un drapeau spécifique aux « petits sites Web personnels ». On ne sait pas clairement comment Google détermine ce qu'est un site Web « petit » ou « personnel », et il n'y a aucune information sur la raison pour laquelle Google marque les sites Web avec cette balise. Est-ce pour aider à les promouvoir dans les recherches ? Les rétrograder au classement ?

Son objectif est actuellement un mystère.

Les clics comptent beaucoup

Il s’agit d’un autre problème sur lequel les experts SEO spéculent depuis longtemps, et que Google a nié au fil des ans. Et encore une fois, il semble que les experts avaient raison.

Il s’avère que Google s’appuie bien plus sur les clics des utilisateurs pour les classements de recherche qu’on ne le pensait auparavant.

NavBoost est un facteur de classement Google qui se concentre sur l'amélioration des résultats de recherche. Il se concentre fortement sur les données de clics pour améliorer ces résultats. Selon King, on sait désormais que NavBoost dispose d'un « module spécifique entièrement axé sur les signaux de clic ». Un facteur majeur qui détermine le classement d'un site Web pour une requête de recherche : les clics courts par rapport aux clics longs ou la durée pendant laquelle un utilisateur reste sur une page après avoir cliqué sur le lien d'une recherche Google.

Les domaines de correspondance exacte peuvent être mauvais pour le classement dans les recherches

Si vous avez déjà rencontré un nom de domaine comportant plusieurs mots-clés et tirets, comme used-cars-for-sale.net par exemple, au moins une partie de la raison était probablement le référencement. Les investisseurs en domaines et la communauté du marketing numérique croient depuis longtemps que Google récompense les noms de domaine à correspondance exacte.

Il s'avère que ce n'est pas toujours vrai. En fait, un domaine de correspondance exacte peut nuire à votre classement.

Il y a environ dix ans, Google a déclaré que les noms de domaine à correspondance exacte ne seraient plus tenus en haute estime en tant qu'outil permettant d'obtenir des classements, bien qu'ils aient été favorisés par l'algorithme à un moment donné. Cependant, nous avons désormais la preuve grâce à cette fuite qu'il existe un mécanisme permettant de rétrograder activement ces sites Web dans la recherche Google. Il s’avère que Google considère bon nombre de ces types de domaines de la même manière que les pratiques de bourrage de mots clés. L'algorithme considère ce type d'URL comme du spam potentiel.

Listes blanches de sujets

Selon l'analyse des documents, Google dispose de listes blanches pour certains sujets. Cela signifie que les sites Web qui apparaissent dans la recherche Google pour ces types de requêtes de recherche doivent être approuvés manuellement et n'apparaissent pas en fonction des facteurs de recherche normaux classés de manière algorithmique.

Certains sujets ne sont pas trop surprenants. Les sites Web contenant du contenu lié aux informations sur la COVID et aux questions politiques, en particulier concernant les informations électorales, sont sur liste blanche.

Cependant, il existe également une liste blanche pour les sites Web de voyages. On ne sait pas exactement à quoi sert cette liste blanche. Les experts SEO ont suggéré que cela pourrait être lié aux sites de voyage apparaissant dans des onglets et widgets de voyage spécifiques de Google.

Google a « menti »

Fishkin, King et d’autres experts SEO ont pu confirmer et démystifier de nombreuses théories SEO grâce à cette fuite de document. Et il est désormais clair pour eux que Google n’a pas dit tout à fait la vérité sur le fonctionnement de son algorithme de recherche au fil des ans.

« 'Lied' est dur, mais c'est le seul mot précis à utiliser ici », a écrit King dans sa propre analyse du document Google Content API Warehouse.

« Bien que je ne reproche pas nécessairement aux représentants publics de Google de protéger leurs informations exclusives, je conteste leurs efforts visant à discréditer activement les personnes des mondes du marketing, de la technologie et du journalisme qui ont présenté des découvertes reproductibles », a-t-il déclaré.

Alors que les experts du secteur continuent d’examiner cet énorme document, nous pourrions bientôt découvrir d’autres détails intéressants cachés dans l’algorithme de recherche de Google.

Un représentant de Google a refusé la demande de commentaire de Indigo Buzz.

Pierre, plus connu sous son pseudonyme "Pierrot le Fou", est un rédacteur emblématique du site Indigo Buzz. Originaire d'une petite ville du sud-ouest du Gers, cet aventurier des temps modernes est né sous le signe de l'ombre en 1986 au sommet d'une tour esotérique. Élevé dans une famille de magiciens-discount, il a développé un goût prononcé pour l'excentricité et la magie des mots dès son plus jeune âge. Pierre a commencé sa carrière de rédacteur dans un fanzine local dédié aux films d'horreur des années 80, tout en poursuivant des études de communication à l'Université de Toulouse. Passionné par l'univers du web, il a rapidement pris conscience de l'impact du numérique et des réseaux sociaux sur notre société. C'est alors qu'il a décidé de troquer sa collection de cassettes VHS contre un ordinateur flambant neuf... enfin presque.