Un site internet permet à une entreprise de faire connaître ses produits et ses services à grande échelle. En étant présent sur Internet, vous améliorez votre performance commerciale, vous attirez une nouvelle clientèle, tant au Canada qu'ailleurs dans le monde.

Qu’est-ce que le PageRank?

Gratuit
Recevez toutes nos informations et actualités par Email.

Entrez votre adresse email:

Webmaster - 18/ june / 2010

PageRank est l’algorithme utilisé par le moteur de recherche Google, formulé à l’origine par Sergey Brin et Larry Page dans leur article The Anatomy of a Large-Scale Hypertextual Web Search Engine. (Note du traducteur: si on en croit le reste du texte, il s’agirait plutôt d’un des algorithmes utilisés par Google. Il y en a d’autres.)
Il est basé sur la prémisse, prévalant dans les milieux académiques, que l’importance d’un article de recherche peut être évalué en fonction du nombre de citations sur ce travail qui proviennent d’autres articles de recherche. Brin et Page ont simplement transféré cette prémisse à son équivalent informatique: l’importance d’une page Web peut être jaugée par le nombre d’hyperliens dirigés vers elle qui proviennent d’autres sites Web.
Et quel est cet algorithme?

Il peut sembler redoutable aux non-mathématiciens, mais l’algorithme de PageRank est en fait élégamment simple et se calcule comme suit:
· PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))
PR(A) est le PageRank d’une page A
PR(T1) est le PageRank d’une page T1
C(T1) est le nombre de liens sortants en provenance de la page T1
d est le facteur d’amortissement (damping) dont la portée 0 < d < 1, est habituellement calibrée à 0.85
Le PageRank d’une page Web est donc calculé en tant que somme des rangs de page de tous les liens de pages Web reliées à elle (ses liens arrivants), divisé par le nombre de liens sur chacune de ces pages (ses liens sortants).
(Note du traducteur: Je préfère l’expression ‘liens arrivants’ à ‘liens entrants’ pour traduire ‘incoming links’, car ‘liens entrants’ est souvent utilisé pour traduire ‘backlinks’, comme une recherche sur Google le confirmera facilement.)
Et qu’est-ce que cela veut dire?
Du point de vue d’un gestionnaire de moteur de recherche, cela signifie qu’il existe deux façons pour PageRank d’influencer la position de votre page sur Google:
· Le nombre de liens arrivants. Évidemment, plus ils sont nombreux, mieux c’est. Mais l’algorithme nous révèle autre chose: aucun lien arrivant ne peut provoquer un effet négatif sur le PageRank de la page vers laquelle il pointe. Au pire, il n’aura simplement aucun effet.

· Le nombre de liens sortants sur la page qui pointe à votre page. Moins ils sont nombreux, mieux c’est. Intéressant n’est-ce pas? Cela signifie qu’entre deux pages reliées à vous et bénéficiant d’un PageRank équivalent, dont l’une aura, par exemple, une page avec 5 liens sortants et l’autre avec 10, vous obtiendrez deux fois plus d’augmentation de PageRank de la page contenant seulement 5 liens sortants.
À ce point, nous devons prendre un moment de recul pour déterminer l’importance de PageRank face à la position de votre page sur les résultats de recherche de Google.
Notre prochaine observation sur l’algorithme de PageRank est qu’il n’a absolument rien à voir avec la pertinence des termes de recherche demandés. Il est simplement une seule partie (bien qu’importante) de l’algorithme complet de Google pour déterminer le rang de pertinence.
Une bonne façon de voir PageRank est peut-être de le considérer comme un facteur multiplicateur, appliqué aux résultats de recherche de Google après que tous les autres calculs auront été complétés. L’algorithme de Google analyse d’abord la pertinence des pages dans son index par rapport aux termes demandés, et ensuite multiplie cette pertinence par PageRank pour produire une liste finale. Plus votre PageRank est élevé, plus votre classement dans les résultats le sera aussi, mais il reste quand même plusieurs autres facteurs reliés au positionnement des mots sur la page et qui doivent d’abord être considérés.
Mais alors, à quoi bon ce calculateur PageRank - si aucun lien arrivant ne peut nuire, je devrais certainement en obtenir le plus possible, peu importe le nombre de liens sortants sur sa page?
Pas tout à fait. L’algorithme de PageRank a été équilibré très habilement. Tout comme la conservation de l’énergie en physique s’équilibre avec chaque réaction, PageRank est aussi conservé avec chaque calcul. Par exemple, si une page avec un point de départ PageRank de 4 possède deux liens sortants, nous savons que le montant de PageRank par lequel il passe est également divisé entre tous ses liens sortants. En ce cas, 4 / 2 = 2 unités de PageRank qui passent à 2 pages séparées, et 2 + 2 = 4, donc le total de PageRank est préservé!
Note: Il est possible de trouver des scénarios où vous trouverez que le total de PageRank n’est pas conservé après un calcul. PageRank en lui-même est censé représenter une probabilité de distribution (probability distribution ) avec le PageRank individuel d’une page, qui représente la possibilité qu’un chercheur ‘navigue au hasard’ et tombe alors sur cette page. J’ai discuté plus profondément de ce concept sur le lien suivant (here ).
Sur une échelle bien plus large, en supposant que l’index de Google contient un milliard de pages, avec chacune un index de 1, le total PageRank sur toutes les pages équivaut à un milliard. De plus, à chaque fois que nous recalculons PageRank, peu importe les changements PageRank qui arrivent entre les pages individuelles, le total PageRank sur l’ensemble du milliard de pages totalisera toujours un milliard.
Premièrement, cela veut dire que même si nous ne pouvons pas changer le total PageRank sur l’ensemble des pages, nous pouvons influencer la distribution PageRank entre les pages individuelles, en reliant stratégiquement les pages à l’intérieur de notre site. Par exemple, nous pouvons souhaiter que la plupart de nos visiteurs accèdent à notre site par la page d’accueil. Nous voudrions alors que notre page d’accueil obtienne un PageRank plus élevé par rapport aux autres pages de notre site. Nous devrions aussi nous rappeler que l’ensemble PageRank d’une page est partagé et divisé également entre chacun des liens sortants d’une page. Nous voudrions donc conserver autant d’indices de PageRank combinés que possible à l’intérieur de notre propre site sans le partager avec d’autres sites externes, perdant ainsi son bénéfice. Cela signifie que nous voudrions que toute page avec beaucoup de liens externes (à savoir des liens avec les sites web d’autres personnes) ait un PageRank plus bas par rapport aux autres pages à l’intérieur de notre site pour minimiser le taux de PageRank ‘perdu’ au profit des autres sites. N’oubliez pas que, comme il a déjà été dit, ce PageRank est simplement un facteur multiplicateur appliqué après que les autres calculs de Google sur la pertinence aient été effectués. Nous voudrions alors que nos pages qui sont plus riches en mots-clés aient aussi un meilleur score sur PageRank.
Deuxièmement, si nous assumons que chaque nouvelle page sur l’index de Google commence sa vie avec un PageRank de 1, il existe une façon d’augmenter le PageRank combiné des pages de notre site - en augmentant le nombre de pages! Un site avec 10 pages commencera sa vie avec un indice PageRank combiné de 10, qui est ensuite redistribué à travers ses hyperliens. Un site avec 12 pages commencera donc avec un indice PageRank de 12. Nous pouvons donc améliorer le PageRank de l’ensemble de notre site en créant de nouveaux contenus (c’est-à-dire davantage de pages), et ensuite en contrôlant la distribution de cet indice PageRank combiné par l’implantation stratégique de liens internes entre les pages de notre site.
Et c’est là le but du ‘PageRank Calculator‘ - de créer un modèle à échelle réduite du site en incluant les liens entre les pages, pour voir l’effet que ce modèle aura sur la distribution PageRank.
Comment fonctionne le PageRank Calculator?
Au fond, c’est très simple. Commencez par taper le nombre de pages inter reliées que vous désirez analyser et frappez la clé ‘Submit’. J’ai limité ce nombre à seulement vingt pages pour ne pas trop surtaxer les ressources du serveur. Mais même là, nous pourrions obtenir une indication raisonnable pour savoir comment les liens stratégiques peuvent affecter la distribution PageRank.
Ensuite, pour faciliter toute référence future une fois les calculs effectués, fournissez une étiquette pour chaque page (par exemple, page d’accueil, page de liens, page contactez-nous, etc) et tapez ‘Submit’ une autre fois.
Finalement, utilisez les boîtes à liste pour choisir quelle page sera reliée à telle page, et cela pour chaque page. Vous pouvez utiliser les touches ‘CTRL’ et ‘SHIFT’ pour surligner des sélections multiples.
Vous pouvez aussi utiliser cet écran pour changer les indices PageRank initiaux de chaque page. Par exemple, si une de vos pages est censée représenter Yahoo, vous pouvez souhaiter élever son indice PageRank initial à, disons, 3. Toutefois, à dire vrai, partir avec PageRank n’a aucun rapport avec sa valeur calculée finale. En d’autres mots, même si une page partait avec un indice PageRank de 100, après plusieurs itérations de l’équation (voir ci-dessous), le calcul final de PageRank convergera vers la même valeur qu’elle aurait obtenue si elle était partie avec un indice PageRank de seulement 1!
Finalement, vous pouvez vous amuser avec le facteur d’amortissement ‘d’, dont la valeur par défaut est 0.85, telle qu’elle a été attribuée dans le travail de recherche de Brin et Page.
Pourquoi y a-t-il 20 lignes de résultats?
Avez-vous déjà entendu parler du ‘Google Dance’? Vous pouvez en voir la démonstration en consultant les différents ensembles de résultats produits sur www.google.com, www2.google.com et www3.google.com. Si vous étudiez attentivement ces résultats, vous pourrez constater qu’ils changent imperceptiblement de jour en jour, et en particulier durant la période où Google met son index à jour, une fois par mois.
Une des explications pour cette ‘danse’ apparente est que Google ne se contente pas simplement de calculer une fois le PageRank pour chaque page. Après avoir calculé le PageRank une première fois, il remettra les PageRanks résultantes dans l’algorithme de PageRank et calculera à nouveau. Google répètera ce processus d’itération plusieurs fois avant que les résultats se stabilisent à leurs ‘véritables’ valeurs. Une fois complétés, les résultats apparaîtront sur le domaine ‘officiel’ www.google.com
(N.B.: Pendant que Google met son index à jour, ces mises à jour se produisent à différents moments sur les sites variés de ses centres d’information. Pour une explication plus approfondie du ‘Google Dance’, consultez le Google Dance Viewer.)
Le nombre d’itérations par défaut du ‘PageRank Calculator est de 20. Mais vous pouvez augmenter ce chiffre si vous le désirez. Pour un modèle d’environ 20 pages, 20 itérations suffisent pour voir les PageRanks s’ajuster à une seule ‘véritable’ valeur. Google en fait presque certainement bien davantage.
Lectures supplémentaires
Toute personne voulant en savoir plus long sur PageRank, mais qui est effrayée par toutes ces équations, devrait lire PageRank Uncovered par Chris Ridings. Il utilise des schémas pour illustrer l’effet de PageRank à chaque itération. Je tiens à remercier Chris pour son article extrêmement stimulant. Plusieurs des observations décrites ici ont été auparavant faites par Chris dans cet article et son prédécesseur, PageRank Explained.
Google a récemment effectué une demande de brevet aux États-Unis qui révèle grandement comment ils classent votre site Web. Vous n’auriez jamais pu deviner certains moyens utilisés ..

  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »