L’algorithme du PageRank est un des sujets qui a suscité le plus de débats passionnels auprès des Webmasters. Il existe de ce fait de nombreux articles traitant du sujet sur Internet, mais la plupart sont rédigés en anglais. Cette barrière linguistique limite l’intérêt de ces articles pour toute une classe de Webmestres francophones. Diverses articles en anglais, français et espagnol nous ont largement inspirés pour la rédaction de celui-ci.
A l'origine, le PageRank est un critère mathématique permettant de mesurer la popularité d'une page sur le web. Plus il est élevé, plus la page est censée être populaire (et donc intéressante pour l'internaute).
Elle se base sur un concept très simple : un lien émis par une page A vers une page B est assimilé à un « vote » de A pour B. Au plus une page reçoit de « votes », au plus cette page est considérée comme importante par Google, exactement comme le principe des élections que nous connaissons tous.
Nous assumons qu’une page A reçoit des liens (ou "votes") émis par les pages T1...Tn.
Le paramètre d est un facteur d’amortissement pouvant être ajusté entre 0 et 1.
Nous donnons généralement à d la valeur 0.85.
De même, C(A) est défini comme le nombre de liens émis par la page A (liens sortants). Le PageRank de la page A est défini comme suit :
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
Le PageRank peut être calculé en utilisant un simple algorithme itératif, et correspond au vecteur propre principal de la matrice normalisée des liens du Web.
PR(A) le PageRank de la page A
PR(Tn) le PageRank de la page Tn
C(Tn) le nombre de liens émis sur la page Tn
d tous les « votes » sont additionnés, mais pour en limiter l’importance, le total est multiplié par ce coefficient d’amortissement (0.85)
1 - d Un petit peu de « magie mathématique » qui permet de garantir que la moyenne des PageRank de l’ensemble des pages du Web sera de 1.