Un site internet permet à une entreprise de faire connaître ses produits et ses services à grande échelle. En étant présent sur Internet, vous améliorez votre performance commerciale, vous attirez une nouvelle clientèle, tant au Canada qu'ailleurs dans le monde.

Google…VS. référencement…suite 2

Gratuit
Recevez toutes nos informations et actualités par Email.

Entrez votre adresse email:

Prenez par exemple la manière dont le moteur de Google repère les synonymes. Selon Singhal : « Nous avons découvert très tôt un truc marrant. Les gens changent les mots de leurs requêtes. Alors, ils tapent ‘images de chiens’, et ensuite ils tapent ‘images de chiots’. Et cela nous a dit que peut-être ‘chiens’ et ‘chiots’ étaient des termes interchangeables. Nous avons aussi appris que lorsque l’eau bout, c’est de l’eau chaude. Nous avons réappris la signification des mots d’un point de vue humain, et cela nous a beaucoup fait avancer. »

Mais il y avait des obstacles. Le système des synonymes de Google comprenait qu’un chien ressemblait à un chiot et que l’eau bouillante était chaude. Mais il concluait aussi qu’un chien chaud (hot dog) devait ressembler à un chiot bouillant! Le problème a été résolu à la fin de 2002 par une percée fondée sur les theories du philosophe Ludwig Wittgenstein voulant que les mots soient définis par leur contexte. À mesure que Google parcourait la Toile et accumulait des milliards de pages et de documents, il analysait quels mots se trouvaient à proximité les uns des autres. Les ‘hot dogs’ se retrouvaient alors davantage dans des recherches qui contenaient également les mots ‘pain’ et ‘moutarde’ ou encore ‘partie de baseball’, que dans des résultats qui parlaient de chiots ébouillantés. Cela a aidé l’algorithme à comprendre la signification de ‘hot dog’ et de millions d’autres expressions. Toujours selon Singhal : « Aujourd’hui, si vous tapez ‘bio de Gandhi’, nous savons que ‘bio’ veut dire ‘biographie’. Mais si vous tapez ‘guerre bio’, cela signifie ‘biologique’.

Pendant son histoire, Google a conçu des manières d’ajouter plus de signaux, tout en évitant de changer les habitudes d’utilisation des chercheurs. Tous les deux ans environ, il s’effectue un changement majeur dans le système - équivalent un peu à une nouvelle version du système d’opérations informatique Windows. C’est une étape importante à Mountain View, mais on en parle peu publiquement. « Notre travail consiste fondamentalement à changer les moteurs d’un avion qui vole à 1000 kilomètres/heure à 30 000 pieds au-dessus de la Terre, affirme Singhal. En 2001, pour se plier à la croissance rapide de la Toile, Singhal a complètement révisé l’algorithme original de Page et Brin, permettant ainsi au système d’incorporer rapidement de nouveaux signaux. (Un des premiers signaux du nouveau système pouvait différencier les pages commerciales des autres, donnant de meilleurs résultats aux chercheurs qui désiraient faire des achats.) La même année, un ingénieur nommé Krishna Bharat s’est aperçu que les liens provenant d’autorités reconnues devraient avoir priorité. Il a conçu un signal puissant conférant plus de crédibilité aux références venant de sites experts. (C’est devenu le premier brevet de Google.) Le changement le plus récent, nommé Caféine, a renouvelé l’ensemble du système d’indexage afin de rendre encore plus facile l’ajout de signaux pour les ingénieurs.

La créativité de Google à encourager ces percées technologiques est reconnue. Chaque année, l’entreprise tient une exposition de démonstration interne qui s’appelle CSI ( Crazy Search Ideas = Folles Idées de Recherche) pour tenter d’encourager des approches inédites, mais productives. En grande partie, le processus d’amélioration est un travail sans fin, qui se fraye un chemin parmi de mauvais résultats pour identifier ce qui ne fonctionne pas. Une de ces recherches avortées est entrée dans la légende: quelque part en 2001, Singhal s’est rendu compte des médiocres résultats quand les gens tapaient le nom ‘audrey fino’ dans leur recherche. Google s’obstinait a répondre avec des sites italiens faisant l’éloge de l’actrice Audrey Hepburn. (fino signifie ‘fine’ en Italien). « Nous nous sommes rendu compte que c’était en fait un nom de personne. Mais le système n’était pas assez intelligent. »

L’échec Audrey Fino a conduit Singhal vers une quête échelonnée sur plusieurs années pour améliorer la façon dont le système gère les noms propres - qui composent 8% de l’ensemble des recherches. Pour résoudre cette énigme, il a dû maîtriser l’art obscur de la fragmentation bigrammaticale (bi-gram breakage ). Il s’agit de séparer une expression faite de mots multiples en unités autonomes. Par exemple, ‘new york’ représente deux mots qui vont ensemble (un bi-gram) pour désigner cette grande ville des États-Unis. Par contre, ‘new york times’ se réfère à un journal. Et tout change encore plus en tapant ‘new york times square’ car il s’agit d’un quartier renommé de New York. Les humains font ces distinctions instantanément, mais Google ne possède pas une salle secrète remplie de fonctionnaires bureaucrates comme dans le film ‘Brazil’. Il s’appuie sur des algorithmes.

La recherche sur Mike Siwek illustre comment Google travaille. Quand Singhal tape une commande pour exposer un niveau de code derrière chaque résultat de recherche, le signal déterminant le classement des liens privilégiés apparaît clairement : un bi-gram qui identifie un nom propre, un synonyme, une location géographique. « Il faut déconstruire cette recherche du point de vue d’un ingénieur. Aha! Nous pouvons fragmenter cela ici. Nous réalisons alors que le mot ‘lawyer’ relié à Siwek n’est pas un nom propre, ni une ville du Michigan, mais désigne en anglais la profession d’avocat.

C’est la réalisation, acquise de dure lutte par le moteur de recherche de Google et glanée de l’information générée par des milliards de recherche, qu’un rocher est un rocher. C’est aussi une pierre ou une roche. Et même si on l’épelle ‘rohce’ c’est encore une roche. Mais si on met ‘petite’ devant ‘roche’ (Little Rock en anglais) cela devient la capitale de l’État de l’Arkansas. Et Arkansas n’est pas une arche, à moins que Noé ne rôde autour. Selon Singhal, « Le Saint Graal de la recherche est de comprendre ce que veut l’utilisateur. À ce moment, la correspondance ne se fait plus au niveau des mots, mais au niveau de la signification. »

Et Google continue sur sa lancée. Récemment, l’ingénieur de recherche Maureen Heymans a découvert un problème avec ‘Cindy Louise Greenslade’. L’algorithme savait qu’il devait rechercher une personne - dans le cas présent une psychologue de Garden Frove en Californie - mais il n’a pas pu placer le site Web de Greenslade parmi les dix premiers résultats. Heymans s’est aperçu qu’en résumé, Google avait relégué la pertinence de la bonne réponse parce que Greenslade utilisait seulement l’initiale de son deuxième prénom, et non son deuxième prénom au complet (Louise) comme dans la recherche. Selon Heymans : « Nous devions le rendre encore plus intelligent. » Elle a donc ajouté un signal qui recherche les initiales du second prénom. Maintenant, le site de Greenslade se trouve parmi les cinq premiers résultats.

Webmaster - 16/ june / 2010

  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »
  • »

Laisser un commentaire

Vous pouvez utiliser ces tags XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <blockquote cite=""> <code> <em> <strong>