Moteurs de recherche



Description

Les moteurs sont des outils quantitatifs qui référencent des pages, alors que les annuaires références des sites. Ainsi, suite à une requête sur un moteur, vous accèdez directement à une page.

Un moteur de recherche se compose d'un robot (spider ou araignée) qui parcourt le web à l'affût de nouveaux sites, et d'un outil d'indexation. Lorsque vous tapez une requête, le moteur va d'abord rechercher dans son index le / les termes de la requête puis va rechercher dans les pages (plein texte) pour ensuite classer les résultats par ordre de pertinence.

Les moteurs de recherchent n'indexent pas toutes les pages d'un site. AltaVista par exemple n'indexe que 400 pages d'un site.

Certains moteurs utilisent les mêmes bases de données (l'une des plus utilisées est dmoz - http://dmoz.org, une base constituée bénévolement). La différence entre les moteurs réside dans leur algorithme de calcul de la pertinence des résultats.

Le calcul de la pertinence se faisait en comptabilisant le nombre d'occurrence d'un terme (ou d'une suite de terme) dans un texte et en prenant en compte leur proximité. Pour cela, non seulement le texte de la page était pris en compte mais aussi les meta balises (ou meta tag). Cependant, suite à des abus, mais aussi pour des raisons de performance, d'autres méthodes ont été élaborées, entre autre l'indice de popularité. Les moteurs utilisent différents algorithmes pour le calculer :

Le problème des moteurs de recherche est que les résultats ne sont pas classés par thèmes, ils apparaîssent par ordre de pertinence. Face à ce désordre, le moteur Nothernlight (http://www.northernlight.com) propose un type de classement par thème. Ainsi, une fois que vous avez posé votre requête, la page de résultats apparaît avec à gauche une liste de thèmes regroupant les différents résultats trouvés. En cliquant sur un thème, vous n'avez que les résultats propre à un domaine particulier. Un autre outil utilise ce principe : iLor (http://www.ilor.com). Cet outil ne fonctionne bien que sur le web américain.

Méthode de recherche

Le problème des moteurs est le nombre de résultats qu'ils renvoient suite à une requête. Afin de réduire le nombre des résultats, il convient de connaître un minimum les opérateurs booléens, voire la recherche avancée qui permet de réduire la recherche à certains champs des pages indexées. Cependant, les opérateurs booléens varient dans leur forme d'un moteur à un autre.

Syntaxe de quelques moteurs de recherche ( source : abondance - http://www.abondance.com/outils/comparatif.html)


  AltaVista HotBot Infoseek Northern Light Excite Lycos Web Crawler Google All The Web
OU Par défaut Choix any of the words Par défaut OR Par défaut ou OR Par défaut ou OR Par défaut ou OR Non utilisé Choix any of the words
ET Signe + Choix all the words ou signe + Signe + AND ou signe + AND ou signe + Signe + AND ou signe + Opérateur par défaut ou signe + Choix all the words ou signe +
SAUF Signe - Signe - Signe - NOT ou signe - AND NOT ou signe - Signe - NOT ou signe - Signe - Signe -
Expression Guillemets Guillemets Guillemets Guillemets Guillemets Guillemets Guillemets Guillemets Guillemets
Troncature * * Non * Non Non Non Non Non
Recherche linguistique (nombre de langues) Oui (25) Oui (7) Non Oui (5) ** Non Oui (15) ** Non Oui (11) Oui (31)**
Recherche sur le titre title: title: title: title: Non Choix "Title only" ** Non Non Choix "in the title"**
Recherche sur le domaine domain: domain: site: url: Non Non Non site: Choix "in the url"**
Recherche sur le nom du serveur host: domain: site: url: Non Choix Title dans la zone "Page field"** Non site: Choix "in the url"**
Recherche sur l'URL url: Non url: url: Non Choix URL dans la zone "Page field"** Non Non Choix "in the url"**
Recherche sur les adresses des liens link: linkdomain: link: Non Non Non Non link: Choix "in the link to url"**

L'utilisation d'un moteur de recherche se fait principalement dans 2 cas :

Remarque : il se peut que dans certains cas, l'un des résultat vous amène à une page d'erreur 404 (ou à un message tel que 'la page n'existe plus'). Google vous offre la possibilité d'avoir accès à une page qui n'est plus en ligne en cliquant sur Copie cachée. Google stocke les pages du web sur des disques durs.

Evolutions

Afficher rapidement les résultats

Les internautes demandent à ce que les résultats s'affichent le plus rapidement possible, or lorsque la page contient non seulement les résultats mais aussi des bannières de pub ou des informations connexes (météo, actualités, ...), le temps d'affichage est ralongé. Face au succès de Google dont l'interface est vraiment minimale, de plus en plus de moteurs offrent une interface simplifiée : Voilà, en cliquant sur Voilà pour les geeks - http://www.voila.fr/Geek (cela signifie idiot et c'est ainsi que s'appellent entre eux certains informaticiens); Altavista, en cliquant sur Recherche en mode texte - http://fr.altavista.com/searchtxt.

Nouvelles technologies

De nouvelles technologies de recherche voient le jour, par exemple, la technologie NG. A la suite d'une requête, le moteur de recherche suggère une liste de termes ayant un rapport avec les mots de la demande. L'utilisateur peut inclure ou non des éléments de cette liste aux termes de sa question. A une question portant sur "Poutine et Russie", des éléments tels que "Tchétchénie", "le FSB","les présidentielles en Russie" apparaîtont, en ajoutant certains de ces termes on affine sa requête. Le moteur Exalead (http://www.exalead.com) propose cette technologie.

Une autre technologie, toute droit issue de l'IA (Intelligence Artificielle) existe, mais les résultats ne semblent pas encore être là. Cete technologie se nomme DWIM (Do What I Mean). Elle consiste à éviter, lorsqu'il y a synonymie, d'accéder à des pages ne portant pas sur le bon sujet.

Moteurs humains

Au lieu d'interroger une base de données directement, certains moteurs vous propose de poser votre question à un documentaliste qui réalisera la recherche et vous communiquera, par courriel par exemple, les résultats qu'il a trouvés. Le procédé peut être plus interactif, au sens où vous dialoguerez avec ce documentaliste afin d'affiner votre requête et la prestation ne s'arrêtera que lorsque vous aurez trouvé les documents pertinents. Ce type de service ressemble plus il est vrai à un call center web.

Selon les moteurs, cette prestations est gratuite ou non.

 
Moteurs de recherche humains
webhelp (http://www.webhelp.fr)
Question (http://www.question.fr)
woonoz (http://www.woonoz.com)
Listes de moteurs de recherche humains (http://www.netsurf.ch/askexperts.html)

 

Moteurs généralistes

Moteurs français
Altavista (http://www.altavista.fr) Google (http://www.google.com) Lycos (http://www.lycos.fr)
Hotbot (http://www.hotbot.lycos.fr) Wanadoo (http://www.wanadoo.fr)  
Liste de moteurs de recherche francophones (http://www.enfin.com/linksengine.php?viewCat=3)
Moteurs internationaux
Altavista (http://www.altavista.com) Google (http://www.google.com) Nothernlight (http://www.northernlight.com)
Webcrawler (http://www.webcrawler.com)
Yakeo (http://yakeo.ovh.org) : vous choississez votre pays, vous tapez votre requête et vous choisissez le moteur local que vous voulez utiliser. Très pratique.
Liste des outils de recherche mondiaux (http://www.ariane6.com/moteurs.htm)

Remarque : Google vous permet d'intégrer sa Toolbar (http://toolbar.google.com/intl/fr) dans votre navigateur, ainsi, sans avoir à aller sur le site de Google, vous pouvez l'interroger. Pour cela, cliquez sur Installer la barre d'outils Google et suivez la procédure. Automatiquement, cette barre apparaîtra sous la barre de menu de votre navigateur. Cette barre de Google vous permet de poser une question, de mettre en surbrillance les termes de votre requête dans la page de résultats, ... .

Moteurs particuliers

Moteurs de recherche spécialisés
Acronym Finder (http://www.mtnds.com/af) Trouver des abrévations ou des acronymes
CitéFutée (http://www.citefutee.com) Vous voulez savoir comment aller à un endroit en métro / RER
Dictionnaire universel francophone (http://www.francophonie.hachette-livre.fr) Vous recherchez un terme ou sa définition.
@dresse finder (http://www.iaf.net)
People Search de Yahoo (http://people.yahoo.com)
Permet de rechercher un courriel, à condition que la personne soit déclarée auprès d'un FAI.
Enginus (http://212.180.76.120/pages/default.asp) Le moteur de recherche de l'industrie
GoGraph (http://fr.gograph.com)
Picsearch (http://www.picsearch.com)
Moteur de recherche d'images
Download (http://www.downloads.com)
Megagiciels (http://www.megagiciel.com)
Shareware (http://www.shareware.com)
Recherche de logiciels freeware, shareware, en démo.
Maporama (http://www.maporama.com) Trouver une adresse (rue, ville, ...)
Mirago (http://www.mirago.fr) Ce moteur permet une recherche par région française.
Pages jaunes (http://www.pagesjaunes.fr) Annuaire de france Telecom
RocketNews (http://www.rocketnews.com) Moteur de recherche d'actualités en anglais
service-public.fr
(http://www.service-public.fr)
Moteur de recherche des sites publics
Ticketnet.fr (http://www.ticketnet.fr/shop/fr/accueil.asp) Vous recherchez un artiste ou un spectacle.
Trouvez (http://www.trouvez.com) Pour les cyber-consommateurs
Moteurs de recherche pour les forums
Liszt (http://www.liszt.com) Tile (http://www.tile.net)  

Remarque : certains outils de recherche ont un opérateur particulier pour trouver un élément multimédia. Ainsi, pour trouver sur Voilà ou Hotbot une image, vous pouvez taper : +"père noël" +feature:image; pour trouver un son : +canard +feature:sound.

Outils complémentaires

Si vous voulez connaître les sites liés à un autre site :

Pour en savoir plus

Sommaire
Remarques sur les annuaires et les moteurs de recherche