|
|
Les outils de recherche - Qui est qui ? Qui est quoi ? |
|
|---|
article paru via Technosphère en octobre 2000
Nombreux sont ceux qui encore aujourd'hui ignorent la différence entre un moteur de recherche et un annuaire. Cependant, si les deux outils ont le même objectif, à savoir guider les internautes dans leurs recherches d'informations, ils sont tout aussi différents que peuvent l'être, par exemple, une voiture par rapport à un camion. Il faut se rassurer, cette confusion n'est pas uniquement le lot des débutants, mais de nombreux "internautes confirmés" (ou pseudo-confirmés) sont régulièrement dans l'erreur pour distinguer l'un et l'autre.
Vous allez pouvoir apprendre à reconnaître, à travers cet article, les différences entre chaque outil. Une explication accompagnée d'exemples et de détails spécifiques à chacun d'entre eux va vous permettre de devenir un vrai pro et de pouvoir différencier un annuaire d'un moteur de recherche, mais aussi un guide d'un portail, et sans oublier le méta-moteur.
Annuaire (appelé aussi répertoire)
Il est très important de bien faire la différence entre un annuaire et un moteur de recherche. Une confusion est souvent faite entre les deux, pourtant, ce sont deux outils qui sont loin d'être similaire; même si de plus en plus les annuaires intègrent la fonction moteur de recherche et les moteurs de recherche ont des annuaires.
Les principaux annuaires :
Les annuaires internationaux sont :
- Yahoo! http://www.yahoo.com/ et sa version française Yahoo! France http://www.yahoo.fr/. Yahoo! est la référence en tant qu'annuaire. C'est le tout premier à être apparu sur le web et il reste aujourd'hui le favori des internautes de la planète entière.
- Dmoz http://www.dmoz.org/ est devenu très vite le second annuaire. Dmoz est un annuaire contributif. Ce sont les internautes qui le font vivre, qui valident les sites et acceptent ou refusent telle ou telle inscription. Dmoz a aussi une partie francophone animée par un groupe de volontaires. Il est quand même important de noter que Dmoz appartient à Netscape qui appartient à AOL.
Au niveau des annuaires francophones, c'est Yahoo! France qui est le leader incontesté. Il existe d'autres annuaires d'une envergure moindre mais tout aussi intéressants par leur forme et contenu comme :
- Ctrouvé http://www.ctrouve.com/
- Francité http://www.francite.com/
- Nomade http://www.nomade.fr/
- Sharelook http://www.sharelook.fr/
Les caractéristiques d'un annuaire :
- La possibilité de naviguer à travers les catégories. Un annuaire classe par rubriques, par thèmes les sites qui lui sont soumis.
- Un annuaire n'est pas là pour référencer tout le web, mais, juste pour prendre en compte les meilleurs sites dans les limites qu'il s'est fixé.
- Le référenceur (webmaster ou professionnel) soumet une description et, souvent, les mots clés caractérisant son site. Ces informations accompagnées de l'URL du site, de son email et quelquefois d'autres données sont utiles aux surfeurs des annuaires.
- Le surfeur (appelé aussi modérateur ou documentaliste, selon l'annuaire) vérifie l'intérêt du site (en le visitant) et l'accepte ou le refuse dans la base de l'annuaire en fonction de critères définis par la direction selon la logique donnée à l'annuaire. Sur Yahoo!, les surfeurs ont leur propre catégorie ou ils peuvent mettre les sites qui leur plaisent plus particulièrement. Les surfeurs peuvent, si le commentaire est jugé trop commercial ou pas assez intéressant, le retravailler.
- La recherche (à travers le formulaire) se fait sur les commentaires donnés aux sites et aussi sur les mots-clés, quand ceux-ci ont été demandés.
Pourquoi mon site n'apparaît pas dans l'annuaire XXX :
Les raisons de la non-indexation d'un site dans un annuaire sont nombreuses, voici quelques raisons :
- Absence de contenu (une page ou deux, ce n'est pas suffisant),
- trop grand nombre de pages "en construction",
- un esthétisme de très mauvais goût,
- traiter mal d'un sujet déjà trop souvent abordé,
- refaire une redirection vers un autre site,
- tromper l'annuaire avec le commentaire,
- avoir un contenu illégal (racisme, pédophilie,...),
- etc.
Il est important de noter qu'aujourdhui, il y a énormément de sites soumis chaque jour aux différents annuaires. Ils ne peuvent et ne veulent pas tout intégrer dans leur base, ils font donc une sélection par la qualité, par la forme et surtout, par le contenu.
A noter:
De plus en plus d'annuaires thématiques ou régionaux voient le jour. Vous pouvez trouver des annuaires sur la bande dessinée (comme http://www.bdnet.com/), sur les chevaux (comme http://www.1cheval.com/), sur Saint Quentin en Yvelines (comme http://portailsqy.online.fr/) et des centaines d'autres sujets. Le web devenant de plus en plus important chaque jour, la spécialisation, la thématisation des annuaires va être la solution pour retrouver rapidement l'information demandée. Le meilleur exemple reste le vétéran des annuaires, Yahoo!, qui propose des annuaires nationaux (la France, l'Allemagne, la Chine,...) mais se met aussi à proposer des versions de l'annuaire par ville (New York, Los Angeles,...).
Pour résumer, un annuaire se base sur un potentiel de travail humain au niveau du classement et du référencement des sites.
Le moteur de recherche (ou "search engine" en anglais)
Il est important de savoir différencier un annuaire d'un moteur de recherche. Dans un annuaire, le travail humain prédomine dans la validation des sites; dans un moteur de recherche, tout est automatisé. La force, l'intelligence humaine sont employées au niveau du développement de la technologie. On dit souvent qu'un annuaire est le résultat du travail de documentalistes à cause du classement et de la vérification des sites alors qu'un moteur de recherche est plus considéré comme le résultat du travail d'informaticiens, de développeurs.
Les principaux moteurs de recherche sont, au niveau international :
- Altavista http://www.altavista.com/ avec sa version française http://www.altavista.fr/. Altavista n'est pas le plus vieux moteur de recherche mais sûrement le plus célèbre. Ses propriétaires successifs (Digital, Compaq et Cmgi) n'ont pas hésité à mettre des moyens dans ce projet. Voici le résultat aujourdhui, c'est le moteur de recherche le plus consulté de la planète.
- Google http://www.google.com/ est un des moteurs les plus récents, pourtant, il est considéré aujourdhui comme l'un des plus performants, par la qualité de ses algorythmes et de ses résultats. Google était au départ un projet d'étudiants à l'université de Stanford, aux Etats-Unis. Aujourdhui, Google est une société qui grimpe, qui grimpe.
- Lycos http://www.lycos.com/ et sa version française http://www.lycos.fr/. L'histoire de Lycos est un peu particulière et compliquée. Lycos est une société américaine qui a loué sa technologie, son savoir et l'exclusivité pour l'Europe à une société allemande. Les structures européennes et reste du monde sont donc différentes (une sorte de Yalta de l'internet !). En France, Lycos s'est fait connaître dernièrement par son chien Lycos-Sherlock qui sauve les internautes de situations embarassantes. A noter qu'à l'origine, lycos est le nom d'une araignée.
- Inktomi http://www.inktomi.com/ est un moteur un peu particulier. Il n'a pas de site où les internautes peuvent faire leurs recherches. Inktomi est une société qui a pour objectif de référencer dans sa base de données tous les sites du réseau Internet. Ensuite, Inktomi loue cette base à différents moteurs (comme Canada.com, Hotbot, Club Internet, BT, etc). Le seul moyen de se faire connaître auprès d'Inktomi est de passer à travers un des sites qui utilisent sa base.
- Il y a de nombreux autres moteurs basés aux Etats-Unis et touchant un public international comme Hotbot (qui appartient à Lycos) http://www.hotbot.com/, Infoseek/Go (qui appartient à Disney) http://www.go.com/, Excite http://www.excite.com/,...
Pour les principaux moteurs de recherche francophones, on peut citer comme leader incontesté, Voila http://www.voila.fr/. Voila est un produit de France Télécom (enfin presque, mais c'est tout comme !). Par son contenu, par sa base et par la qualité de sa recherche, Voila est vraiment très performant. Voila s'internationalise http://www.voila.com/ et, au rythme de son évolution, va rapidement rejoindre le top 5 des moteurs de recherche internationaux.
Il est aussi possible de citer Lokace http://www.lokace.com/ et Ecila http://www.ecila.com/ comme les grands classiques au niveau des moteurs de recherche francophones, mais, d'une taille et d'une importance moindre.
Les caractéristiques d'un moteur de recherche :
- Une recherche à travers la boîte à requêtes.
- Un référencement de tous les sites du web dans les limites fixées (de langue, de thème, de sujet).
- Un travail de référencement facile à effectuer (automatisation par des scripts) puisque seul l'URL du site est vraiment nécessaire.
- L'absence de validation humaine au niveau des sites et donc, une validation à travers des filtres mis en place au niveau du programme (filtres par domaines ou par mots-clés ou par facteurs spécifiques au moteur).
- Les nombreux résultats ne sont jamais pertinents pour les référenceurs (le site de leur client est rarement premier) et n'est pas assez précis pour les internautes qui se trouvent devant des centaines de choix sur des requêtes simples, à un mot.
- Le choix important par rapport à l'annuaire. Un moteur référence tout ce qu'on lui donne.
- Le moteur de recherche parcourt votre site. Il ajoute dans sa base de données toutes les pages de votre site qu'il a l'occasion de trouver. Les pages sont détectées par les liens qui se trouvent sur votre page soumise. Si vous avez des pages que vous désirez garder secrètes, évitez donc de mettre des liens vers celles-ci.
- Attention, tous les sites qui ont un outil de recherche interne, une boîte à requête ne sont pas des moteurs de recherche !!
Pourquoi mon site n'apparaît pas dans le moteur de recherche YYY :
L'absence d'un site dans un moteur de recherche peut s'expliquer par différentes raisons, en voici quelques unes :
- Différentes entrées vers votre site ont été soumises au moteur,
- vous avez soumis votre URL plusieurs fois dans la même journée,
- vous essayez de tromper le moteur en mettant des mots-clés n'ayant aucun rapport avec votre site,
- votre site est en attente de visite par le robot (il se trouve dans la queue),
- vous n'avez pas optimisé vos pages pour certains mots-clés,
- vous avez optimisé vos pages sur des mots-clés trop généralistes,
- vous ne savez peut-être pas chercher correctement à travers ce moteur de recherche.
Trop de personnes sont surprises de constater que des sites amateurs sont mieux classés que les sites développés par des professionnels au niveau des pages de résultats. La raison en est simple, un moteur répond à des algorythmes. Il suffit que le site professionnel n'ait pas optimisé sa page alors que le site perso tient compte de tous les paramètres, et c'est suffisant.
Un moteur de recherche est une démocratie. Tout le monde est au même niveau, que ce soit le webmaster "du dimanche" (sans rien de péjoratif) ou que ce soit la grande multinationale. Le robot du moteur parcourera chacun de la même manière, et le classement dans les pages de résultat en fonction de requête fera apparaître le plus pertinent des deux, celui qui répond le mieux à la demande d'un internaute. Par contre, le tricheur, quand il y a tricheur, sera expulsé sans aucune considération pour sa taille ou pour son origine.
A noter:
De même qu'il apparait de plus en plus d'annuaires thématiques ou régionalistes, de plus en plus de moteurs de recherche traitant d'un thème spécifique voient le jour sur le réseau internet. Vouloir référencer le web dans son intégralité demande énormément de moyens, seul les grandes entreprises peuvent espérer se lancer dans un projet tel que celui-ci. Par contre, un moteur plus restrictif est beaucoup plus facile à gérer, beaucoup plus souple et surtout beaucoup plus pertinent.
Pour résumer, un moteur de recherche, c'est un ensemble de logiciels qui visite petit à petit les différents sites de l'Internet.
Robot (ou spider, en anglais)
C'est la partie du moteur de recherche qui se promène sur la toile, enregistre les URLs, classe les mots-clés et le texte de chaque page qu'il trouve dans la base de données du moteur. C'est un des programmes qui constitue le moteur de recherche et qui est le plus caractéristique, même si ce n'est pas le plus compliqué.
Le guide
Il n'est pas facile de découvrir des différences entre un annuaire et un guide. Personnellement, j'estime qu'un annuaire est plus généraliste, plus exhaustif dans son contenu, alors que le guide, lui, est beaucoup plus spécialisé, plus thématique. Le guide est par son contenu, plus proche de l'internaute car il propose une information ciblée, une information limitée qui se veut d'une qualité supérieure. Les guides sont des sources d'informations de proximité.
Les méta-moteurs
Un méta-moteur est un script (sur Internet) ou un logiciel (sur votre PC) qui va consulter la base de différents outils de recherche suivant votre besoin. Les résultats sont affichés dans une page de votre navigateur. Selon la puissance du méta-moteur, il peut vous classer les résultats en fonction de la pertinence, supprimer les doublons, offrir la possibilité de faire une recherche en utilisant des commandes évoluées, en tenant compte de la langue, etc.
Il existe deux sortes de méta-moteurs :
- Les méta-moteurs logiciels qui tournent sur votre ordinateur. Le meilleur exemple est Copernic http://www.copernic.com/. Copernic, le logiciel, consulte plusieurs outils de recherche selon la thématique que vous avez choisie. Il pose votre question aux outils et vous retranscrit le résultat à travers votre navigateur. Vous cliquez ensuite sur le lien qui vous semble le plus pertinent. Copernic en profite pour enlever les liens morts, supprimer les réponses qui sont en double, etc, etc. Copernic est, sincèrement, la référence comme méta-moteur logiciel. Il est simple, souple et efficace.
- Les méta-moteurs en ligne sont très nombreux. Certains sont plus connus que d'autres, mais, aucun ne se démarque vraiment. Il est possible de citer, entre autres, Ixquick http://www.ixquick.com/, Metacrawler http://www.metacrawler.com/, Infozoid http://www.infozoid.com/, etc. Il doit exister plusieurs dizaines de méta-moteurs sur le réseau internet. Les méta-moteurs ont quasiment tous les mêmes fonctionnalités au niveau des plus connus. Ce qui les différencie ensuite, c'est la puissance, la rapidité, des petits détails comme la compréhension des commandes booléennes, la recherche limitée à une langue, ...
A titre indicatif, il n'est pas possible de référencer un site dans un méta-moteur. Je le reprécise, un méta-moteur n'a pas de base propre. Un méta-moteur utilise la base d'autres outils de recherche pour fournir ses informations. Quand un méta-moteur propose un référencement dans des outils de recherche, il vous propose d'utiliser un script de référencement dans différents outils, c'est donc une chose à éviter car le référencement automatique n'est pas forcément bon pour votre site.
Le portail
Le rapport avec un outil de recherche est très faible. De plus en plus de portails proposent la possibilité de rechercher sur le web, soit à travers un annuaire ou bien à travers un moteur. Il y a également une progression d'outils de recherche qui se diversifient pour devenir des portails, qui "portaillifie".
Pourquoi ?
Le meilleur exemple d'outil de recherche devenant un portail, c'est Yahoo!. De simple annuaire, ils ont réussi chez Yahoo! à augmenter de façon importante les services annexes, soit en les développant en local, soit en rachetant des sociétés qui les proposent.
Il est aussi possible de citer comme portail Spray http://www.spray.fr/, Liberty Surf http://www.libertysurf.fr/, Wanadoo http://www.wanadoo.fr/, Club Internet http://www.club-internet.fr/, etc, etc.
Il existe énormément de portails sur le réseau Internet, il en existe beaucoup aussi au niveau francophone, par contre, il y en a très peu qui sont vraiment de qualité dans leurs services, dans leur contenu.
Avec un portail, vous pouvez trouver toutes les informations que vous recherchez et même celles que vous ne cherchez pas encore. Il est possible de trouver à travers un portail de nombreuses choses, que ce soit de la recherche de sites (avec une recherche par catégorie à travers un annuaire ou bien une boîte à requête pour un moteur), que ce soit les derniers cours de la bourse, les dernières actualités (dans le monde, en France, économique, sport, people,...), la météo du week-end (sur Madrid ou partout ailleurs sur la planète), la gestion de votre courrier, la possibilité de trouver l'élu(e) de votre coeur, l'horoscope (des enfants qui viendront), etc.
La recherche parmi ces outils :
Il est très difficile de s'y retrouver avec tous ces outils de recherche généralistes, thématiques ou régionalistes. Vers qui se tourner pour trouver une information sur un sujet précis ?
De façon très évolutive, des annuaires de ces moteurs de recherche, de ces répertoires, de ces portails voient le jour sur Internet. Ces annuaires sont des guides d'outils de recherche et vous aident dans la catégorisation de votre recherche.
Il est possible de citer comme annuaire Enfin http://www.enfin.com/ qui a catégorisé plus d'un millier d'outils de recherche francophones, que ce soit des annuaires, des moteurs de recherche, des méta-moteurs ou des portails... Enfin est l'annuaire d'annuaires le plus important du réseau internet francophone.
CHRis HEDE - webmaster du site IDF.net et journaliste dans de nombreuses newsletters en ligne.