Rechercher sur Internet

Bien souvent, le recherche sur Internet se résume à se jeter sur Google. Ce moteur de recherche, apparu il y a une dizaine d’année, a su faire preuve de son efficacité. Aujourd’hui Yahoo et Bing (le moteur tout récent de Microsoft) peinent à lui faire de l’ombre. Mais on ne saurait passer à côté de quelques questions essentielles :

  • sait-on vraiment bien utiliser Google ?
  • que penser de la politique de Google qui conserve nos historiques de recherche (sans parler des mails !) pour rendre plus efficace sa publicité ciblée ?
  • quelles sont les autres alternatives, voire les autres concepts ?

Tâchons d’apporter quelques éléments de réponse.

On pourra aussi utiliser cette fiche de mon collègue Arnaud Léonard.

Les moteurs de recherche

De manière générale un bon outil ne sert à rien si on s’en sert mal. On aura donc le souci de bien formuler sa requête :

  • choix de mots clés pertinents
  • utilisation des guillemets pour chercher une suite de mots
  • recours aux opérateurs booléens :

Mot1 +/AND/ET Mot2 -> ne recherche que les pages qui contiennent ces 2 mots

Mot1 -/NOT/SAUF Mot2 -> exclu un mot

Mot1 |/OR/OU Mot2 ->

1. Google, le géant

On ne présente plu Google. On n’oubliera pas toutefois qu’il propose aussi des recherches spécialisées : pour les images, les videos, l’actualité par la presse en ligne et bientôt, dit-on, la musique ! En attendant le Google labs ne cesse d’innover et vient de lancer Google Image Swirl pour une recherche innovante des images (le projet est encore en test et l’indexation est limitée à environ 200 000 mots).

Aujourd’hui, comme d’autres, Google se tourne vers la richesse informative que constituent les réseaux sociaux. En effet, en plus des algorithmes d’indexation, il apparait que les internautes sont porteurs d’informations lorsqu’ils utilisent Facebook, Twitter, identi.ca, … L’outil Google recherche en temps réel se concentre sur les commentaires postés sur les réseaux. On y trouvera donc des liens, des réflexions, des discussions. La versions anglaise dispose d’options d’affinage : suivre une conversation entière, accès à une frise chronologique, …

En septembre 2010le service  Google Instant offre une suggestion de recherche à mesure que l’utilisateur entre les mots-clé. Mais il semble qu’avec ce système les grosses entreprises s’imposent facilement, laissant de côté les moins connues et donc faussant l’idée même de recherche. Certains accusent même Google de faire du favoritisme en échange d’avantages financiers…

2. Les grands concurrents

Tout d’abord Yahoo, dont l’efficacité est aujourd’hui tout à fait satisfaisante. Yahoo tente peu à peu une migration du « web des liens », à savoir les liens signalés en bleu depuis le début du web, au « web des objets » ou la requête nous mène directement à des documents. Plus récent, Bing, lancé par Microsoft, peine à progresser. Il est encore en développement et ses concepteurs cherchent de nouvelles fonctionnalités. Ainsi, l’une des pistes pour créer de nouveaux moteurs est la recherche sémantique, c’est-à-dire chercher non plus par mots-clés mais tout simplement en posant une question (what is the weather in Paris ?).

Google effectue aussi des tests dans ces voies avec le projet google squared. Mais ce moteur expérimental reste encore très limité.

A noter Search³, qui effectue une recherche qui vous permet de comparer les résultats de Google, Yahoo et Bing, en intégrant parfois Twitter. C’est en effet une des dernières tendances : utiliser les twits réalisés par des humains et donc très pertinents. Ubimozu fait de même, avec une assez grande clarté. Particularité : ce moteur prétend reverser 50% de ses revenus à des ONG humanitaires.

3. Dans l’ombre des grands

Ixquick est un métamoteur, c’est-à-dire qu’il interroge plusieurs moteurs de recherche, qui met en avant le respect de la vie privée (contrairement à Google !) : vos requêtes ne sont pas conservées, ni même l’IP de votre ordinateur. Et si vous ne voulez pas abandonner votre Google chéri vous pourrez vous tourner vers Scroogle, qui interroge Google mais efface toute trace de votre passage ! Attention l’interface de ce dernier moteur est vraiment très très laide…

Pour poursuivre dans cette veine on notera des projets pour détourner Google :

Shmoogle renvoie les résultats dans un ordre hiérarchique aléatoire, considérant qu’on se contente trop souvent des 2-3 premières pages alors qu’il y peut-être des choses intéressantes plus loin ;

– Le générateur de faute d’orthographe permet parvenir à des résultats non mis en valeur habituellement ;

L’internet qui dit non, rend tout simplement l’interface pénible à utiliser…une manière de se vacciner !

La recherche sémantique est-elle l’avenir ? C’est ce qu’on semble penser chez Wolframalpha ou encore Hakia Mais dans ce domaine Ask a jeté l’éponge en novembre 2010.

Certains travaillent aussi sur la représentation des résultats. Kartoo était lui aussi un métamoteur mais qui proposait sa réponse sous forme de carte avec des liens permettant d’explorer d’autres recherches. L’entreprise a toutefois fermé la porte en jenvier 2010, preuve qu’il n’est pas simple d’innover et de s’imposer dans ce secteur, même avec de bonnes idées.

Lui aussi s’engage à ne conserver aucune trace de vos requêtes. Quintura joue lui sur le nuage de mots clé dans une colonne de gauche pour affiner la recherche sous formes de liens dans la moitié droite. Avec Snap et sa fonction Web Enhanced, prévisualisez les liens dans une fenêtre à droite de l’écran. Très joli, Constellations propose une vision sidérale avec des liens stellaires plus ou moins proches de la requête. En revanche le choix de RedZ est moins convaincant.

Yoolink parie sur la coopération entre internautes et le signalement des sites intéressants par mots clé

4. Les spécialistes

Reste que bien souvent faire appel à un pro est la meilleure méthode ! Les premiers sont les annuaires, c’est-à-dire des liens compilés non par des algorithmes de recherche mais par des opérateurs humains. On retiendra celui de Yahoo et DMOZ.

Reverso propose ainsi l’accès au dictionnaire Littré. Même s’il est un peu compliqué à l’usage, Gallica offre l’accès à la Bibliothèque Nationale de france. Le Trésor informatisé de la langue française est un dictionnaire assez complet qui permet plusieurs approches de recherhces (par la phonétique notamment). C’est un bon moteur même si l’interface est pour le moins vieillotte.

Les recherches de Photo/vidéo se sont multiplié et les moteurs ont suivi. Dans ce domaine, l’innovation de la présentation est la plus effective. Ainsi Oskope qui de Flickr à youtube offre une interface agréable. Le très beau Tag Galaxy offre une plongée spatiale dans les photographies et les mots clés associés qui sont proposés…

Le projet Euopeana est très prometteur et permet d’explorer la culture européenne.

Des ressources libres

L’utilisation des documents est régie par les licences :

Beaucoup d’œuvres sont en copyright, les auteurs se réservant tous les droits sur leur production. On peut toutefois disposer d’un droit à citation.

Cependant, certains décident que leurs œuvres seront partiellement ou entièrement à disposition de qui veut les utiliser : ce sont des ressources libres. C’est par exemple le cas avec les licence Creative Commons qui définissent les droits et devoirs des utilisateurs, comme il est montré ici et . A l’extrême, la licence GNU/GPL, reposant sur la philosophie de Richard Stallman, pose comme fondement les 4 libertés fondamentales : droit de disposer de l’œuvre et de l’utiliser, de la redistribuer, de la modifier et d’en faire profiter la communauté selon la même philosophie. Un bon exemple en est la biographie de R. Stallman ou les logiciels libres.

Des banques de données recensent les document libres ou mis en Creatives Commons par les auteurs :

Wikimedia Commons propose plusieurs millions de ressrouces et ne cesse de s’enrichir

Avec Flickr, c’est plus de 100 millions d’œuvres  photographiques qui sont à disposition

Plus récent, Morgue file semble prometteur

On aura tout intérêt à utiliser un outil de filtrage Search by CC

Il ne s’agit pas d’un moteur de recherche en soi, mais d’un moteur qui interroge d’autres sites avec pour conditions de trouver des ressources sous licence Creative Commons. A noter qu’on peut l’installer dans les outils de recherche de la barre dédiée de Firefox :

Enfin, le site Documentation de l’Académie de Rouen recense un nombre très important de ressources classées par thèmes.

2 réflexions sur « Rechercher sur Internet »

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *