Principes generaux

Principes généraux sur les métamoteurs :
définition, fonctionnement, typologies...

Rappel de la définition et du fonctionnement des métamoteurs

Utilisation, avantages, limites

Typologies des métamoteurs

  Différents types de métamoteurs

 



    Rappel de la définition et du fonctionnement des métamoteurs

    *** Qu'est-ce qu'un métamoteur ?
    - Outils parfois appelés méta-outils, méta-pages, métachercheurs, moteurs de métarecherche...
    - Un métamoteur
    est un outil de recherche qui interroge en parallèle plusieurs moteurs et annuaires de recherche, rapatrie leurs réponses et les organise, selon des méthodes de classement spécifiques, pour fournir aux utilisateurs une présentation structurée des résultats.

    Nés en même temps que les moteurs de recherche, en 1995, ils étaient fondés sur le postulat de l'insuffisance des outils utilisés individuellement : aucun outil, moteur ou annuaire, ne pouvant couvrir les ressources du web, les métamoteurs permettaient alors de mieux couvrir les ressources du web.
    Le principe des métamoteurs a été parfois contesté, car ils utilisent les résultats d’autres outils : ils n’ont pas de base de données en propre, mais utilisent celles des moteurs et des autres outils.


    *** Fonctionnement :
    Ce sont des outils intermédiaires, qui traduisent les questions des utilisateurs dans la syntaxe propre à chaque outil.
    La majorité des métamoteurs permet aujourd'hui de poser une seule requête, qui est envoyée (éventuellement adaptée) aux différents outils et sources utilisés. Le métamoteur présente ensuite une liste de résultats, souvent synthétisée (c.a.d. après élimination des doublons) et classée selon différents critères, propres à chaque métamoteur.

    *** Composants d'un métamoteur :
    On peut distinguer les éléments suivants dans un métamoteur :

    • la sélection des outils et des sources : moteurs, annuaires, sources diverses...
      Cette sélection des outils, préalablement constituée et servant aux requêtes, est plus ou moins riche (de 5 à 10 moteurs jusqu'à plus de 100, voire 1000 sources et outils divers), plus ou moins diversifiée (uniquement des moteurs, ou des sources de presse, du web invisible, etc) et plus ou moins paramétrable par l'utilisateur.

       
    • l'interface de recherche simple :
      elle permet de poser, comme sur un moteur de recherche, une requête, qui sera envoyée aux différents outils de la sélection

       
    • parfois une interface de recherche avancée :
      disponible sur certains métamoteurs ; elle permet d'élaborer des requêtes plus complexes, de faire des filtrages...

       
    • des algorithmes de recherche et de classement des résultats :
      c'est le "secret de fabrique" de chaque métamoteur, qui permet de classer les résultats selon différents critères de pertinence. La formule de classement reste secrète, et c'est sur les méthodes d'interrogation et de classement des autres outils que se fonde l'un des points forts des métamoteurs : rapidité, utilisation de la syntaxe de chaque outil, sélection des résultats les plus pertinents sur chaque outil, comparaison des résultats trouvés et calcul des nouveaux taux de pertinence sur le métamoteur...

       
    • différentes méthodes de présentation des résultats :
      liste simple, liste unifiée et synthétisée, classement des résultats par catégories, clustérisation, affichages graphiques, réseaux sémantiques... C'est sur les méthodes de présentation et d'affinement de la requête, que portent beaucoup d'innovations récentes...

     


    Utilisation, avantages, limites


    *** Utilisation pratique :

    • Pour une utilisation simple :
      -
      saisir et envoyer sa requête, si possible avec des opérateurs de recherche (+, -, etc.)
      - affiner la requête, selon les possibilités offertes : clustérisation, réseaux, proposition de mots-clés...
      - consulter les résultats pertinents

       
    • Pour une utilisation avancée :
      - paramétrer la requête si le métamoteur le permet :
      choisir les outils et sources à interroger, éventuellement le nombre de réponses par outil interrogé
      - paramétrer l'affichage des résultats : linéaire, cartographique, graphique...

       

    *** Avantages des métamoteurs :

    • La simplification et le gain de temps :
      - une seule requête pour plusieurs outils, au lieu d'interroger successivement différents moteurs et annuaires.

    • L'élargissement des recherches :
      - possibilité d'interroger de nompbreuses sources : d'une dizaine à un millier (sur Copernic)
      - possibilité d'interroger des sources spécialisées (presse, annuaires du web invisible...)

    • Le renforcement de la pertinence des résultats :
      - la sélection des documents est plus poussée sur les métamoteurs, puisque le calcul de pertinence s'opère sur plusieurs moteurs à la fois (exemple de Ixquick qui ne retient que les 10 premiers documents trouvés sur les outils interrogés)

      => les métamoteurs sont intéressants pour le défrichage d'un sujet, pour obtenir un panorama des principales ressources, notamment des sites de référence sur un thème.

    • L'exploitation sophistiquée des résultats :
      - nombreuses fonctionnalités avancées pour le traitement et l'exploitation des résultats : par exemple les "réseaux sémantiques" sur Kartoo, la"clustérisation" (i.e. catégorisation automatique des résultats) sur Vivisimo, quelques fonctions d'analyse de contenu sur SurfWax, ou bien les nombreuses possibilités des métamoteurs "hors ligne".

    • Les paramétrages, la personnalisation :
      - comme les moteurs de recherche (et parfois davantage), les métamoteurs offrent souvent des possibilités de paramétrage (des requêtes, des résultats...) et de personnalisation
      - les métamoteurs hors ligne, comme Copernic, peuvent être utilisés comme des outils de veille

    *** Inconvénients, limites :

    • Des requêtes souvent moins précises :
      - les métamoteurs interrogeant d'autres outils, les procédures et fonctions de recherche sont généralement moins développées, moins précises que sur les moteurs de recherche ; la syntaxe des requêtes doit s'adapter aux différentes syntaxes des outils

    • Une exhaustivité des recherches moins poussée que sur les moteurs :
      - les métamoteurs ne retiennent généralement que les premiers résultats trouvés sur les outils interrogés ; si cette sélection renforce la pertinence "apparente" des résultats (cf plus haut) et réduit un peu le "bruit" des moteurs de recherche, cette limitation du nombre des résultats peut en retour empêcher de trouver des documents rares, mal classés dans les moteurs... Les métamoteurs participent, à leur manière et par leurs principes de fonctionnement, au renforcement des effets pervers de "l'indice de notoriété" de Google : prime aux sites les plus connus, effet "boule de neige" de la notoriété, etc.
       
        => En résumé, les métamoteurs doivent être utilisés, non pas à la place des moteurs de recherche ou des annuaires, mais en complément de ces outils, selon la nature, le type de recherche à effectuer : pour des recherches documentaires thématiques, des défrichages, des repérages de sites de référence sur un thème, des cartographies de réseaux de ressources, des recherches sur des ressources spécialisées, des activités de veille, de surveillance...
      ou encore des comparaisons d'outils.

     


     

     

    Typologies des métamoteurs

       

    Il existe une certaine diversité des métamoteurs et de grandes différences dans leurs performances, notamment dans la pertinence et dans la présentation des résultats.
    Les typologies des métamoteurs ont évolué
    et se sont enrichies, selon les différentes innovations techniques. De nouveaux critères sont apparus (comme la présentation cartographique).


    Cette première typologie est aujourd'hui en partie dépassée (il n'existe presque plus d'aides à la saisie).

    On peut recenser actuellement les critères suivants, pour répartir les métamoteurs (certains critères étant évidemment combinables) :

    • Le mode d'interrogation et de classement des résultats :
      C'est la première typologie "historique", qui nécessiterait une remise à jour. Elle distinguait trois catégories de métamoteurs, selon la manière dont ils interrogeaient les outils de recherche et dont ils classaient les résultats :
      • les aides à la saisie : simple interface de recherche, donnant un accès unique aux interfaces de requête de plusieurs moteurs et annuaires. Interrogation successive de chaque outil.

      • les listes de résultats : pas d'élimination des doublons

      • les listes synthétisées : fusion des résultats

    • L'implantation du métamoteur :

      • les métamoteurs en ligne (on line) :
        l'outil n'est accessible que sur le web, à distance : c'est le cas de la très grande majorité des métamoteurs

      • les métamoteurs hors ligne (off line) :
        l'outil peut être installé en local, sur le disque dur de l'utilisateur, et faire des recherches lors d'une connexion :

        => Cette typologie est de plus en plus répandue aujourd'hui et est devenue le premier critère de distinction des métamoteurs


    • La présentation des résultats :
      Au moins trois types de métamoteurs peuvent se distinguer, plus ou moins clairement, selon le type de présentation et d'exploitation des résultats :

      • Présentation linéaire :
        Présentation traditionnelle des résultats, sous forme de listes

      • Présentation cartographique :
        Présentation graphique des résultats : réseaux, cartes...
         
      • Présentation par catégories :
        Regroupement des résultats selon des catégories (clustérisation)


          => Typologie apparue avec Kartoo, MapStan et Vivisimo
    • La nature des ressources sélectionnées :
      Ce critère, lié à la nature des ressources, devient de plus en plus important pour les métamoteurs, comme pour les autres catégories d'outils. On distingue ainsi :

      • les métamoteurs généralistes :
        Recensent tous types de ressources, sans distinction

      • Les métamoteurs spécialisés :
        Recensent certains types de ressources, selon différents critères :
        • la discipline ou le domaine de connaissance
        • le support : images, sons...
        • l'origine des ressources : ressources de presse, web invisible, etc.
        • tout autre critère


           


    TABLEAU RECAPITULATIF DES TYPOLOGIES
    ET EXEMPLES DE METAMOTEURS


     

    Critères de typologies

     

    Types de métamoteursTypes de métamoteursTypes de métamoteurs
    Selon le mode d'interrogation et de classement des résultats

    Aides à la saisie

    > ancienne catégorie de métamoteurs aujourd'hui pratiquement disparue

    Listes de résultats

    > ancienne catégorie de métamoteurs aujourd'hui pratiquement disparue

    Listes synthétisées

     

     

    Exemples : 
    Selon l'implantation du métamoteur
    Métamoteurs 
    en ligne
    Métamoteurs 
    hors ligne 

     

     

     

    Exemples : 
     

     

     

    Selon la présentation des résultats
    Métamoteurs linéaires
    Métamoteurs cartographiques
    Métamoteurs avec catégories, analyses de contenu
    Exemples : 
    Selon la nature des ressources
    Métamoteurs généralistes
    Métamoteurs spécialisés, ou avec des modules spécialisés
     
    Exemples : 
    • Eve (recherche de morceaux de phrases)
    • Iwolf
      (recherche d'images)
    • Newstraler
    • FindArticles (recherche d'articles de presse)
    • FindForward (modules de requêtes sur images, fichiers, weblogs...)
    • MOM
    • Copernic
    • Profusion (web invisible)
    • Ithaki (news)

       

     

     


      Différents types de métamoteurs

      Aides à la saisie, listes de résultats, listes synthétisées

      Les métamoteurs hors ligne

      Les métamoteurs cartographiques

      La clustérisation, l'analyse de contenu

       


        Aides à la saisie, listes de résultats, listes synthétisées



         

        Première typologie "historique" : selon les fonctionnalités et le classement des résultats.

        Trois types de métamoteurs : selon un degré croissant de richesse de fonctions

        • 1/ Les aides à la saisie :
            Appelés aussi Interfaces de recherche multiple, ou CUSI (Configurable Unified Search Interface)
          Ils donnent un accès unique
          aux interfaces de requête de plusieurs moteurs et annuaires ; mais l'interrogation de chaque outil reste successive, et non simultanée.
          A noter : ce type d'outils n'existe pratiquement plus aujourd'hui. Easy Searcher 1 semble être l'un des derniers représentants de cette catégorie.

            2/ Les listes de résultats :
            Appelés aussi Interfaces de recherche unifiée, ou SUSI (Simultaneous Unified Search Interface). Ils interrogent simultanément plusieurs outils mais donnent les résultats outil par outil, sans faire la fusion. Cette catégorie de métamoteurs est également en voie de disparition ; voir l'exemple de MetaSearch.

        3/ Les listes synthétisées :
        Ils représentent aujourd'hui l'écrasante majorité des métamoteurs.


         

         Les aides à la saisie Les listes de résultatsLes listes synthétisées
        Principes communs

         

        • interface de saisie unique, donnant accès à plusieurs types d’outils (moteurs, annuaires…)
           
        • classification des outils par catégorie
           
        • choix de l'outil de recherche par l’utilisateur
        Fonction-
        nement
        • plusieurs requêtes successives sur les différents outils choisis
           
        • plusieurs syntaxes de recherche
           


           
           
           
           
           
           
           
           
           
           
           
           

        • envoi d'une seule requête à plusieurs moteurs et annuaires
        • une seule syntaxe pour formuler la requête
           
        • sélection des résultats les plus pertinents de chaque outil

           


           
           
           
           
           
           

        • envoi d'une seule requête à plusieurs moteurs et annuaires
           
        • une seule syntaxe pour formuler la requête
           
        • sélection des résultats les plus pertinents de chaque outil
           
        • analyse des résultats
             
        • classement des résultats
           
        Avantages
        • réduction du temps de recherche
           
        • augmentation des possibilités de recherche
          (par rapport à l'utilisation d'un seul outil)
           
           
           
           
           
           
        • simultanéité des recherches
           
        • gain de temps important
           


           
           
           
           
           
           
           
           
           
           
           
           
           
           

        • élimination des doublons
           
        • présentation d’une liste unifiée de résultats
           
        • classement des résultats par ordre de pertinence ou par thème
           
        • vérification de la validité des liens fournis
           
        • possibilités de paramétrage
           
        Contraintes
        • utiliser la syntaxe d’origine de l’outil choisi
           
        • recherches successives
        • syntaxe de recherche réduite
           
        • présentation des résultats classés par moteurs
        • pas d'élimination des doublons
        • syntaxe de recherche 
          réduite

         
         

         

        Exemples

         

         

         


         

        Critères importants de différenciation des métamoteurs :

        • nombre et type d'outils de recherche utilisés
        • domaines d'exploration (web, forums...)
        • choix des moteurs
        • utilisation des opérateurs booléens et des critères de recherche
        • critères de classement des résultats : par moteurs, par catégories, par pertinence...
        • limitation du nombre de réponses par moteur
        • indication du moteur ayant fourni la réponse
        • élimination des doublons
        • paramétrage de l'affichage des résultats


           

         

        Les métamoteurs hors ligne
           

          Typologie la plus importante actuellement : selon l'implantation du métamoteur

          => voir la partie : Métamoteurs hors ligne

           

            Les métamoteurs cartographiques

             

            Ces types de métamoteurs sont apparus en 2000-2001, présentant les résultats sous forme graphique ou cartographique : réseaux, plans... Ces outils s'inspirent des outils de cartographie de l'information : Leximappe, Sampler, Umap..., qui existent depuis déjà longtemps, hors du contexte d'internet.

            Représentation de l'information sous forme de réseaux, de cartes sémantiques, dans lesquels les sites web sont représentés par des noeuds, des places (MapStan) ou des sphères (Kartoo), et les relations entre les sites par des liens (ou des rues, sur MapStan), censés exprimer la proximité, la similarité des sites ou des thèmes.

            Il existe encore assez peu de métamoteurs cartographiques :
            - en France : deux outils innovants : Kartoo et MapStan
            - aux Etats-Unis : Miner3D, WebBrain, Map.Net
                 

            Fonctionnalités complémentaires

            • Filtrage collaboratif, fondé sur l'utilisation des requêtes d'autres utilisateurs
            • techniques d'extraction pour l'élaboration de résumés automatiques des documents retrouvés

             

            A/ Kartoo
              Lancé en avril 2001, Kartoo est développé par une jeune société française, basée à Clermont-Ferrand.
              Depuis novembre 2003, Kartoo en est à sa version 4.
              Il permet d'interroger 15 moteurs et annuaires.

              A sa naissance, Kartoo a renouvelé le monde des métamoteurs par plusieurs innovations :

              • possibilité d’utilisation de champs de recherche : premier métamoteur à proposer cet enrichissement
              • présentation cartographique des résultats
              • utilisation des liens sémantiques, permettant d’affiner les recherches
              Interface graphique très originale ; nombreuses possibilités de recherche :
              Nombreux critères pour préciser sa requête : titre de la page, adresse du site, pages d’un seul site, domaine...
                • En mode simple :
                  • choix de la Langue
                  • sélection des moteurs interrogés manuelle ou automatique
                     
                • En mode de recherche avancée :
              L'originalité de Kartoo réside dans la présentation et l'exploitation des résultats :
              • présentation dynamique, grâce à la technologie Flash
              • résultats présentés sous forme de carte thématique :
                • sites représentés par des sphères
                • sites considérés comme les plus pertinents sont mis en évidence
                • sites reliés entre eux par des liens sémantiques (thèmes)
                • affichage d’une liste de mot-clés liés à la requête
                • pour chaque site, affichage instantané, avec la souris : de l’URL, des moteurs utilisés et d’un résumé
              • plusieurs possibilités d'affinement de la requête :
                • par suggestions de mots-clés et d'expressions, trouvés dans les descriptions des sites
                • par utilisation des requêtes les plus fréquentes
                • par suggestions provenant du métamoteur lui-même
              Autres caractéristiques :
              • utilisation implicite du ET (comme Google)
              • possibilité d’interrogation en langage naturel , mais résultats décevants
              • fonctionnalités de mémorisation et de personnalisation des requêtes : le Kapitalyser, qui permet de sauvegarder les dernières requêtes, les mots-clés, les sites visités
              • service de veille (sur abonnement) : la fonction Watch, qui offre un service d'alerte sur les nouveaux sites

                 


                   
                 

                B/ MapStan Search
              En octobre 2001, sortie de MapStan Search, nouveau métamoteur de recherche cartographique et de capitalisation des connaissances.

              Technologie originale utilisée, nommée "Web Positioning System" (WPS), qui est l'aboutissement d'un programme de R&D labellisé ANVAR. Dépôt de brevet en décembre 2000.

              Technologie du WPS construite autour de trois principes :

              • La visualisation de l'information :
                le WPS calcule et dessine des plans. Les informations et leurs relations sont présentées de façon synthétique et intuitive.
                résultats présentés sous forme de plan de quartier, avec des places (sites sélectionnés) et des rues (liens de similarité entre les sites).lorsque plusieurs sites sont associés dans les mêmes recherches, ils sont regroupés sur une même place
                possibilité d'affiner les recherches : la pertinence des sites est indiquée par la couleur de la bordure des places, allant du jaune au rouge, selon leur classement par les outils de recherche.
                • les pages les plus pertinentes des recherches similaires sont proposées (en bleu)
                • un catalogue dynamique des sites : la fonction "Explorer" permet de dresser le plan des sites qui constituent une place et de les ordonner selon leur similarité
                     
                   
              • La personnalisation "orientée utilisateur" : utilisation d’algorithmes d'analyse des usages et des comportements pour déterminer des profils d'utilisateurs :
                • barre d'outils personnalisable : MapStan.net
                • possibilité d'élaborer des plans personnalisés de navigation, à partir de ses centres d'intérêt
                   
              • L'intelligence collective : synthèse des informations et de leurs relations selon une analyse, sans classification préalable, des usages et des comportements des utilisateurs.
                • possibilité d'être informé sur les profils des autres utilisateurs de Map Stan
                • possibilité de partager l'information, de bénéficier de l'expérience des autres utilisateurs

              "Le WPS est à la fois un outil d'accès personnalisé à l'information et un moteur de découverte fondé sur l'analyse des usages et des comportements, qui peut être facilement mis en oeuvre, pour optimiser le système d'information de l'entreprise (Intranet, Portails d'entreprises, bases de connaissances...) et les solutions existantes (moteurs de recherche, Knowledge Management, solutions d'indexation...)."

              Point faible : temps d'accès assez long.

              Sources :
              - Andrieu, O., Actu Moteurs 2001/52, du 24 au 28 décembre 2001,
              - L'internaute : http://www.linternaute.com/0redac_actu/0112_decembre/011218mapstan.shtml
              - Netsources, n° 35, novembre-décembre 2001

               

              => A noter : MapStan semble désormais limiter ses requêtes au seul index de Google ; ce qui pose problème pour le considérer toujours comme un véritable métamoteur, utilisant plusieurs outils. Il reste encore outil de "deuxième niveau"

               

               

               

                La clustérisation, l'analyse de contenu

                   

                  Hormis la cartographie des résultats, deux autres grandes tendances d'innovation des métamoteurs peuvent être distinguées dans la manière de traiter et d'exploiter les résultats :

                  - la clustérisation, ou catégorisation automatique dans des catégories établies a posteriori, selon les caractéristiques propres des résultats trouvés : voir par exemple Vivisimo, qui a introduit le premier cette technique très intéressante de classement des résultats ; mais aussi 2loq.com, alias Easy to find,ou
                  KillerInfo. La clustérisation permet d'affiner les requêtes, de regrouper des pages web proches, d'éliminer des pistes de recherch non pertinentes, etc. En bref, la catégorisation automatique, très développée également sur le moteur de recherche Exalead, représente l'une des voies les plus prometteuses de la recherche d'information, car elle apporte de la "signification", de la sémantique, dans les masses informes de ressources du web.

                  - l'analyse de contenu : un métamoteur américain très innovant,
                  SurfWax, propose depuis 2003 de nombreuses et nouvelles fonctions assez originales, de personnalisation, de paramétrage, mais surtout d'exploitation des résultats : il s'agit d'une sorte d'analyse de contenu des résultats, permettant de situer les mots-clés dans leur contexte, de repérer les mots les plus importants d'une phrase, etc. Sans être une technique de classement des résultats (comme la clustérisation), l'analyse de contenu des résultats est une nouvelle forme de traitement, appelée probablement à se développer sur d'autres outils. Elle permet d'enrichir et de préciser les requêtes et constitue une incontestable valeur ajoutée dans le traitement des résultats.
                  A notre connaissance, SurfWax serait actuellement le seul métamoteur à proposer ce genre de fonctionnalités.

                   

                  => sur la clustérisation et l'analyse de contenu, voir la partie Traitement des résultats



                   


                  Page revue et mise à jour le 18 avril 2005.
                  Ce support de formation peut être librement exploité, sous réserve de citer son origine.


                  © URFIST Bretagne-Pays de Loire, Février 2002