Métamoteurs hors ligne

Définition, utilisation, intérêt

Fonctionnalités des métamoteurs hors ligne

  Présentation d'un métamoteur hors ligne : Copernic

Autres métamoteurs hors ligne

Sources utilisées


Définition, utilisation, intérêt

 

Définition, typologie :

L'implantation du métamoteur constitue un critère de typologie important, comme cela a été évoqué dans la partie Principes...

Deux catégories de métamoteurs :

  • métamoteurs en ligne (on line) :
    • il faut être connecté à Internet pour les interroger, comme les moteurs de recherche
    • la plupart des métamoteurs appartiennent à cette catégorie : plus de 110 métamoteurs en ligne recensés sur Yahoo en 2004
       
  • métamoteurs hors-ligne (off line), ou clients
    • ils sont implantés sur le poste de l'utilisateur et peuvent donc être paramétrés par l'utilisateur
    • ce sont des outils considérés parfois comme des "agents intelligents" de première génération, et plus souvent comme des outils de veille
    • il s'agit d'une petite minorité d'outils

Utilisation des métamoteurs hors ligne :

  • installation sur le poste de l'utilisateur :
    - nécessité de télécharger le logiciel sur son poste, en allant sur le site de la société produisant le métamoteur
    - utilisation à partir de son disque dur
    l'acquisition d'un métamoteur hors ligne peut être gratuite ou payante

  • paramétrage initial du métamoteur :
    -
    indication de la procédure de connexion : proxy ou non, authentification de la connexion (login, mot de passe...)
    * ce paramétrage (analogue à celui du navigateur) se fait une fois pour toutes

  • fonctionnement des requêtes :
    -
    la connexion à Internet se fait au lancement d'une recherche
    - le métamoteur interroge simultanément les différents outils
    sélectionnés
    - il rapatrie les résultats obtenus sur le disque dur du poste utilisateur

    - il élimine les doublons et affiche une liste synthétisée et classée des résultats
    * un métamoteur hors ligne présente toutes les fonctionnalités des listes synthétisées

  • optimisation des recherches :
    Un métamoteur hors ligne offre de nombreuses possibilités de paramétrage par l'utilisateur, permettant d'affiner et d'optimiser les recherches (cf ci-dessous)

Avantages des métamoteurs hors ligne :

  • possibilités de recherches très étendues : notamment, recherches sur le web invisible
  • personnalisation des recherches
  • classification des sources en catégories thématiques : pertinence souvent plus grande pour les recherches par domaines
  • téléchargement des résultats et recherches sur les adresses ou les pages téléchargées
  • veille
  • édition personnalisée

 





Fonctionnalités des métamoteurs hors ligne

Les fonctionnalités d'un métamoteur hors ligne peuvent se répartir en quatre grandes parties :
- la gestion des sources interrogées
- la gestion des requêtes
- la gestion des résultats
- la gestion de la veille

  • A/ La gestion des sources interrogées :
      *
    Un métamoteur hors ligne interroge simultanément de nombreux outils et sources, et offre, sur ce plan, plus d'avantages que les métamoteurs en ligne, sur les différents points suivants :

    • le nombre d'outils interrogés :
      - ces outils offrent généralement l'accès à un très grand nombre d'outils et de sources : plus de 1000 sources sur Copernic Agent Professionnel, 800 sur BullsEye, 200 sur la version gratuite de Strategic Finder...

    • la diversité et la richesse des outils et sources :
      - ces sources et outils sont très variées : moteurs de recherche mondiaux, régionaux, généralistes, spécialisés, annuaires thématiques, ressources de presse, banques de données, sites spécialisés...

    • les domaines d'exploration :
      - les sources et outils sont répartis dans des catégories, correspondant à des domaines de recherche : le web mondial ou francophone, les services d'actualité, les forums, les banques de données, les domaines thématiques (finances, culture, éducation, vie quotidienne, etc.).
      - ces catégories peuvent être plus ou moins nombreuses selon les outils : 7 catégories sur FirstStop Websearch 3.6, 14 sur WebSeeker 5.0, 22 sur Strategic Finder 2, 125 sur Copernic Agent Pro, 150 sur BullsEye Pro 3.0

    • le choix des outils et des sources de recherche :
      - possibilité de choisir
      • la totalité des sources
      • des groupes d'outils particuliers, correspondant à un domaine de recherche
      • des outils à l'intérieur d'un groupe

    • le paramétrage du nombre de résultats :
      -possibilité de préciser le nombre maximum de résultats souhaités pour chaque source

  • B/ La gestion des requêtes :
    * les métamoteurs hors ligne permettent quelques fonctionnalités avancées de recherche : opérateurs booléens, parenthèses, troncature...

    • les opérateurs booléens :
      - en général, utilisation possible de tous les opérateurs booléens (ET, OU, SAUF) en mode de recherche avancée

    • opérateur de proximité (NEAR) :
      - utilisation possible sur certains outils (WebSeeker, Copernic, BullsEye)

    • troncature :
      - parfois possible en mode avancé

    • mots composés, expressions :
      - possibilités de recherche sur les expressions avec les options "Expression exacte", "Phrase"...

    • autres fonctions :
      - sur Copernic, possibilité de copier une équation de recherche dans une nouvelle requête
      - sur Strategic Finder, option "Filtrer automatiquement", pour télécharger les pages identifiées sur le disque et vérifier leur pertinence par rapport à la requête, utilisation de synonymes
      - sur BullsEye, possibilité d'utiliser divers filtres de recherche : sur les noms de domaine, sur le pays d'origine des pages, sur la source interrogée...


  • C/ La gestion des résultats :
    * C'est dans la gestion et l'exploitation des résultats que résident les principaux atouts des métamoteurs hors ligne, puisqu'ils permettent, à la différence des métamoteurs en ligne, une sauvegarde et une exploitation personnalisée des résultats.
    Quatre ensembles de fonctions peuvent être distinguées :

    • a) Fonctions de tri, de classement des résultats :

      • Elimination des doublons :
        - automatique sur les métamoteurs hors ligne, elle peut parfois être enrichie sur certains outils : par exemple, sur Copernic, possibilité d'éliminer les pages en double ayant des adresses différentes

      • Possibilité de tri selon différents critères :
        - possibilité de trier les résultats d'une requête selon plusieurs critères, plus ou moins variés selon les métamoteurs :
        • par score de pertinence
        • par ordre alphabétique de titres
        • par source
        • par ordre alphabétique d'adresse URL
        • par dates : de repérage, de visite, de modification
        • par extrait de page web

      • Possibilité de regroupement des résultats :
        - par exemple, sur Copernic, option "Grouper résultats", permettant des regroupements selon différentes catégories : tous les critères de tri de résultats, mais en plus :
        • regroupement par domaines : intérêt de regrouper différentes pages web hébergées sur le même serveur
        • regroupement par opérations faites ou non par l'utilisateur : résultats nouveaux, visualisés, sauvegardés, annotés, cochés.

    • b) Fonctions d'analyse et de filtrage :
      Plusieurs fonctions d'analyse des résultats offertes, des plus simples aux plus complexes :

      • Vérification des liens :
        - fonction disponible sur la plupart des métamoteurs hors ligne
        - suppression des liens identiques
        - vérification de la validité des liens
        - suppression des liens morts

      • Recherches dans le lot de résultats :
        - possibilités de requêtes dans le lot de résultats, selon de nouveaux mots-clés

      • Repérage des résultats :
        - option permettant de repérer :
        • la langue d'une page web
        • la taille, les dates de modification

      • Analyse des pages web :
        - conservation des pages web contenant exactement les mots-clés de la requête
        - extraction de mots-clés des pages web

    • c) Fonctions d'affichage et de présentation des résultats :

      • Différents formats de visualisation des résultats :
        Exemple de Copernic, avec 4 formats d'affichage :
        • Compact : seulement le titre de la page
        • Standard : titre, adresse, extrait, sources, score
        • Détaillé : format standard + langue, date de mise à jour, de repérage, concepts-clés
        • Personnalisé : possibilité de choisir la police de caractère, la couleur de surlignage...

      • Indication de "l'état" des pages web :
        - Exemple de Strategic Finder qui permet de visualiser l'état d'une page web : lue, non lue, sauvegardée, annotée...

      • Possibilités de paramétrages de l'affichage :
        - possibilités plus ou moins riches de paramétrer la présentation des résultats : choix des couleurs, des polices, des interlignes, surlignage...
    • d) Fonctions de sauvegarde des résultats et de personnalisation :

      • Téléchargement des résultats :
        - sauvegarde de pages web, issues des résultats, sur le disque dur : sur tous les outils

      • Création de dossiers personnels pour l'enregistrement des résultats :
        - enregistrement et déplacement de résultats dans des dossiers personnels, sur Copernic

      • Création d'un rapport de recherche :
        - possibilité d'éditer un rapport de recherche, sous HTML ou un format texte, récapitulant une requête et ses résultats

      • Possibilité d'éditer des résultats sélectionnés, selon différents formats :
        - édition de résultats sous Word, Excel, HTML..., sur FirstStop Websearch

      • Possibilités de recherches sur des résultats et des rapports archivés :
        - sur BullsEye, fonction de requêtes sur le contenu des rapports archivés, et sur les résultats eux-mêmes

      • Archivage des requêtes :
        - possibilités d'archiver les requêtes, de gérer l'historique des recherches, de les classer...
 
 

 

  • D/ Gestion de la veille :
    *
    les métamoteurs hors ligne sont également des outils de veille, ou offrant des fonctionalités de veille, plus ou moins développées.
    Deux grandes fonctions de veille sont généralement disponibles :

    • La veille sur une requête :
      - enregistrement d'une requête
      - paramétrage de la veille : délais, planification, adresse du serveur pour l'envoi des rapports, etc.

    • La veille sur un site ou une page web :
      - possibilité de surveillance et d'alerte sur les modifications d'une page web
      - différents paramétrages possibles : alerte à partir d'un certain nombre de mots modifiés...

 
   



    Présentation d'un métamoteur hors ligne :
Copernic

 

Copernic : http://www.copernic.com/fr

  • Repères :
    - l'un des tout premiers métamoteurs "off line", sorti en 1997 ; d'origine québecquoise ; société Copernic Technologies Inc., devenue en 2002 Copernic.
    - nouvelle version en 2000, avec Copernic 2000 plus et Copernic 2000 Pro
    - autre version en 2001, avec Copernic 2001 Pro
    - dernière version en octobre 2002 : Copernic Agent Professionnal, version 6

  • Diversification des produits de Copernic :
    Depuis quelques années, la société Copernic a diversifié son offre et propose actuellement quatre types d'outils :
    • le métamoteur hors ligne : Copernic Agent Basic, Personnal et Professionnal
      * c'est uniquement cet outil qui est présenté ici
    • le moteur de bureau : Copernic Desktop Search : version gratuite, récemment mise à jour (Copernic Desktop version 5.1, du 30 mars 2005) ; les moteurs de bureau sont des outils personnels particulièrement intéressants, permettant de faire des recherches très rapides sur le disque dur de l'utilisateur.
    • l'outil de surveillance : Copernic Tracker, permettant de déceler des changements sur un site web. Copernic Tracker est un outil de veille, complétant le métamoteur.
    • l'outil de résumé : Copernic Summarizer

  • Distribution du métamoteur :
    - logiciel diffusé en trois versions :

        • Une version gratuite : Copernic Agent Basic :
          - permet d'interroger plus de 95 sources, réparties en 11 catégories de recherche

        • Deux versions payantes :
          - permettent toutes les deux d'interroger plus de 1000 outils de recherche, classés en 120 catégories
          • Copernic Agent Personnal (29,95 €) : version intermédiaire
          • Copernic Agent Professionnal (79,95 €) : version complète, avec des fonctionnalités de recherche et de veille en plus


    • Quelques atouts de Copernic :
      • grande convivialité et simplicité de l'interface ; outil très facile d'utilisation
      • performances :
        • interrogation simultanée des outils
        • aide à la recherche, possibilités d'affinement
        • édition d'un Rapport de recherche
        • simplicité et rapidité de la recherche
        • nombreuses possibilités de gestion des résultats : création de dossiers pour les recherches, plusieurs options d'affichage et de classement des résultats, téléchargement de documents, vérification des liens....
        • automatisation de la veille : programmation des mises à jour automatiques, nombreux paramétrages des fonctions de veille

    • Pour une évaluation fine et critique de Copernic Agent Professionnal, nous renvoyons à l'étude réalisée par Marc Duval, qui a identifié neuf faiblesses et sept forces de la nouvelle version de Copernic
      • "Les neuf faiblesses sont :
        1. La limitation des langages de recherche.
        2. L'absence de recherche par champs.
        3. La gestion déficiente des pages identiques (doublons).
        4. La déficience dans l'affinage du résultat.
        5. Une interface encombrée.
        6. La restriction des pages à surveiller.
        7. La déficience dans l'envoi des rapports de recherche.
        8. L'intégration dans Internet Explorer.
        9. L'inadéquation entre le site de recherche et le métachercheur

      • Les sept forces sont :
        1. La surveillance automatique de changements dans des pages Web.
        2. Le résumé des pages Web trouvées.
        3. La création des catégories personnelles.
        4. La recherche dans le résultat de recherche.
        5. La création de sous-dossiers.
        6. L'envoi des rapports de recherche par fichier joint.
        7. L'annotation des références"

        (DUVAL, Marc. Copernic Agent Professionnal, l'agent semi-professionel. Québec : DSI, novembre 2002.
        Disponible sur : http://www.dsi-info.ca/meta-moteurs/Copernic/evaluation.html
        )

Exemple d'utilisation de Copernic : voir "TP sur Copernic"




Autres métamoteurs hors ligne

 

  • Strategic Finder :
    http://www.strategicfinder.com

    - Société grenobloise Digimind
    - deux versions :
    • version gratuite : 200 sources, 22 domaines
    • payante : 457 € (en 2003)
       
  • Portulan :
    http://www.portulan.com/fr/

    - Métamoteur francophone, destiné aux professionnels de la documentation et de la veille
    - pas de version gratuite : disponible par abonnement mensuel.
    ** A noter : les tarifs sont indiqués en francs ! Ce métamoteur existe-t-il encore ?
  • FirstStop Websearch :
    http://www.firststopwebsearch.com/

    - Métamoteur américain ;
    - société Brush Systems Group.
    - trois versions :
    • version gratuite : 16 outils, 30 résultats par source
    • version Deluxe Edition : 19,95 $ : plus de 50 sources, 10 000 résultats par recherche
    • version Visual Edition : 34,95 $ : fonctionnalités de visualisation en plus

  • WebSeeker :
    http://www.bluesquirrel.com/products/seeker/
    - métamoteur américain, développé par la société BlueSquirrel
    - 70 outils de recherche, 14 catégories
    - version payante : 29,95 $




Sources utilisées

 

  • CLERTE, Jennifer. Copernic Agent Professionnal : nous l'avons testé pour vous. NetSources, n° 40, septembre-octobre 2002

  • DUVAL, Marc. Copernic Agent Professionnal, l'agent semi-professionel. Québec : DSI, novembre 2002. Disponible sur : http://www.dsi-info.ca/meta-moteurs/Copernic/evaluation.html

  • FOENIX-RIOU, Béatrice, CLERTE, Jennifer. 15 outils pour une veille efficace sur le Net. NetSources hors-série, n° 6, juin 2003. 

Dernière mise à jour : 20 avril 2005.
Ce support de formation peut être librement exploité, sous réserve de citer son origine.


© URFIST Bretagne-Pays de Loire, Avril 2004