Recherche simple et avancée

COMPARAISON DES METAMOTEURS DE RECHERCHE :


Remarques sur les fonctionnalités de recherche et présentation du TP

2/ Fonctions de recherche en mode simple

Grille de comparaison de la recherche en mode simple

3/ Fonctions de recherche en mode avancé

Grille de comparaison de la recherche en mode avancé

 


 

Remarques sur les fonctionnalités de recherche et présentation du TP


 

  • Quelques remarques générales :
    - sophistication, diversification des fonctionnalités de recherche : progrès considérables dans les fonctions offertes, dans les possibilités de filtrage des requêtes, etc.
    - augmentation, amélioration et simplification des fonctions de recherche en "mode simple" : désormais, la page d'accueil de plusieurs métamoteurs offre la quasi-totalité des fonctions de recherche.
    - rapprochement des métamoteurs et des moteurs de recherche : aujourd'hui, les méta-outils offrent des fonctionnalités de recherche proches de celles des moteurs.

    - progrès les plus importants : dans les options de filtrage de l'information, dans les possibilités offertes aux internautes d'activer eux-mêmes certains filtres : géographiques, linguistiques, champs de requête, etc.
     
  • Objectifs du TP :

    - observer et tester (presque) toutes les fonctions de recherche présentes sur les métamoteurs, dès la page d'accueil et en mode avancé ;
    - pouvoir comparer quelques uns des métamoteurs, à partir de l'observation de leur formulaire et de leurs fonctions de recherche

  • Regroupement des fonctionnalités ou options de recherche en trois catégories :
    - Options linguistiques
    - Options de recherche booléenne et de proximité
    - Options de filtrage des requêtes





2/ Fonctions de recherche en mode simple

Pour le mode simple, faire la comparaison des 4 métamoteurs suivants :

2.0 Option de recherche avancée

  • Existe-t-il une option de recherche avancée, disponible dès la page d'accueil ?
    *** A noter : l'existence d'un module de recherche en mode avancé est une évolution assez récente : au début, les métamoteurs n'avaient pas de recherche en mode avancé, et tous ne l'ont pas encore.

2. 1 Les options linguistiques
 

    • Minuscules/majuscules :
      > sensibilité à la casse : le métamoteur est-il ou non sensible à la différence minuscules/majuscules ?
      Est-ce qu'il adapte la requête aux règles de chaque moteur (sensibilité à la casse), ou bien est-ce qu'il ne tient pas compte des spécificités des moteurs (insensibilité ?
      Intérêt : pour la distinction des noms propres et des noms communs.
      • Exemple : paris, PARIS, Paris
         
    • Distinction des accents, lettres accentuées :
      > sensibilité à la casse : le métamoteur prend-il ou non les accents en compte ?
      Intérêt : pour les recherches plus fines sur les occurrences
      • Exemple : ferme/fermé, côte/coté
         
         
    • Recherche d'une expression, de phrases :
      - fonction liée à la présence implicite d'opérateur de proximité ; possibilité ou non de recherche sur des expressions ou des phrases exactes sur la page d'accueil ;
      • Exemple : taper, avec et sans guillemets, une expression ou une phrase quelconque (par ex., maladie de la vache folle)
         
    • Troncature à droite disponible :
      - possibilité ou non d'élargir les recherches à partir de la racine des mots
      > Questions : disponibilité ou non de la troncature sur la page d'accueil ? option proposée par défaut ou non ? quelle étendue de la troncature (3 ou x caractères) ? quelle syntaxe (*, %) ?
      • Exemple : requêtes sur le préfixe biblio
         
    • Interrogation en langage naturel :
      Le métamoteur offre-t-il la possibilité de poser desquestions en langage naturel ? Autrement dit, utilise-t-il lui-même un moteur de recherche en langage naturel (comme AskJeeves) ?
      • Exemple : poser la question :
        qui a assassiné Henri IV ?
        --> terminer la question par un ?
    • Outil de type thésaurus :
      Existe-t-il des outils linguistiques, pouvant aider au choix des mots-clés, comme une sorte de thésaurus pour la recherche ?

       

2.2 Options de recherche booléenne et de proximité : 4 critères

    • Opérateur ET implicite :
      > l'opérateur d'intersection (ET) est-il implicite ?
      - sur une requête comportant deux termes, le métamoteur utilise-t-il le ET d'intersection ou le OU d'union ?

      Enjeu important : très grande différence dans la pertinence des résultats selon l'opérateur utilisé
      • Exemple : bibliothèque numérique
         
    • Tous les opérateurs booléens disponibles :

        > tous les opérateurs booléens sont-ils disponibles en recherche simple : ET (signe +, ou AND), OU (OR), SAUF (signe -, AND NOT) ?
        • Exemple : +bibliothèque +numérique, bibliothèque OR numérique, +bibliothèque -numérique
           
    • Opérateur de proximité disponible :
        > l'opérateur de proximité (NEAR ou PRES) est-il disponible en recherche simple ?
      •  
        • Exemple : bibliothèque NEAR numérique
           
    • Possibilité d'équation de recherche avec parenthésage :
      Peut-on faire une équation de recherche plus complexe, avec des parenthèses ?
        • Exemple : bibliothèque ET (numérique OU électronique)
           

2.3 Options de filtrage des requêtes

Plusieurs types de filtrages des requêtes sont possibles, dès le mode simple : géographique, linguistique, par types de ressources, etc.
Il existe plusieurs niveaux de filtrage, du plus large au plus précis : recherches sur les différentes parties du web, sur les types de documents, sur les documents eux-mêmes...
 

  • Filtrage géographique : web mondial, francophone, régional
    > quelle possibilité de préciser l'origine géographique des ressources ?
     
  • Filtrage linguistique :
    > quelle possibilité de choisir la langue des documents ? combien de langues proposées ?

  • Filtrage par types de ressources : images, vidéo, audio, ressources de presse.
    > quelle possibilité de faire des recherches multimédia, de chercher uniquement des images ?
     
  • Filtrage des ressources Internet : Web, forums Usenet, Messagerie, Journaux…
    > quelle possibilité de choisir la nature des ressources : pages web, messages de forums, courrier électronique .. ?
     
  • Filtrage thématique :
    > quelle possibilité de chercher des documents par catégories pré-définies, par domaines thématiques ?
     
  • Filtrage par types de formats :
    > quelle possibilité de chercher des documents d'un format de fichier spécifique : PDF, RTF, PPT, etc. ?
     
  • Filtrage par dates :
    > quelle possibilité de préciser les dates de publication des pages web ?
     
  • Filtrage des champs de requête : titre, URL, domaine…
    > quelle possibilité de requête sur des champs précis des pages web, dès la page d'accueil ?
     
  • Autres filtrages :
    > existe-t-il d'autres possibilités de filtrage ? si oui, lesquelles ?  
    • Exemples : filtrage parental

 


Grille de comparaison des métamoteurs

2/ Fonctions de recherche en mode simple


 

CRITERES DE COMPARAISONIxquickKartooProfusionSurfWax
2.0 Option de recherche avancée disponible    
2.1 Options linguistiques    
Distinction Maj / min    
Distinction des accents    
Recherche d’une expression    
Troncature disponible    
Interrogation en langage naturel    
Outil de type thesaurus    
2.2 Options de recherche booléenne et de proximité    
Opérateur ET implicite    
Tous les opérateurs booléens disponibles    
Opérateur de proximité disponible    
Equation de recherche avec parenthésage    
2.3 Options de filtrage des requêtes    
Filtrage géographique : web mondial, francophone, régional     
Filtrage linguistique : choix de la langue des documents    
Filtrage par types de ressources : images, vidéo, audio, journaux…    
Filtrage des ressources Internet : Web, forums Usenet, Messagerie …    
Filtrage thématique : choix du domaine de recherche    
Filtrage par dates : choix des dates de publication…    
Filtrage par types de formats : html, rtf, ppt….    
Filtrage des champs de requête : titre, URL, domaine…    
Autres filtrages     


 

*** Premier bilan de cette comparaison des modes de recherche simple :

  • Que révèle cette comparaison ?
    - une certaine disparité des métamoteurs, selon les fonctionnalités : certains outils sont plus performants dans les options linguistiques, d'autres dans le filtrage, ou l'utilisation des opérateurs ;
    - la rareté de certaines fonctionnalités : l'opérateur de proximité, l'outil linguistique, le parenthésage... restent des fonctionnalités peu répandues

  • Quel métamoteur présente les fonctions de recherche en mode simple les plus intéressantes ?

  • Ces critères sont-ils suffisants pour évaluer la pertinence d'un outil ?
    - à l'évidence, non : ce n'est pas dans la recherche en mode simple que réside l'intérêt et la puissance des métamoteurs

    - en réalité, cette première comparaison montre les orientations techniques des métamoteurs, qui ont des priorités différentes dans le traitement des requêtes

     

 


3/ Fonctions de recherche en mode avancé

 

Pour le mode avancé, faire la comparaison des 3 métamoteurs suivants :

 

3.1 Options de recherche booléenne et de proximité


Critères de comparaison :
 

    • Tous les opérateurs booléens disponibles (ET, OU, SAUF) :
      • Exemples de requêtes : "bibliothèque numérique" ET XML ; XML SAUF bibliothèques
         
    • Opérateur de proximité disponible : NEAR
      • Exemple : "bibliothèque numérique" NEAR XML
         
    • Possibilité d'équation de recherche avec parenthésage :
      > quelle possibilité d'élaborer des équations de recherche complexes ?
      • Exemple : recherche de documents sur les outils de recherche (les annuaires et moteurs, mais pas les métamoteurs) en France et au Canada :
        - (outils de recherche AND NOT métamoteurs) AND (France OR Canada)
         
    • Opérateur d'adjacence disponible (distance entre deux mots) :
      > quelle possibilité de paramétrer une requête sur la distance entre deux mots ?
      • Exemple : bibliothèque ADJ 2 numérique
         

3.2 Filtrage des requêtes sur les dates et formats de fichiers

    • Option de recherche sur les dates des documents :
      > quelles possibilités de choix dans une liste d'options ? documents parus depuis un mois, trois mois, six mois, etc. ?
       
    • Option de recherche sur les formats de fichiers :
      > étendu ? limité ? Relever le nombre des formats proposés.
       

3.3 Filtrage des requêtes sur les champs

Fonctionnalité de filtrage de la recherche proposée de plus en plus souvent par les métamoteurs, en mode simple ou/et en mode avancé. Ces options de filtrage, analogues à celles des moteurs de recherche, sont assez récentes sur les métamoteurs. Plusieurs champs interrogeables, selon une syntaxe généralement commune, mais pouvant comporter quelques variations selon les outils.
 

 

- Champ indexé : titre complet de la barre de titre d'une page web
- Intérêt : recherche précise d'un document, affinement des requêtes sur les pages web contenant les mots-clés dans leur titre

- Syntaxe : title:, intitle:, allintitle:

  • Exemple : recherche de pages web contenant le terme : métamoteurs dans le titre
    - title:metamoteur

- Champ indexé : URL complète citée dans une page web
- Syntaxe : link:

  • Exemple : recherche de pages web citant le site de Rennes 2
     
    • Exemple : recherche de pages web comportant Université de Rennes 2 en lien

 

 

 

GRILLE DE COMPARAISON DES METAMOTEURS

 

3/ Fonctions de recherche en mode avancé
      • Option de recherche sur les noms de domaine :
        - Intérêt : permet de filtrer les recherches sur un domaine générique (par exemple .com, .edu, .org, etc) ou géographique (.fr, .ca) ; outil d'identification de l'information.
        - Syntaxe : domain:nom du domaine
        • Exemple :
          - recherche de documents sur la marée noire du Prestige, produits par les associations (domaine :.org)
          - "marée noire" ET Prestige ET domain:org
      • Option de recherche sur un serveur :
        - possibilité de limiter les recherches à un serveur précis.
        - Syntaxe : host:nom du serveur
        • Exemple :
          - recherche de toutes les pages web du site de l'Université de Rennes 2
          - host:uhb.fr

           
      • Options de recherche sur les URL :
        - Intérêt : recherche très précise d'un document
        - Syntaxes possibles : url:, inurl:, allinurl:
        > Question : quelle option de recherche dans les URL ?
        • Exemple :
          - recherche de fichiers contenant le mot métamoteur dans l'URL
          - url:metamoteur

           
      • Options de recherche sur le titre :
      • Options de recherche sur le texte :
        - Champ indexé : texte complet de la page, sauf l'URL, les hyperliens, les métadonnées
        - Syntaxe : text:
        • Exemple : recherche de pages web contenant le terme métamoteur dans le texte
         
      • Options de recherche sur les liens (adresse du lien) :
      • Options de recherche sur les liens (mot hyperlié) :
        - Champ indexé : l'expression ou le mot hyperlié, cad faisant l'objet d'un lien
        - Syntaxe : anchor:, inanchor:, allinanchor:
      • Options de recherche sur l'adresse des images :
        - Champ indexé : mot dans l'adresse URL de l'image
        - Syntaxe : image:
        • Exemple : recherche d'images de Gilles Deleuze
      • Recherche sur les pages similaires :
        - champ indexé : adresse URL d'une page similaire
        - syntaxe : related:adresse URL
        > deux utilisations possibles du champ related :
        - quelles sont les pages similaires à telle page trouvée (mais nécessité de connaître au préalable l'URL...) ?
        - à l'inverse, est-ce que telle page sur tel sujet est considérée comme page similaire ?
         
      • Autres champs de recherche :
        > y a-t-il d'autres champs de recherche, propres à certains métamoteurs ?
        • Exemple :
          - recherche sur les applets : syntaxe applet:

           

           


    CRITERES DE COMPARAISON Kartoo Ixquick Vivisimo 
    3.1 Options de recherche booléenne et de proximité 

     

     

     

     

     

     

    Tous les opérateurs booléens disponibles (ET, OU, SAUF)

     

     

     

     

     

     

    Opérateur de proximité disponible 

     

     

     

     

     

     

    Possibilité d’équation de recherche avec parenthésage 

     

     

     

     

     

     

    Opérateur d’adjacence disponible (distance entre deux mots) 

     

     

     

     

     

     

    3.2 Filtrage des requêtes sur les dates et les formats de fichiers 

     

     

     

     

     

     

    Option de recherche sur les dates 

     

     

     

     

     

     

    Option de recherche sur des formats 

     

     

     

     

     

     

    3.3 Filtrage des requêtes par champs 

     

     

     

     

     

     

    Sur les noms de domaine (domain:)

     

     

     

     

     

     

    Sur un serveur (host:)

     

     

     

     

     

     

    Sur les URL (url:, allinurl:)

     

     

     

     

     

     

    Sur le titre des pages (title:)

     

     

     

     

     

     

    Sur le texte des pages (text:)

     

     

     

     

     

     

    Sur les URL des liens (adresse du lien) (link :) 

     

     

     

     

     

     

    Sur les ancres des liens
    (mot hyperlié) (anchor:) 

     

     

     

     

     

     

    Sur l’adresse des images 

     

     

     

     

     

     

    Sur les pages similaires (related:) 

     

     

     

     

     

     

    Sur d'autres champs

     

     

     

     

     

     


     
     
      *** Premier bilan de cette comparaison des modes de recherche avancée :

    • Que révèle cette comparaison ?
      - quelques différences des métamoteurs, selon les catégories de fonctionnalités : comme en mode simple, certains outils sont plus performants dans les options linguistiques, d'autres dans le filtrage, ou l'utilisation des opérateurs ;
      - la continuité entre le mode simple et le mode avancé : la différence entre les deux modes de recherche n'est pas toujours très marquée
      - une certaine cohérence des métamoteurs dans les options de filtrage : certains champs de filtrage sont courants et présents sur (presque) tous les outils, d'autres champs ne sont présents sur aucun métamoteur

    • Quel métamoteur présente les fonctions de recherche en mode avancée les plus intéressantes ?

    • Ces critères sont-ils suffisants pour évaluer la pertinence d'un outil ?
      - en partie : certains métamoteurs offrent de nombreuses possibilités de filtrage, qui les rendent particulièrement intéressants


     

    Page revue et mise à jour : 30 Avril 2005.
    Ce support de formation peut être librement exploité, sous réserve de citer son origine.


    © URFIST Bretagne-Pays de Loire, Avril 2004