| |
Documentation de
l' utilisateur
Formulation de la requête
Le formulaire de requête permet à
l'utilisateur
de préciser et de soumettre sa requête en paramétrant
un certain nombre de critères de recherche.
Les critères " Mot-vedette ", "
Auteur ", " Domaine ", " Catégorie
grammaticale ", et " Type d'entrée " peuvent
être utilisés isolément ou en combinaisons.
Si l'un des critères n'est pas jugé pertinent pour
la requête, la case correspondante reste vierge. L'utilisateur
peut formuler sa requête de différentes manières,
ce qui lui permet de maîtriser la taille des résultats
escomptés ainsi que le temps pour les obtenir. Il faut
en effet savoir que certaines stations de travail ne sont pas
équipées de capacité mémoire suffisante
pour permettre un affichage de la totalité des réponses
découlant de requêtes trop larges. Il est très
important d'optimiser les requêtes.
REMARQUES:
| Le critère
" Recherche plein texte " est
à utiliser avec " Sélectionner
une option de recherche ". Noter que l'espace signifie ET
logique .
|
| Les caractères
accentués ne sont pas admis. Ils doivent être traités
de
manière particulière. Par exemple, le " é
" peut être
écrit " e ", " E ", ou
" e/ ".
|
| L' Appariement de
formes (Pattern matching)
": |
- l'utilisation d'opérateurs logiques
AND, OR, NOT.
-Le OR peut être remplacé par la barre verticale
(|).
-Le AND peut être remplaé par l'espace
- l'utilisation de caractères spéciaux
Les critères de recherche
Vedette d'article : Ce
paramètre de recherche
correspond au mot, terme ou locution figée que vous
voulez repérer dans les intitulés des articles.
C'est ce mot vedette qui donne accès à l'article
le concernant.
Auteur :réfère à l'auteur des articles
du corpus
Domaine : est synonyme ici de Branche de la connaissance
Catégorie grammaticale : Il s'agit de la partie
du discours caractérisant le mot à rechercher.
Dans la base, certaines vedettes sont affectées d'une
catégorie grammaticale sur laquelle peut porter l'interrogation .
Type d'entrée : permet de demander par exemple,
soit du texte, soit des illustrations
Recherche plein texte: ce critère
est une demande de recherche élargie à utiliser
en relation avec:" Sélectionner une option
de recherche "
Dans le formulaire de requête, les
différents
champs correspondant aux différents critères de
recherche sont remplis par l'utilisateur sous forme d'une chaîne
de caractères. Par défaut, la requête porte
sur cette chaîne et toutes les chaînes contenant
la chaîne demandée.
Exemple : la requête porte sur le mot " action
" (Vedette d'article = action). La recherche prend en
compte non seulement
le mot action, mais aussi sur toutes les sous chaƮnes
contenant la séquence action, c'est à dire
actionnaire, actionner,
aussi bien que abstraction, attraction,
distraction, réaction,
etc.
Pour ancrer la recherche sur le début du mot, il faut
utiliser le caractère spécial ^ ( chapeau).
Ainsi, une requête sur ^action restreindra la recherche
à actionnaire, actionner... (mais pas
distraction)
Pour ancrer la recherche sur la fin de mot, il faut utiliser
le $ (dollar). Ainsi une requête sur action$
restreindra
la liste de résultats aux mots se terminant par action
: abstraction, diffraction, réaction,
etc.
(mais pas
actionnaire).
Pour n'obtenir qu'action il faut taper
^action$
Représentation des
accents
Signe |
Interprétation |
Exemple |
Voyelle majuscule |
représente tous les
accents |
E --> è ê é et sans
accent. |
\ (slash arrière) |
Accent grave |
a\ --> à |
/ (slash avant) |
Accent aigu |
e/ --> é |
^ (chapeau) |
Accent circonflexe |
e^ --> ê |
, (virgule) |
Cédille |
c, --> ç |
" (guillemet double) |
Tréma |
o" --> ö |
Appariement des formes
(pattern matching)
Les opérateurs les plus utiliés sont :
Signe |
Interprétation |
Exemple |
. (point) |
remplace n'importe quel
caractère |
pla.e trouvera place, plate, plaie,
etc. |
.* (point et astérisque) |
remplace n'importe quelle séquence de
caractères |
fem.* --> tous les mots commençant par
fem |
E (voyelle majuscule) |
trouve tous les "e", avec ou sans
accent |
|
| (barre verticale) |
OU de
disjonction |
femme|homme |
[ a-z ] |
remplace n'importe quel élément de l'ensemble
spécifié |
[b-f]e^te trouvera bête, fête, mais pas
tête |
Apostrophes
Pour les besoins de la recherche, la plupart des
apostrophes
sont traitées comme des séparateurs de mots. Ainsi,
pour rechercher l'Europe, l'utilisateur doit entrer
l' europe (les deux éléments sont
séparés
par un espace), et choisir l'option locution (A).
Pour certaines exceptions, cependant, l'apostrophe est
considérée
comme faisant partie intégrante du mot; par exemple :
aujourd'hui doit être entr&ecute; comme un simple
mot.
Mot,
co-occurrence et recherche de locutions
Vous pouvez entrer un ou plusieurs mots pour la
recherche
dans le texte des articles. Il est important de noter que la
barre verticale (|) est un caractère spécial
dénotant l'opérateur logique OR entre les
mots, et que l'espace ou la touche de retour chariot dénotent
l'opérateur logique AND entre les mots.
Ainsi, femme|homme
repèrera à les contextes où apparaît le mot
femme et ceux où apparaît le mot homme.
En revanche, en entrant femme homme
vous trouverez les contextes où apparaissent à la fois le
mot femme et le mot homme.
Par défaut, le moteur recherchera des
co-occurrences
dans la même phrase. Ainsi, par défaut, si vous
lancez la recherche pour belle femme, vous trouverez
toutes les phrases contenant belle ET femme,
mais pas nécessairement dans cet ordre ou proches l'un
de l'autre. En sélectionnant l'option Locution (A),
vous limiterez la recherche aux mots contigus.
Quand l'option "locution" est choisie, la recherche
rapportera uniquement les mots placés dans le même
ordre que celui que vous avez indiqué, comme dans l'expression
belle femme.
Des critères peuvent être
combinés, comme
dans : belle|beau|belles|beaux homme.*|femme.*
ce qui recherchera l'un des adjectifs ET les mots
commençant
par homme ou femme.
Pour des recherches de co-occurrences, le contexte de
recherche
est par défaut celui d'une phrase. Les utilisateurs peuvent
étendre ce contexte à un paragraphe, à un
article secondaire, ou à l'article entier.
Format des résultats:
Concordance,
rapports KWIC, Fréquence par titre
Les utilisateurs peuvent choisir deux sortes de
formats de
résultats : le format concordance (environ cinq
lignes de texte) et le Key-Word-In-Context, ou KWIC (une ligne
de texte).
Les résultats indiquent toujours le nombre de textes
recherchés,
des termes recherchés dans le corpus, et le nombre total
d'occurrences. Après ces informations générales
vient une liste d'occurrences. Chaque occurrence est
représentée
par une courte citation, contenant le titre de l'article ou de
l'article secondaire et le numéro de la page ou le mot
en question apparaît. On peut atteindre les fragments de texte
correspondants
en cliquant sur le numéro
de la page et sur le titre, ce qui permet à l'utilisateur
d'obtenir le texte entier ou la page de l'article sur lesquelles la
vedette est mise en gras.
Après la courte citation
suit un passage de contexte.
À la fin du document, les références
bibliographiques complètes pour chaque oeuvre cité
sont affichées.
Notez que les recherches définies de
manière trop peu restrictive peuvent donner des milliers de
résultats. En définissant
des critères de recherche plus précis, les
résultats
seront moins nombreux et l'analyse plus aisée.
L'option "Fréquence des mots par
article" liste le nombre
d'occurrences du terme recherché dans les entrées
d'articles. Le résultat donnera
tous les articles contenant le mot ou l'expression.
Performances du produit
| Recherche
des vedettes d'articles (et donc les articles
et les sous
articles qui leur sont consacrées), à partir des
critères présentés dans le formulaire de
requête : Vedette d'article, Auteur, Domaine, Catégorie
grammaticale (Partie du discours), Type
d'entrée. |
| Suivi des
renvois : procédures
automatiques qui identifient dans un texte les références
et établissent des liens avec les articles
cités. |
| Déplacement
automatique depuis le texte vers les planches et
leurs légendes,
et plus tard, vers les fac-similés de pages de texte
originales. |
|