| |
Documentation de
l' utilisateur
Formulation de la requête
Le formulaire de requête permet à l'utilisateur
de préciser et de soumettre sa requête en paramétrant
un certain nombre de critères de recherche.
Les critères " Vedette d'article ", "
Auteur ", " Domaine ", " Catégorie
grammaticale ", et " Type d'entrée " peuvent
être utilisés isolément ou en combinaisons.
Si l'un des critères n'est pas jugé pertinent pour
la requête, la case correspondante reste vierge. L'utilisateur
peut formuler sa requête de différentes manières,
ce qui lui permet de maîtriser la taille des résultats
escomptés ainsi que le temps pour les obtenir. Il faut
en effet savoir que certaines stations de travail ne sont pas
équipées de capacité mémoire suffisante
pour permettre un affichage de la totalité des réponses
découlant de requêtes trop larges. Il est très
important d'optimiser les requêtes.
REMARQUES:
| Le critère
" Recherche plein texte " est
à utiliser avec " Sélectionner
une option de recherche ". Noter que l'espace signifie ET logique .
|
| Les caractères accentués ne sont pas admis. Ils doivent être traités de
manière particulière. Par exemple, le " é " peut être écrit " e ", " E ", ou
" e/ ". |
| L' Appariement de formes (Pattern matching) ": |
- l'utilisation d'opérateurs logiques AND, OR, NOT.
-Le OR peut être remplacé par la barre verticale
(|).
-Le AND peut être remplacé par l'espace
- l'utilisation de caractères spéciaux
Les critères de recherche
Vedette d'article : Ce paramètre de recherche
correspond au mot, terme ou locution figée que vous
voulez repérer dans les intitulés des articles.
C'est ce mot vedette qui donne accès à l'article
le concernant.
Auteur :réfère à l'auteur des articles
du corpus
Domaine : est synonyme ici de Branche de la connaissance
Catégorie grammaticale : Il s'agit de la partie
du discours caractérisant le mot à rechercher.
Dans la base, certaines vedettes sont affectées d'une
catégorie grammaticale sur laquelle peut porter l'interrogation .
Type d'entrée : permet de demander par exemple,
soit du texte, soit des illustrations
Recherche plein texte: ce critère
est une demande de recherche élargie à utiliser
en relation avec:" Sélectionner une option
de recherche "
Dans le formulaire de requête, les différents
champs correspondant aux différents critères de
recherche sont remplis par l'utilisateur sous forme d'une chaîne
de caractères. Par défaut, la requête porte
sur cette chaîne et toutes les chaînes contenant
la chaîne demandée.
Exemple : la requête porte sur le mot " action
" (Vedette d'article = action). La recherche prend en compte non seulement
le mot action, mais aussi sur toutes les sous chaînes
contenant la séquence action, c'est à dire actionnaire, actionner,
aussi bien que abstraction, attraction, distraction, réaction,
etc.
Pour ancrer la recherche sur le début du mot, il faut
utiliser le caractère spécial ^ ( chapeau).
Ainsi, une requête sur ^action restreindra la recherche
à actionnaire, actionner... (mais pas distraction)
Pour ancrer la recherche sur la fin de mot, il faut utiliser
le $ (dollar). Ainsi une requête sur action$ restreindra
la liste de résultats aux mots se terminant par action
: abstraction, diffraction, réaction, etc.
(mais pas
actionnaire).
Pour n'obtenir qu'action il faut taper ^action$
Représentation des accents
Signe |
Interprétation |
Exemple |
Voyelle majuscule |
représente tous les accents |
E --> è ê é et sans accent. |
\ (slash arrière) |
Accent grave |
a\ --> à |
/ (slash avant) |
Accent aigu |
e/ --> é |
^ (chapeau) |
Accent circonflexe |
e^ --> ê |
, (virgule) |
Cédille |
c, --> ç |
" (guillemet double) |
Tréma |
o" --> ö |
Appariement des formes (pattern matching)
Les opérateurs les plus utilisés sont :
Signe |
Interprétation |
Exemple |
. (point) |
remplace n'importe quel caractère |
pla.e trouvera place, plate, plaie, etc. |
.* (point et astérisque) |
remplace n'importe quelle séquence de caractères |
fem.* --> tous les mots commençant par fem |
E (voyelle majuscule) |
trouve tous les "e", avec ou sans accent |
|
| (barre verticale) |
OU de disjonction |
femme|homme |
[ a-z ] |
remplace n'importe quel élément de l'ensemble spécifié |
[b-f]e^te trouvera bête, fête, mais pas tête |
Apostrophes
Pour les besoins de la recherche, la plupart des apostrophes
sont traitées comme des séparateurs de mots. Ainsi,
pour rechercher l'Europe, l'utilisateur doit entrer
l' europe (les deux éléments sont séparés
par un espace), et choisir l'option locution (A).
Pour certaines exceptions, cependant, l'apostrophe est considérée
comme faisant partie intégrante du mot; par exemple :
aujourd'hui doit être entr&ecute; comme un simple mot.
Mot,
co-occurrence et recherche de locutions
Vous pouvez entrer un ou plusieurs mots pour la recherche
dans le texte des articles. Il est important de noter que la
barre verticale (|) est un caractère spécial
dénotant l'opérateur logique OR entre les
mots, et que l'espace ou la touche de retour chariot dénotent
l'opérateur logique AND entre les mots.
Ainsi, femme|homme
repèrera à les contextes où apparaît le mot femme et ceux où apparaît le mot homme.
En revanche, en entrant femme homme
vous trouverez les contextes où apparaissent à la fois le mot femme et le mot homme.
Par défaut, le moteur recherchera des co-occurrences
dans la même phrase. Ainsi, par défaut, si vous
lancez la recherche pour belle femme, vous trouverez
toutes les phrases contenant belle ET femme,
mais pas nécessairement dans cet ordre ou proches l'un
de l'autre. En sélectionnant l'option Locution (A),
vous limiterez la recherche aux mots contigus.
Quand l'option "locution" est choisie, la recherche
rapportera uniquement les mots placés dans le même
ordre que celui que vous avez indiqué, comme dans l'expression
belle femme.
Des critères peuvent être combinés, comme
dans : belle|beau|belles|beaux homme.*|femme.*
ce qui recherchera l'un des adjectifs ET les mots commençant
par homme ou femme.
Pour des recherches de co-occurrences, le contexte de recherche
est par défaut celui d'une phrase. Les utilisateurs peuvent
étendre ce contexte à un paragraphe, à un
article secondaire, ou à l'article entier.
Format des résultats: Concordance,
rapports KWIC, Fréquence par titre
Les utilisateurs peuvent choisir deux sortes de formats de
résultats : le format concordance (environ cinq
lignes de texte) et le Key-Word-In-Context, ou KWIC (une ligne
de texte).
Les résultats indiquent toujours le nombre de textes recherchés,
des termes recherchés dans le corpus, et le nombre total
d'occurrences. Après ces informations générales
vient une liste d'occurrences. Chaque occurrence est représentée
par une courte citation, contenant le titre de l'article ou de
l'article secondaire et le numéro de la page ou le mot
en question apparaît. On peut atteindre les fragments de texte correspondants
en cliquant sur le numéro
de la page et sur le titre, ce qui permet à l'utilisateur
d'obtenir le texte entier ou la page de l'article sur lesquelles la vedette est mise en gras.
Après la courte citation
suit un passage de contexte.
À la fin du document, les références
bibliographiques complètes pour chaque oeuvre cité
sont affichées.
Notez que les recherches définies de manière trop peu restrictive peuvent donner des milliers de résultats. En définissant
des critères de recherche plus précis, les résultats
seront moins nombreux et l'analyse plus aisée.
L'option "Fréquence des mots par article" liste le nombre
d'occurrences du terme recherché dans les entrées d'articles. Le résultat donnera
tous les articles contenant le mot ou l'expression.
Performances du produit
| Recherche
des vedettes d'articles (et donc les articles et les sous
articles qui leur sont consacrées), à partir des
critères présentés dans le formulaire de
requête : Vedette d'article, Auteur, Domaine, Catégorie
grammaticale (Partie du discours), Type d'entrée. |
| Suivi des
renvois : procédures
automatiques qui identifient dans un texte les références
et établissent des liens avec les articles cités. |
| Déplacement
automatique depuis le texte vers les planches et leurs légendes,
et plus tard, vers les fac-similés de pages de texte originales. |
|