|
Performances de l' implémentation courante(Fonctionnalités, Limites des procédures d'identification, Erreurs dans le texte)La saisie des données pour l'ensemble de l'Encyclopédie, 17 volumes de texte et 11 volumes de légendes de planches, est achevée depuis le 1er avril 1998. Ce qui fonctionne dans cette implémentation:
Ces recherches peuvent être
effectuées suivant diverses combinaisons:
Les recherches plein texte aboutissent à des extraits de
l'Encyclopédie où le mot ou la locution visée apparaît en caractères
gras. Le résultat peut être obtenu en "Format concordance" ( format de
cinq lignes de texte approximativement, résultat couramment obtenu par défaut)
ou en format KWIC (une ligne de texte). Pour mieux définir son contexte,
l'utilisateur peut alors se référer au paragraphe, à la sous-article ou à la
page dans lesquels ce passage apparaît.
Les renvois à d'autres articles sont conçus comme des liens hypertextes. Si l'on clique sur ces liens, on obtient une liste de tous les articles qui correspondent au renvoi en question ; l'utilisateur décidera quel article est réellement désigné par le renvoi (répondant par exemple à une information concernant un domaine de la connaissance). Comme ces renvois sont générés automatiquement, certains d'entre eux peuvent ne pas fonctionner : 1) soit qu'il y ait une erreur dans le libellé exact de l'article (par exemple le singulier au lieu du pluriel, les caractères accentués ou non accentués) ; 2) soit que l'article auquel on fait référence n'ait jamais existé dans l'Encyclopédie ; 3) soit que des erreurs typographiques dans le libellé du renvoi empêchent l'appariement avec la vedette de l'article ; soit que quelque chose qui n'est pas en fait un renvoi ait été identifié comme tel.
Les recherches d'articles et les recherches plein-texte portent aussi sur le
texte des légendes. Le texte des légendes est relié aux images des planches
correspondantes. De même le titre d'ensemble pour chaque série de planches est couramment balisé comme un objet textuel séparé et n'affiche ni texte ni objet. Il suffit de cliquer sur le lien de l'article suivant pour voir les légendes et les images réduites correspondantes. Pour voir la liste des principales séries de planches chercher "Type d'entrée" = plate_editorial; pour une liste plus détaillée faire "Type d'entrée" = plate_group.
On accède à ces images en cliquant sur le numéro qui apparaît en haut de chaque page de texte. Les recherches par article ne comportent généralement pas de lien à des pages en particulier ; cette fonction n'opère que pour les Formats concordance ou les formats KWIC. Pour des raisons techniques l'édition de l'Encyclopédie du 1er avril 1998 utilise les images du texte et les légendes obtenues par la reproduction Readex Microprint/Pergamon Press, 1969, et non la version microfiche IDC. L' équipe ARTFL a comparé le texte et les pages-images et n'a pas trouvé de différences, mais elle ne peut pas garantir que les images correspondent exactement à l'édition utilisée pour la saisie des données, quoique cela paraisse être le cas, comme il ressort de la comparaison d'ensemble. Tous les courriers concernant les disparités entre les données textuelles et les images des pages seront les bienvenus. Ce qui ne fonctionne pas
Nous savons qu'il y a de nombreux problèmes -- non repérés ou repérés de façon erronée : omission de noms d'auteurs, renseignements incomplets concernant les catégories grammaticales ou les branches de la connaissance, erreurs dans les renvois. Il peut être utile à l'utilisateur de savoir que, jusqu'à maintenant, tous ces repérages ont été faits suivant des procédures automatiques fondées sur des repérages typographiques. Par exemple les grandes capitales indiquent les articles, les petites capitales indiquent les sous-articles, une simple capitale entre parenthèses à la fin d'un paragraphe signale le nom de l'auteur ; les renvois requiert un dispositif un peu plus compliqué, mais le principe est le même. L'équipe ARTFL n'a fait que deux exceptions à une automatisation complète; elle a utilisé le traitement manuel: 1) là où il fallait assurer le lien entre les images et les légendes des planches et 2) pour l'étiquetage des textes éditoriaux. La fiabilité de ces dispositifs est absolument nécessaire vu les dimensions de l'Encyclopédie. On voit que certains éléments de l'Encyclopédie échappent au repérage automatique. Par exemple l'attribution des articles à tel ou tel auteur n'est pas facile à découvrir quand elle échappe au code spécial du repérage des auteurs. L' équipe ARTFL a essayé de repérer les indications du type " cet article est dû à X", par exemple, mais certaines ont pu lui échapper. A noter que le projet du 1er avril 1998 n'a pas essayé d'intégrer les résultats des nombreuses études concernant les auteurs d'articles ou les attributions aux auteurs présumés ne se trouvant pas dans l'Encyclopédie elle-même. Au nombre des études les plus importantes on compte l'Inventory of Diderot's Encyclopédie de Richard N.Schwab, Walter E.Rex and John Lough dans les Studies on Voltaire and the Eighteenth century (volumes 80, 83, 85, 91, 92, 93, 223; 1971-1984) ; The Encyclopédists as Individuals dans les volumes 257, 1988 de la même collection et dans les Oeuvres Complètes de Diderot, Edition critique et annotée, due à John Lough et Jacques Proust (Paris, Hermann) au volume 5 : 1-"Liste des articles de Diderot portant l'astérisque" (pp 133-206) 2. "Liste des articles non signés qu'on peut attribuer à Diderot et qui sont reproduits dans cette édition" (pp.207-210) 3 - "Liste des articles non signés qu'on pourrait peut-être attribuer à Diderot, mais qui ne sont pas reproduits dans cette édition (pp. 211-219). Nous conseillons fortement aux utilisateurs de notre base de consulter ces travaux pour vérifier les résultats de ces attributions d'articles
Nous sommes conscients que beaucoup d'erreurs typographiques se sont infiltrées dans le texte lors de la saisie. Malheureusement, en raison des vastes dimensions de l'Encyclopédie et de sa grande diversité sémantique, il est impossible de corriger ces erreurs par quelque procédure normale de correction orthographique. Nous avons commencé à faire quelques changements pour rectifier certaines erreurs fréquentes mais c'est une procédure qui demandera un certain temps. Aussi les utilisateurs de l'Encyclopédie trouveront-ils probablement des erreurs. Il pourra évidemment se faire que ces erreurs entravent certaines recherches et que les lecteurs ne trouvent pas certains passages qui leur sont familiers. De plus le texte comporte un certain nombre d'éléments <?> qui signale l'absence d'un caractère ou d'un symbole. Nous nous excusons pour ces imperfections du texte mais nous avons fourni des images numérisées du texte original de manière à permettre aux lecteurs de vérifier la version lisible en machine. Quand ce problème apparaît les utilisateurs doivent recourir aux pages-images obtenues en cliquant en haut de la page sur l'élément qui identifie le volume et la page. |
|