Miklós PÁLFY

Miklós PÁLFY, Corpus minimal et proportions d’effectifs dans une enquête de lexicométrie bilingue > 43

 

1. Remarques préliminaires

La plupart des statistiques lexicales ont pour objet d’analyser des textes (surtout littéraires) et leur but est tantôt d’identifier un auteur, tantôt de caractériser une période de son activité. Ces analyses ont souvent un caractère diachronique et comparatif ce qui explique la largeur des corpus et la variété des paramètres quantitatifs (tels la fréquence, la productivité ou la répartition).

Rares sont les cas où le corpus d’une statistique lexicale est pris dans un dictionnaire, et parmi ces dictionnaires, il n’y a pas un seul de bilingue. Cela s’explique certainement par le fait qu’une analyse traditionnelle des fréquences n’a pas trop de sens dans un dictionnaire. Plus prometteuses sont les enquêtes statistiques portant sur les rapports intérieurs de la métalangue et ses différentes catégories grammaticales et sémantiques.

La catégorie grammaticale ou sémantique est un caractère qualitatif qui, n’étant pas mesurable, peut avoir des traits assez subjectifs: les rapports obtenus ne se prêtent pas à la représentation graphique ou à la représentation dans des tables de corrélation. Ce petit exposé est un essai d’appliquer la méthode statistique à un corpus lexicographique bilingue, en représentant certains rapports catégoriels dans des tables de contingence. Le corpus de cette enquête est pris dans le manuscrit électronique du futur dictionnaire français-hongrois, en préparation au Département d’Études Françaises de l’Université József Attila (Szeged).

Le dépouillement des données a été facilité par le fait que les premiers 50 fichiers du dictionnaire ont été rédigés à l’aide d’un logiciel à système SGML (Standard Generalized Markup Language): grâce au système de codage, ces fichiers constituent une base de données. Pourtant, les possibilités d’erreur sont nombreuses: c’est que la structure du système de codage ne permet pas la répétition de certains éléments à l’intérieur d’un bloc donné.

 

Pour lire la suite de cet article veuillez consulter le pdf ci-dessous.

PDF download: