SILEX
FR / EN
FR: La base de données Silex permet aux chercheurs de sélectionner des mots en fonction d’une variété de statistiques et de caractéristiques des mots et de construire des tableaux de fréquence et de probabilité en sélectionnant des unités phonologiques et orthographiques spécifiques. Le Fichier Maître, à partir duquel toutes les statistiques ont été dérivées, permet aux utilisateurs intéressés de calculer d’autres statistiques. En tant que tel, Silex est un outil flexible et une source riche d’informations pertinentes pour l’étude de l’orthographe en général et des terminaisons de lettres silencieuses en particulier. Pour une démonstration de la nouveauté et de l’utilité de Silex, voir Gingras & Sénéchal (2016). Silex a été dérivé de deux bases de données existantes : Manulex-infra (Peereman et al., 2007) et Lexique 3.80 (New et al., 2004). Compte tenu de cette origine, toute référence à Silex doit inclure une référence à Manulex-infra, Lexique 3.80, ou aux deux. Ces bases de données ont été sélectionnées car elles sont basées sur de vastes et récentes collections de textes ciblant des publics complètement différents. Le corpus Manulex-infra comprend 54 manuels scolaires pour enfants et est divisé en corpus spécifiques aux niveaux, tandis que Lexique 3.80 comprend un corpus de 218 romans pour adultes. Silex, la base de données unifiée résultante, comprend un total de 119 609 entrées de mots.
EN: The Silex database allows researchers to select words based on a variety of statistics and word characteristics and build frequency and probability tables by selecting specific phonological and orthographic units. The Master File, from which all statistics were derived, allows interested users to compute other statistics. As such, Silex is a flexible tool and a rich source of information relevant to the study of spelling in general, and silent-letter endings in particular. For a demonstration of the novelty and utility of Silex, see Gingras & Sénéchal (2016). Silex was derived from two existing databases, namely Manulex-infra (Peereman et al., 2007) and Lexique 3.80 (New et al., 2004). Given this origin, any reference to Silex must include a reference to Manulex-infra, Lexique 3.80, or both. These databases were selected because they are based on large and recent corpora targeted to completely different audiences. The Manulex-infra corpus comprises 54 children’s schoolbooks and is divided into grade-specific corpora, while Lexique 3.80 includes a corpus of 218 adult novels. Silex, the resulting unified database, comprises a total of 119,609 word entries.
Fichiers: SILEX_MasterFile.tsv SILEX_FinalLetters.tsv SILEX_OrthographicEndings.tsv SILEX_PhonemeGrapheme.tsv SILEX_PhonologicalCodesGraphemes.tsv
Sur OpenLexicon: Openlexicon
Site Web
Pour citer Silex
Utilisez cette référence: Gingras, M., & Sénéchal, M. (2016). Silex: A database for silent-letter endings in French words. Behavior Research Methods. Advance online publication. doi:10.3758/s13428-016-0832-z
N’oubliez pas de citer Manulex-infra, Lexique 3.80, ou les deux: New, B., Pallier, C., Brysbaert, M., & Ferrand, L. (2004). Lexique 2: A new French lexical database. Behavior Research Methods, Instruments, & Computers, 36, 516–524. Peereman, R., Lété, B., & Sprenger-Charolles, L. (2007). Manulex-infra: Distributional characteristics of grapheme-phoneme mappings, and infralexical and lexical units in child-directed written material. Behavior Research Methods, 39, 593–603.