Syllabation de Brulex et Lexique
% Time-stamp: <2019-04-09 13:46:49 christophe@pallier.org>
Ce répertoire contient le script qui a servi à syllabifier les représentations phonologiques de Brulex et de Lexique.
Voici quelques exemples:
| item | phon | phonsyll | nbsyll | skel |
|---|---|---|---|---|
| abeille | abEj | a-bEj | 2 | V-CVY |
| adroit | adRwa | a-dRwa | 2 | V-CCYV |
| arbre | aRbR | aRbR | 1 | VCCC |
| astre | astR | astR | 1 | VCCC |
| bouilloire | bujwaR | buj-waR | 2 | CVY-YVC |
| cadeau | kadO | ka-dO | 2 | CV-CV |
| castor | kastOR | kas-tOR | 2 | CVC-CVC |
| chien | Sj5 | Sj5 | 1 | CYV |
| costume | kOstym | kOs-tym | 2 | CVC-CVC |
| exploit | Eksplwa | Ek-splwa | 2 | VC-CCCYV |
| fluide | fl8id | fl8id | 1 | CCYVC |
| galerie | galRi | gal-Ri | 2 | CVC-CV |
| joueur | Zw9R | Zw9R | 1 | CYVC |
| madeleine | madlEn | mad-lEn | 2 | CVC-CVC |
| notre | nOtR | nOtR | 1 | CVCC |
| nuage | n8aZ | n8aZ | 1 | CYVC |
| obstruer | OpstRye | Op-stRy-e | 3 | VC-CCCV-V |
| polluer | pOl8e | pO-l8e | 2 | CV-CYV |
| poète | pOEt | pO-Et | 2 | CV-VC |
| sauterelle | sOtREl | sO-tREl | 2 | CV-CCVC |
| sciure | sjyR | sjyR | 1 | CYVC |
| skieur | skj9R | skj9R | 1 | CCYVC |
| sonnerie | sOnRi | sOn-Ri | 2 | CVC-CV |
| stagner | stagne | stag-ne | 2 | CCVC-CV |
| tatouer | tatwe | ta-twe | 2 | CV-CYV |
| tueuse | t82z | t82z | 1 | CYVC |
| vieillerie | vjEjRi | vjEj-Ri | 2 | CYVY-CV |
Une description (sommaire) des règles de syllabation est disponible dans le document syllabation.pdf(1)
Le programme de syllabation est écrit en langage AWK particulièrement bien adapté pour cette tâche — Voir mon document “Utilisation de AWK pour faire des recherches dans Lexique” et la page de AWK sur Wikipedia).
Fichiers:
- syllabation.awk: script proprement dit
-
Makefile: sur un système disposant de ‘make’, genere
- mots_test.txt : liste de mots dont on veut verifier les syllabations
- tests.txt : resultats de la syllabation (selon brulex, puis selon lexique)
Si Make est installé sur votre machine, il vous suffit de taper:
make
make test
Sinon, pour syllaber brulex.txt:
gawk -vphons=2 -vcode=brulex -f syllabation.awk brulex.txt
et pour syllaber lexique260_graph.txt:
gawk -vphons=2 -f syllabation.awk lexique260_graph.txt