![]() |
Collatinus
11.3
|
Il manque un lexique personnel dans Collatinus 11. C'est en principe résolu (en grand) avec Collatinus 12.
La gestion des formes non-reconnues est aussi un peu sommaire. Dans la lemmatisation d'un texte, les formes non-reconnues sont juste groupées à la fin de la liste (si l'option correspondante est validée). Dans la scansion, on marque la quantité des syllabes lorsqu'elle est déterminable par position. Dans le tagueur, les mots non-reconnus sont ignorés... Je ne sais pas au juste comment gérer ça. En particulier, on ne peut pas le faire sur une forme isolée. Dans un texte, si plusieurs mots ne sont pas reconnus qui commencent avec un même potentiel radical, on peut avoir une piste intéressante pour déterminer un paradigme et voir si toutes ces formes peuvent conduire à un lemme plausible (difficile pour la 3e déclinaison). Commencer par se faire une idée de la fréquence d'utilisation des diverses désinences ?