Collatinus  11.3
Liste des choses à faire
Classe LemCore

Il manque un lexique personnel dans Collatinus 11. C'est en principe résolu (en grand) avec Collatinus 12.

La gestion des formes non-reconnues est aussi un peu sommaire. Dans la lemmatisation d'un texte, les formes non-reconnues sont juste groupées à la fin de la liste (si l'option correspondante est validée). Dans la scansion, on marque la quantité des syllabes lorsqu'elle est déterminable par position. Dans le tagueur, les mots non-reconnus sont ignorés... Je ne sais pas au juste comment gérer ça. En particulier, on ne peut pas le faire sur une forme isolée. Dans un texte, si plusieurs mots ne sont pas reconnus qui commencent avec un même potentiel radical, on peut avoir une piste intéressante pour déterminer un paradigme et voir si toutes ces formes peuvent conduire à un lemme plausible (difficile pour la 3e déclinaison). Commencer par se faire une idée de la fréquence d'utilisation des diverses désinences ?

Membre Scandeur::formeq (QString forme, bool *nonTrouve, bool debPhr, int accent=0)
Lorsque l'on cherche à accentuer une forme qui n'a pas été reconnue, je retourne la forme telle qu'elle est. Or si la avant-dernière syllabe est fermée (double consonne), je sais que le mot est paroxyton. Il est souvent proparoxyton si les deux dernières voyelles se suivent. Le nom propre María est une exception (pas la seule ?). Pas sûr que ça vaille le coup...
Classe Tagueur
Je devrais essayer d'améliorer ce second choix en m'appuyant sur les points fixes (deux mots successifs n'ayant qu'un seul tag possible qui vont donc réduire l'ensemble des séquences de tags à une seule). Il serait intéressant d'avoir pour chaque segment entre deux points fixes les deux meilleurs choix de séquences. Ainsi, pour une phrase contenant un point fixe, j'aurais quatre séquences sélectionnées au lieu de deux.