|
| Lemmatiseur (QObject *parent=0, LemCore *l=0, QString cible="", QString resDir="") |
| Constructeur de la classe Lemmatiseur. Plus de détails...
|
|
QStringList | frequences (QString txt) |
| Lemmatise le texte txt et renvoie le résultat accompagné d'informations sur la fréquence d'emploi de chaque lemme. Plus de détails...
|
|
QStringList | lemmatiseF (QString f, bool deb) |
| Lemmatise la chaîne f, sans tenir compte des majuscules si deb (= début de phrase) est à true, et renvoie le résultat dans une QStringList. Plus de détails...
|
|
QString | lemmatiseFichier (QString f, bool alpha=false, bool cumVocibus=false, bool cumMorpho=false, bool nreconnu=true) |
| Applique lemmatiseT sur le contenu du fichier f et renvoie le résultat. Les paramètres sont les mêmes que ceux de lemmatiseT. Plus de détails...
|
|
QString | lemmatiseT (QString &t, bool alpha, bool cumVocibus=false, bool cumMorpho=false, bool nreconnu=false) |
| Lemmatise un texte. Plus de détails...
|
|
QString | lemmatiseT (QString &t) |
| lemmatise un texte en prenant les options de la classe Plus de détails...
|
|
void | verbaOut (QString fichier) |
| Sauvegarder le taux d'utilisation des mots connus. Plus de détails...
|
|
void | verbaCognita (QString fichier, bool vb=false) |
| Lire une liste de mots connus. Plus de détails...
|
|
bool | optAlpha () |
| Accesseur de l'option Lemmatiseur::_alpha, qui permet de fournir par défaut des résultats dans l'ordre alphabétique. Plus de détails...
|
|
bool | optHtml () |
| Accesseur de l'option Lemmatiseur::_html, qui permet de renvoyer les résultats au format html. Plus de détails...
|
|
bool | optFormeT () |
| Accesseur de l'option Lemmatiseur::_formeT, qui donne en tête de lemmatisation la forme qui a été analysée. Plus de détails...
|
|
bool | optMajPert () |
| Accesseur de l'option Lemmatiseur::_majPert, qui permet de tenir compte des majuscules dans la lemmatisation. Plus de détails...
|
|
bool | optMorpho () |
| Accesseur de l'option Lemmatiseur::_morpho, qui donne l'analyse morphologique des formes lemmatisées. Plus de détails...
|
|
bool | optNonRec () |
| Accesseur de l'option Lemmatiseur::_nonRec pour regrouper les formes non reconnues à la fin de la liste. Plus de détails...
|
|
QString | cible () |
| Renvoie la langue cible dans sa forme abrégée (fr, en, de, it, etc.). Plus de détails...
|
|
La classe Lemmatiseur regroupe les fonctions nécessaires à la lemmatisation et à l'analyse morphologique des formes ou des textes.
Actuellement, dans Collatinus, elle est appelée par MainWindow qui gère l'affichage et les lectures/écritures des fichiers. Elle partage donc le noyau de lemmatisation, LemCore, avec d'autres classes intermédiaires. Toutefois, cette classe pourrait être autonome, avec une autre interface, si on voulait, par exemple, n'avoir qu'un programme spécialisé dans la lemmatisation et l'analyse morphologique.
Ce module utilise le noyau de lemmatisation LemCore. A priori, la fonction importante est Lemmatiseur::lemmatiseT qui va lemmatiser un texte entier et donner le résultat mis en forme en tenant compte des options. Une autre fonction intéressante serait Lemmatiseur::frequences qui ajoute à la lemmatisation du texte une tentative de dénombrement des occurrences des divers lemmes. Il y a évidemment un problème avec les formes ambiguës qui peuvent être attribuées à plusieurs lemmes différents.
Lemmatiseur::Lemmatiseur |
( |
QObject * |
parent = 0 , |
|
|
LemCore * |
l = 0 , |
|
|
QString |
cible = "" , |
|
|
QString |
resDir = "" |
|
) |
| |
Constructeur de la classe Lemmatiseur.
- Paramètres
-
parent | : Un pointeur vers l'objet qui crée cette classe. |
l | : Un pointeur vers un moteur de lemmatisation (LemCore). |
cible | : La (ou les) langue(s) cible(s) pour donner les traductions. |
resDir | : Le chemin complet du dossier contenant les fichiers de donnée. |
La classe Lemmatiseur propose les outils nécessaires pour lemmatiser un texte. Elle utilise le moteur de lemmatisation de Collatinus (LemCore) qui lui est passé en paramètre. Si ce moteur ne lui est pas donné, elle le crée ici. Si l'application envisagée utilise plusieurs modules intermédiaires (Tagueur, Scandeur...), il vaut mieux créer un seul moteur commun.
Le paramètre optionnel resDir donne le chemin complet du dossier contenant les fichiers de donnée. Par défaut, il s'agit du dossier "data" placé à côté de l'exécutable.
QString Lemmatiseur::lemmatiseT |
( |
QString & |
t, |
|
|
bool |
alpha, |
|
|
bool |
cumVocibus = false , |
|
|
bool |
cumMorpho = false , |
|
|
bool |
nreconnu = false |
|
) |
| |
Lemmatise un texte.
- Paramètres
-
t | : une chaine avec le texte (passée par adresse) |
alpha | : option pour l'ordre alphabétique |
cumVocibus | : option pour les formes du texte |
cumMorpho | : option pour indiquer l'analyse |
nreconnu | : option pour regrouper les formes non reconnues |
- Renvoie
- Renvoie sous forme de chaîne la lemmatisation et la morphologie de chaque mot du texte t.
Les paramètres permettent de classer la sortie par ordre alphabétique ; de reproduire la forme du texte au début de chaque lemmatisation ; de donner les morphologies de chaque forme ; ou de rejeter les échecs en fin de liste. D'autres paramètres, comme le format de sortie (txt ou html) et la pertinence de la majuscule, sont donnés par des variables de classe.
Par effet de bord, la fonction modifie le texte t, passé par adresse dans le paramètre &t, en tenant compte de la liste des mots connus définie par l'utilisateur via l'option Fichier/Lire une liste de mots connus. Voir Lemmatiseur::verbaCognita
QString Lemmatiseur::lemmatiseT |
( |
QString & |
t | ) |
|
lemmatise un texte en prenant les options de la classe
- Renvoie
- La lemmatisation et la morphologie de chaque mot du texte t, sous forme de chaîne de caractères.
Les options sont ici prises dans les paramètres de la classe.
Voir aussi Lemmatiseur::lemmatiseT(QString &t, bool alpha, bool cumVocibus, bool cumMorpho, bool nreconnu)
void Lemmatiseur::verbaCognita |
( |
QString |
fichier, |
|
|
bool |
vb = false |
|
) |
| |
Lire une liste de mots connus.
- Paramètres
-
fichier | : nom du fichier avec la liste des mots connus |
vb | : booléen pour activer/désactiver le TextiColor |
Activation/désactivation de la fonction TextiColor. Reçoit de MainWindow::verbaCognita le nom du fichier contenant une liste de mots connus. Les mots de cette liste sont lemmatisés et toutes les formes des lemmes correspondants seront supposées connues. Voir aussi Lemmatiseur::verbaOut.
Le fichier de mots connus peut contenir les couleurs utilisées. Les trois couleurs seront sur trois lignes successives sous la forme d'un dièse suivi de six chiffres hexadécimaux #RrVvBb.
- Attention
- Le dièse doit être le premier caractère de la ligne qui comptera 7 caractères exactement.
-
#FFFFFF est le blanc qui ne se verra pas.
-
#FF0000 est un rouge vif pas nécessairement des plus lisibles.
Par défaut, elles sont :
- vert pour les mots que l'élève est censé connaître
- noir pour les mots que Collatinus reconnaît
- rouge pour les mots inconnus
Ce qui correspond à :
Si le nom est vide (aucun fichier sélectionné), Collatinus n'utilisera que les deux couleurs standards :
- noir pour les mots que Collatinus reconnaît.
- rouge pour les mots inconnus
Sans fichier, le TextiColor peut servir à repérer les fautes d'OCR.