Collatinus  11.3
Connecteurs publics | Fonctions membres publiques | Attributs privés | Liste de tous les membres
Référence de la classe Lemmatiseur

La classe Lemmatiseur regroupe les fonctions nécessaires à la lemmatisation et à l'analyse morphologique des formes ou des textes. Plus de détails...

#include <lemmatiseur.h>

Graphe de collaboration de Lemmatiseur:
Collaboration graph
[légende]

Connecteurs publics

void setAlpha (bool a)
 Modificateur de l'option Lemmatiseur::_alpha. Plus de détails...
 
void setCible (QString c)
 Permet de changer la langue cible. Plus de détails...
 
void setHtml (bool h)
 Modificateur de l'option Lemmatiseur::_html. Plus de détails...
 
void setFormeT (bool f)
 Modificateur de l'option Lemmatiseur::_formeT. Plus de détails...
 
void setMajPert (bool mp)
 Modificateur de l'option Lemmatiseur::_majPert. Plus de détails...
 
void setMorpho (bool m)
 Modificateur de l'option Lemmatiseur::_morpho. Plus de détails...
 
void setNonRec (bool n)
 Modificateur de l'option Lemmatiseur::_nonRec. Plus de détails...
 

Fonctions membres publiques

 Lemmatiseur (QObject *parent=0, LemCore *l=0, QString cible="", QString resDir="")
 Constructeur de la classe Lemmatiseur. Plus de détails...
 
QStringList frequences (QString txt)
 Lemmatise le texte txt et renvoie le résultat accompagné d'informations sur la fréquence d'emploi de chaque lemme. Plus de détails...
 
QStringList lemmatiseF (QString f, bool deb)
 Lemmatise la chaîne f, sans tenir compte des majuscules si deb (= début de phrase) est à true, et renvoie le résultat dans une QStringList. Plus de détails...
 
QString lemmatiseFichier (QString f, bool alpha=false, bool cumVocibus=false, bool cumMorpho=false, bool nreconnu=true)
 Applique lemmatiseT sur le contenu du fichier f et renvoie le résultat. Les paramètres sont les mêmes que ceux de lemmatiseT. Plus de détails...
 
QString lemmatiseT (QString &t, bool alpha, bool cumVocibus=false, bool cumMorpho=false, bool nreconnu=false)
 Lemmatise un texte. Plus de détails...
 
QString lemmatiseT (QString &t)
 lemmatise un texte en prenant les options de la classe Plus de détails...
 
void verbaOut (QString fichier)
 Sauvegarder le taux d'utilisation des mots connus. Plus de détails...
 
void verbaCognita (QString fichier, bool vb=false)
 Lire une liste de mots connus. Plus de détails...
 
bool optAlpha ()
 Accesseur de l'option Lemmatiseur::_alpha, qui permet de fournir par défaut des résultats dans l'ordre alphabétique. Plus de détails...
 
bool optHtml ()
 Accesseur de l'option Lemmatiseur::_html, qui permet de renvoyer les résultats au format html. Plus de détails...
 
bool optFormeT ()
 Accesseur de l'option Lemmatiseur::_formeT, qui donne en tête de lemmatisation la forme qui a été analysée. Plus de détails...
 
bool optMajPert ()
 Accesseur de l'option Lemmatiseur::_majPert, qui permet de tenir compte des majuscules dans la lemmatisation. Plus de détails...
 
bool optMorpho ()
 Accesseur de l'option Lemmatiseur::_morpho, qui donne l'analyse morphologique des formes lemmatisées. Plus de détails...
 
bool optNonRec ()
 Accesseur de l'option Lemmatiseur::_nonRec pour regrouper les formes non reconnues à la fin de la liste. Plus de détails...
 
QString cible ()
 Renvoie la langue cible dans sa forme abrégée (fr, en, de, it, etc.). Plus de détails...
 

Attributs privés

LemCore_lemCore
 Un pointeur vers le noyau de lemmatisation qui peut être partagé. Plus de détails...
 
QString _resDir
 Le nom du répertoire contenant les données. Plus de détails...
 
QHash< QString, int > _hLem
 Liste des lemmes connus. Plus de détails...
 
QStringList _couleurs
 Les couleurs pour le TextiColor. Plus de détails...
 
bool _alpha
 Option pour que les résultats soient présentés en ordre alphabétique. Plus de détails...
 
bool _formeT
 Option pour que la lemmatisation soit précédée par la forme du texte. Plus de détails...
 
bool _html
 Option pour que les résultats soient présentés en HTML. Plus de détails...
 
bool _majPert
 Option pour que la majuscule soit considérée comme pertinente. Plus de détails...
 
bool _morpho
 Option pour que la lemmatisation soit suivie par l'analyse morphologique. Plus de détails...
 
bool _nonRec
 Option pour que les formes inconnues soient regroupées à la fin des résultats. Plus de détails...
 
QString _cible
 langue courante, 2 caractères ou plus Plus de détails...
 

Description détaillée

La classe Lemmatiseur regroupe les fonctions nécessaires à la lemmatisation et à l'analyse morphologique des formes ou des textes.

Actuellement, dans Collatinus, elle est appelée par MainWindow qui gère l'affichage et les lectures/écritures des fichiers. Elle partage donc le noyau de lemmatisation, LemCore, avec d'autres classes intermédiaires. Toutefois, cette classe pourrait être autonome, avec une autre interface, si on voulait, par exemple, n'avoir qu'un programme spécialisé dans la lemmatisation et l'analyse morphologique.

Ce module utilise le noyau de lemmatisation LemCore. A priori, la fonction importante est Lemmatiseur::lemmatiseT qui va lemmatiser un texte entier et donner le résultat mis en forme en tenant compte des options. Une autre fonction intéressante serait Lemmatiseur::frequences qui ajoute à la lemmatisation du texte une tentative de dénombrement des occurrences des divers lemmes. Il y a évidemment un problème avec les formes ambiguës qui peuvent être attribuées à plusieurs lemmes différents.

Documentation des constructeurs et destructeur

Lemmatiseur::Lemmatiseur ( QObject *  parent = 0,
LemCore l = 0,
QString  cible = "",
QString  resDir = "" 
)

Constructeur de la classe Lemmatiseur.

Paramètres
parent: Un pointeur vers l'objet qui crée cette classe.
l: Un pointeur vers un moteur de lemmatisation (LemCore).
cible: La (ou les) langue(s) cible(s) pour donner les traductions.
resDir: Le chemin complet du dossier contenant les fichiers de donnée.

La classe Lemmatiseur propose les outils nécessaires pour lemmatiser un texte. Elle utilise le moteur de lemmatisation de Collatinus (LemCore) qui lui est passé en paramètre. Si ce moteur ne lui est pas donné, elle le crée ici. Si l'application envisagée utilise plusieurs modules intermédiaires (Tagueur, Scandeur...), il vaut mieux créer un seul moteur commun.

Le paramètre optionnel resDir donne le chemin complet du dossier contenant les fichiers de donnée. Par défaut, il s'agit du dossier "data" placé à côté de l'exécutable.

Documentation des fonctions membres

QString Lemmatiseur::cible ( )

Renvoie la langue cible dans sa forme abrégée (fr, en, de, it, etc.).

QStringList Lemmatiseur::frequences ( QString  txt)

Lemmatise le texte txt et renvoie le résultat accompagné d'informations sur la fréquence d'emploi de chaque lemme.

QStringList Lemmatiseur::lemmatiseF ( QString  f,
bool  deb 
)

Lemmatise la chaîne f, sans tenir compte des majuscules si deb (= début de phrase) est à true, et renvoie le résultat dans une QStringList.

QString Lemmatiseur::lemmatiseFichier ( QString  f,
bool  alpha = false,
bool  cumVocibus = false,
bool  cumMorpho = false,
bool  nreconnu = true 
)

Applique lemmatiseT sur le contenu du fichier f et renvoie le résultat. Les paramètres sont les mêmes que ceux de lemmatiseT.

Cette fonction ne semble pas être utilisée

QString Lemmatiseur::lemmatiseT ( QString &  t,
bool  alpha,
bool  cumVocibus = false,
bool  cumMorpho = false,
bool  nreconnu = false 
)

Lemmatise un texte.

Paramètres
t: une chaine avec le texte (passée par adresse)
alpha: option pour l'ordre alphabétique
cumVocibus: option pour les formes du texte
cumMorpho: option pour indiquer l'analyse
nreconnu: option pour regrouper les formes non reconnues
Renvoie
Renvoie sous forme de chaîne la lemmatisation et la morphologie de chaque mot du texte t.

Les paramètres permettent de classer la sortie par ordre alphabétique ; de reproduire la forme du texte au début de chaque lemmatisation ; de donner les morphologies de chaque forme ; ou de rejeter les échecs en fin de liste. D'autres paramètres, comme le format de sortie (txt ou html) et la pertinence de la majuscule, sont donnés par des variables de classe.

Par effet de bord, la fonction modifie le texte t, passé par adresse dans le paramètre &t, en tenant compte de la liste des mots connus définie par l'utilisateur via l'option Fichier/Lire une liste de mots connus. Voir Lemmatiseur::verbaCognita

QString Lemmatiseur::lemmatiseT ( QString &  t)

lemmatise un texte en prenant les options de la classe

Renvoie
La lemmatisation et la morphologie de chaque mot du texte t, sous forme de chaîne de caractères.

Les options sont ici prises dans les paramètres de la classe.

Voir aussi Lemmatiseur::lemmatiseT(QString &t, bool alpha, bool cumVocibus, bool cumMorpho, bool nreconnu)

bool Lemmatiseur::optAlpha ( )

Accesseur de l'option Lemmatiseur::_alpha, qui permet de fournir par défaut des résultats dans l'ordre alphabétique.

bool Lemmatiseur::optFormeT ( )

Accesseur de l'option Lemmatiseur::_formeT, qui donne en tête de lemmatisation la forme qui a été analysée.

bool Lemmatiseur::optHtml ( )

Accesseur de l'option Lemmatiseur::_html, qui permet de renvoyer les résultats au format html.

bool Lemmatiseur::optMajPert ( )

Accesseur de l'option Lemmatiseur::_majPert, qui permet de tenir compte des majuscules dans la lemmatisation.

bool Lemmatiseur::optMorpho ( )

Accesseur de l'option Lemmatiseur::_morpho, qui donne l'analyse morphologique des formes lemmatisées.

bool Lemmatiseur::optNonRec ( )

Accesseur de l'option Lemmatiseur::_nonRec pour regrouper les formes non reconnues à la fin de la liste.

void Lemmatiseur::setAlpha ( bool  a)
slot

Modificateur de l'option Lemmatiseur::_alpha.

void Lemmatiseur::setCible ( QString  c)
slot

Permet de changer la langue cible.

void Lemmatiseur::setFormeT ( bool  f)
slot

Modificateur de l'option Lemmatiseur::_formeT.

void Lemmatiseur::setHtml ( bool  h)
slot

Modificateur de l'option Lemmatiseur::_html.

void Lemmatiseur::setMajPert ( bool  mp)
slot

Modificateur de l'option Lemmatiseur::_majPert.

void Lemmatiseur::setMorpho ( bool  m)
slot

Modificateur de l'option Lemmatiseur::_morpho.

void Lemmatiseur::setNonRec ( bool  n)
slot

Modificateur de l'option Lemmatiseur::_nonRec.

Paramètres
n: booléen
void Lemmatiseur::verbaCognita ( QString  fichier,
bool  vb = false 
)

Lire une liste de mots connus.

Paramètres
fichier: nom du fichier avec la liste des mots connus
vb: booléen pour activer/désactiver le TextiColor

Activation/désactivation de la fonction TextiColor. Reçoit de MainWindow::verbaCognita le nom du fichier contenant une liste de mots connus. Les mots de cette liste sont lemmatisés et toutes les formes des lemmes correspondants seront supposées connues. Voir aussi Lemmatiseur::verbaOut.

Le fichier de mots connus peut contenir les couleurs utilisées. Les trois couleurs seront sur trois lignes successives sous la forme d'un dièse suivi de six chiffres hexadécimaux #RrVvBb.

Attention
Le dièse doit être le premier caractère de la ligne qui comptera 7 caractères exactement.
#FFFFFF est le blanc qui ne se verra pas.
#FF0000 est un rouge vif pas nécessairement des plus lisibles.

Par défaut, elles sont :

  • vert pour les mots que l'élève est censé connaître
  • noir pour les mots que Collatinus reconnaît
  • rouge pour les mots inconnus

Ce qui correspond à :

#00A000
#000000
#A00000

Si le nom est vide (aucun fichier sélectionné), Collatinus n'utilisera que les deux couleurs standards :

  • noir pour les mots que Collatinus reconnaît.
  • rouge pour les mots inconnus

Sans fichier, le TextiColor peut servir à repérer les fautes d'OCR.

void Lemmatiseur::verbaOut ( QString  fichier)

Sauvegarder le taux d'utilisation des mots connus.

Paramètres
fichier: nom du fichier à créer

Cette fonction s'utilise en relation avec Lemmatiseur::verbaCognita. Quand une liste de mots connus a été chargée, on peut connaître le nombre de fois que chacun de ces lemmes ont été rencontrés dans le ou les textes traités.

Documentation des données membres

bool Lemmatiseur::_alpha
private

Option pour que les résultats soient présentés en ordre alphabétique.

QString Lemmatiseur::_cible
private

langue courante, 2 caractères ou plus

QStringList Lemmatiseur::_couleurs
private

Les couleurs pour le TextiColor.

Voir Lemmatiseur::verbaCognita

bool Lemmatiseur::_formeT
private

Option pour que la lemmatisation soit précédée par la forme du texte.

QHash<QString,int> Lemmatiseur::_hLem
private

Liste des lemmes connus.

Voir Lemmatiseur::verbaCognita

bool Lemmatiseur::_html
private

Option pour que les résultats soient présentés en HTML.

LemCore* Lemmatiseur::_lemCore
private

Un pointeur vers le noyau de lemmatisation qui peut être partagé.

bool Lemmatiseur::_majPert
private

Option pour que la majuscule soit considérée comme pertinente.

bool Lemmatiseur::_morpho
private

Option pour que la lemmatisation soit suivie par l'analyse morphologique.

bool Lemmatiseur::_nonRec
private

Option pour que les formes inconnues soient regroupées à la fin des résultats.

QString Lemmatiseur::_resDir
private

Le nom du répertoire contenant les données.


La documentation de cette classe a été générée à partir des fichiers suivants :