27 #include <QStringList>
28 #include <QtCore/QCoreApplication>
32 #include <QTextStream>
67 typedef QMap<Lemme*, QList<SLem> >
MapLem;
75 typedef QPair<QRegExp, QString>
Reglep;
158 QMap<QString,QStringList>
_cas;
180 QString
transfMed(QString f,
bool rad=
false);
201 void lisTags(
bool tout =
false);
211 LemCore(QObject *parent = 0, QString resDir=
"");
217 QString
assim(QString a);
218 QString
assimq(QString a);
219 QMap<QString, QString>
cibles();
231 int nbOcc(QString l);
246 QString
genre(
int i);
248 QString
temps(
int i);
249 QString
modes(
int i);
QMap< QString, QStringList > _cas
Liste des cas avec langue (clef) et liste lisible (valeur)
Definition: lemCore.h:158
QMap< QString, QStringList > _morphos
Liste des analyses morphologiques avec langue (clef) et liste lisible (valeur)
Definition: lemCore.h:156
QMap< QString, QString > cibles()
Renvoie la map des langues cibles.
Definition: lemCore.cpp:743
QPair< QRegExp, QString > Reglep
Une Reglep regroupe une expression rationnelle et la chaine de remplacement.
Definition: lemCore.h:75
QString grq
la forme avec quantités
Definition: lemCore.h:53
QMap< QString, QStringList > _nombres
Liste des nombres avec langue (clef) et liste lisible (valeur)
Definition: lemCore.h:162
QMap< QString, int > _tagOcc
Nombre d'occurrences du tag dans le corpus du LASLA.
Definition: lemCore.h:196
void setCible(QString c)
Permet de changer la langue cible.
Definition: lemCore.cpp:736
QString assimq(QString a)
Cherche si la chaîne a peut subir une assimilation, et renvoie cette chaîne éventuellement assimilée...
Definition: lemCore.cpp:701
QString morpho(int m)
explicite la morphologie dans la langue choisie
Definition: lemCore.cpp:1421
QString motsClefs(int i)
Accesseur des autres mots-clefs.
Definition: lemCore.cpp:1522
void lisTransfMed()
Lecture des règles de transformation entre les graphies classique et médiévale enregistrées dans le f...
Definition: lemCore.cpp:1302
QMap< QString, QStringList > _modes
Liste des modes avec langue (clef) et liste lisible (valeur)
Definition: lemCore.h:166
QMap< QString, Lemme * > _lemmes
Liste des lemmes avec forme (clef) et pointeur (valeur)
Definition: lemCore.h:152
void lisTraductions(bool base, bool extension)
Lecture des fichiers de traductions trouvés dans data/, nommés lemmes, avec un suffixe corresponant à...
Definition: lemCore.cpp:1352
QMap< Lemme *, QList< SLem > > MapLem
Une MapLem regroupe par lemme les résultats d'une lemmatisation.
Definition: lemCore.h:67
QMap< QString, QString > assims
Association des préfixes assimilés et non-assimilés sans quantité
Definition: lemCore.h:140
QMap< QString, QString > _irrMed
Associe une graphie médiévale (clef) à une graphie classique (valeur) pour un irrégulier.
Definition: lemCore.h:186
MapLem lemmatiseM(QString f, bool debPhr=true, int etape=0)
Renvoie dans une MapLem les lemmatisations de la forme f.
Definition: lemCore.cpp:1034
MapLem lemmatise(QString f)
Le cœur du lemmatiseur.
Definition: lemCore.cpp:845
int morpho
l'analyse morphologique (entier)
Definition: lemCore.h:54
QString _resDir
Le nom du répertoire contenant les données.
Definition: lemCore.h:204
La classe Radical décrit les radicaux associés aux lemmes.
Definition: lemme.h:44
void ajAbrev()
Lit le fichier d'abréviations.
Definition: lemCore.cpp:533
QMultiMap< QString, Irreg * > _irregs
Definition: lemCore.h:148
QString cas(int i)
Accesseur du cas.
Definition: lemCore.cpp:1438
QMap< QString, QStringList > _motsClefs
Liste des autres mots-clefs avec langue (clef) et liste lisible (valeur)
Definition: lemCore.h:170
void setExtension(bool e)
Active ou désactive l'extension du lexique.
Definition: lemCore.cpp:1577
QMap< QString, QStringList > _genres
Liste des genres avec langue (clef) et liste lisible (valeur)
Definition: lemCore.h:160
void ajDesinence(Desinence *d)
ajoute la désinence d dans la map des désinences.
Definition: lemCore.cpp:608
QString desassimq(QString a)
Essaie de remplacer l'assimilation de a par sa forme non assimilée, et renvoie le résultat...
Definition: lemCore.cpp:795
int aRomano(QString f)
Convertit une chaine en chiffres romains en un nombre.
Definition: lemCore.cpp:574
void ajContractions()
Établit une liste qui donne, pour chaque contraction, la forme non contracte qui lui correspond...
Definition: lemCore.cpp:558
QStringList abr
Liste des abréviations, voir LemCore::ajAbr.
Definition: lemCore.h:127
QString decontracte(QString d)
Essaie de remplacer la contractions de d par sa forme entière, et renvoie le résultat.
Definition: lemCore.cpp:753
QStringList lignesFichier(QString nf)
Lit les lignes d'un fichier.
Definition: lemCore.cpp:393
Modele * modele(QString m)
Renvoie l'objet de la classe Modele dont le nom est m.
Definition: lemCore.cpp:1404
QMultiMap< QString, Radical * > _radicaux
Liste des radicaux avec forme (clef) et pointeur (valeur)
Definition: lemCore.h:173
void setMedieval(bool e)
Gère les graphies médiévales.
Definition: lemCore.cpp:1601
QString voix(int i)
Accesseur de la voix.
Definition: lemCore.cpp:1508
void lisLexique()
Lecture du fichier de lemmes de base.
Definition: lemCore.cpp:1248
QMap< QString, int > _trigram
Nombre d'occurrences du trigramme dans le corpus du LASLA.
Definition: lemCore.h:200
int nbOcc(QString l)
Le nombre d'occurrences du lemme dans le corpus du LASLA.
Definition: lemCore.cpp:1182
bool estAbr(QString m)
Teste si le mot est une abréviation.
Definition: lemCore.cpp:546
QMap< QString, QString > suffixes
Association des suffixes sans et avec quantités.
Definition: lemCore.h:239
QString genre(int i)
Accesseur du genre.
Definition: lemCore.cpp:1452
void lisTags(bool tout=false)
Lit l'ensemble des tags.
Definition: lemCore.cpp:201
int trigram(QString seq)
Renvoie le nombre d'occurrences du trigramme.
Definition: lemCore.cpp:374
static bool estRomain(QString f)
Teste si la chaine est un nombre en chiffres romains.
Definition: lemCore.cpp:618
QString transfMed(QString f, bool rad=false)
Transforme un mot en sa forme médiévalisée.
Definition: lemCore.cpp:1328
La classe Lemme décrit les lemmes.
Definition: lemme.h:64
La classe Modele contient les désinences associées aux paradigmes de flexion.
Definition: modele.h:67
void ajAssims()
définit les débuts de mots non assimilés, et associe à chacun sa forme assimilée. ...
Definition: lemCore.cpp:514
QString cible()
Renvoie la langue cible dans sa forme abrégée (fr, en, de, it, etc.).
Definition: lemCore.cpp:717
void lisModeles()
Lecture des modèles, synthèse et enregistrement de leurs désinences.
Definition: lemCore.cpp:1272
bool _extension
Option indiquant le chargement de l'extension du lexique, voir LemCore::setExtension.
Definition: lemCore.h:191
QMap< QString, int > _tagTot
Nombre d'occurrences du POS (1er caractère du tag) dans le corpus du LASLA.
Definition: lemCore.h:198
QMap< QString, QString > assimsq
Association des préfixes assimilés et non-assimilés avec quantités.
Definition: lemCore.h:142
QString _cible
La langue choisie, voir LemCore::setCible.
Definition: lemCore.h:193
QStringList lemmes(MapLem ml)
renvoie la liste des graphies des lemmes de la MapLem lm sans signes diacritiques.
Definition: lemCore.cpp:1194
QMap< QString, QStringList > _voix
Liste des voix avec langue (clef) et liste lisible (valeur)
Definition: lemCore.h:168
QString tag(Lemme *l, int m)
Calcule le tag.
Definition: lemCore.cpp:257
bool optExtension()
Accesseur de l'option extension, qui permet de charger l'extension.
Definition: lemCore.cpp:1536
QMap< QString, QString > _variables
Liste des méta-variables du fichier modeles.la avec nom (clef) et liste de désinences (valeur) ...
Definition: lemCore.h:175
void lisExtension()
Lecture du fichier d'extension.
Definition: lemCore.cpp:1257
QMap< QString, QString > _desMed
Associe une graphie médiévale (clef) à une graphie classique (valeur) pour une désinence.
Definition: lemCore.h:184
QString nombre(int i)
Accesseur du nombre.
Definition: lemCore.cpp:1466
QMultiMap< QString, QString > _radMed
Associe une graphie médiévale (clef) à une graphie classique (valeur) pour un radical.
Definition: lemCore.h:188
void ajRadicaux(Lemme *l)
Calcule tous les radicaux du lemme l, en se servant des modèles, les ajoute à ce lemme, et ensuite à la map * des radicaux de la classe Lemmat.
Definition: lemCore.cpp:632
QMap< QString, QString > _contractions
Association des formes contractées et non-contractées.
Definition: lemCore.h:144
void lisFichierLexique(QString filepath)
Lecture des lemmes, synthèse et enregistrement de leurs radicaux.
Definition: lemCore.cpp:1230
QString modes(int i)
Accesseur du mode.
Definition: lemCore.cpp:1494
structure pour stocker le résultat d'une lemmatisation
Definition: lemCore.h:51
bool _medieval
Booléen pour traiter les graphies médiévales.
Definition: lemCore.h:182
LemCore(QObject *parent=0, QString resDir="")
Constructeur de la classe LemCore.
Definition: lemCore.cpp:48
QMap< QString, QStringList > _temps
Liste des temps avec langue (clef) et liste lisible (valeur)
Definition: lemCore.h:164
Lemme * lemme(QString l)
cherche dans la liste des lemmes le lemme dont la clé est l, et retourne le résultat.
Definition: lemCore.cpp:1174
La classe LemCore est le noyau de lemmatisation.
Definition: lemCore.h:118
int tagOcc(QString t)
Renvoie le nombre d'occurrences du tag.
Definition: lemCore.cpp:361
QString temps(int i)
Accesseur du temps.
Definition: lemCore.cpp:1480
QMap< QString, Modele * > _modeles
Liste des modèles avec nom (clef) et pointeur (valeur)
Definition: lemCore.h:154
int fraction(QString listTags)
Évalue la probabilité conditionnelle de l'analyse connaissant le POS.
Definition: lemCore.cpp:324
QString assim(QString a)
Cherche si la chaîne a peut subir une assimilation, et renvoie cette chaîne éventuellement assimilée...
Definition: lemCore.cpp:683
La classe Desinence décrit les désinences associées aux modèles.
Definition: modele.h:42
void lireHyphen(QString fichierHyphen)
Lit le fichier Hyphen.
Definition: lemCore.cpp:1664
void lisMorphos(QString lang)
Lecture des analyses morphologiques.
Definition: lemCore.cpp:425
QMap< QString, QString > _cibles
Liste des langues cibles en forme abrégée (clef) et longue (valeur)
Definition: lemCore.h:150
QList< Reglep > _reglesMed
Liste de règles pour transformer les graphies classiques en graphies médiévales.
Definition: lemCore.h:178
QMultiMap< QString, Desinence * > _desinences
Liste des désinences avec forme (clef) et pointeur (valeur)
Definition: lemCore.h:146
La classe Irreg décrit les formes irrégulières dans la flexion d'un lemme.
Definition: irregs.h:43
void lisIrreguliers()
Chargement des formes irrégulières du fichier data/irregs.la.
Definition: lemCore.cpp:1207
QString sufq
l'éventuel suffixe avec quantités
Definition: lemCore.h:55
QString desassim(QString a)
Essaie de remplacer l'assimilation de a par sa forme non assimilée, et renvoie le résultat...
Definition: lemCore.cpp:776
QString variable(QString v)
permet de remplacer la métavariable v par son contenu.
Definition: lemCore.cpp:1550
bool inv(Lemme *l, const MapLem ml)
Renvoie true si le lemme l faisant partie de la MaplLem ml est invariable.
Definition: lemCore.cpp:981
bool _extLoaded
Booléen indiquant si l'extension du lexique a été chargée.
Definition: lemCore.h:206