|
QStringList | ajoute (QString mot, QStringList liste) |
| Ajoute mot au début de chaque item de liste. Plus de détails...
|
|
void | allonge (QString *f) |
| modifie f pour que sa dernière voyelle devienne longue. Plus de détails...
|
|
QString | atone (const QString a, bool bdc=false) |
| supprime tous les diacritiques de la chaîne a Plus de détails...
|
|
QString | communes (QString g) |
| note comme communes toutes les voyelles qui ne portent pas de quantité. Plus de détails...
|
|
void | deQuant (QString *c) |
| supprime la quantité de la voyelle finale Plus de détails...
|
|
void | genStrNum (const QString s, QString *ch, int *n) |
| sépare la chaine d'entrée en lettres et nombre Plus de détails...
|
|
QString | deramise (QString r) |
| retourne une graphie non-ramiste de r, càd dont tous les j deviennent i, et tous les v deviennent u. Plus de détails...
|
|
QString | deAccent (QString c) |
| supprime tous les accents d'un texte Plus de détails...
|
|
void | elide (QString *mp) |
| met entre crochets la dernière syllabe de mp. Plus de détails...
|
|
const QRegExp | reAlphas ("(\\w+)") |
| Expression rationnelle pour un ensemble de lettres (avec sélection) Plus de détails...
|
|
const QRegExp | reEspace ("\\s+") |
| Expression rationnelle pour un ensemble d'espaces. Plus de détails...
|
|
const QRegExp | reLettres ("\\w") |
| Expression rationnelle pour une lettre (sans sélection) Plus de détails...
|
|
const QRegExp | rePonct ("([\\.?!;:])") |
| Expression rationnelle pour une ponctuation (avec sélection) Plus de détails...
|
|
bool | sort_i (const QString &a, const QString &b) |
| compare a et b sans tenir compte des diacritiques ni de la casse. Plus de détails...
|
|
bool | inv_sort_i (const QString &a, const QString &b) |
| compare a et b sans tenir compte des diacritiques ni de la casse. Plus de détails...
|
|
QString | versPC (QString k) |
| Comme Ch::versPedeCerto, mais ici le mot n'a pas été trouvé. Les voyelles ne sont pas marquées sauf par position... Plus de détails...
|
|
QString | versPedeCerto (QString k) |
| remplace les longues de k par +, les brèves par - et les communes par * Plus de détails...
|
|
QChar | breve (QChar c) |
| retourne la voyelle brève Plus de détails...
|
|
QString | transforme (QString k) |
| transforme les quantités en + et - en conservant les voyelles Plus de détails...
|
|
QString | accentue (QString l) |
| accentue la voyelle Plus de détails...
|
|
QString | ajoutSuff (QString fq, QString suffixe, QString l_etym, int accent) |
| ajoute le suffixe à la forme Plus de détails...
|
|
constantes et utilitaires de traitement des chaînes de caractères
QString Ch::ajoutSuff |
( |
QString |
fq, |
|
|
QString |
suffixe, |
|
|
QString |
l_etym, |
|
|
int |
accent |
|
) |
| |
ajoute le suffixe à la forme
- Paramètres
-
fq | : la forme avec ses quantités |
suffixe | : le suffixe avec ses quantités |
l_etym | : l'information étymologique |
accent | : un entier qui dit s'il faut scander ou accentuer |
- Renvoie
- la forme avec son suffixe, scandée ou accentuée
Lors de la lemmatisation, un éventuel enclitique a été séparée de la forme. Il faut donc le recoller à la fin. Toutefois, si la forme se termine par une consonne, on se retrouve avec deux consonnes de suite et la syllabe devient nécessairement longue.
- Note
- uirumque devient transitoirement vĭrŭm + quĕ, ce qui donne vĭrūmquĕ.
Si le paramètre accent est nul, on procède à une scansion. Sinon, l'ensemble sera accentué et accent spécifie le comportement dans le cas des voyelles communes (voir Scandeur::scandeTxt pour les détails).
Ce même paramètre accent permet de séparer les syllabes. Il faut alors faire attention aux éventuels préfixes qui conduisent à des exceptions dans le découpage. Ces exceptions sont indiquées dans l_etym. voir LemCore::lireHyphen pour quelques détails.
- Note
- L'enclitique attire l'accent. Le mot rosaque sera paroxyton, rosáque même au nominatif (où le a est bref).
QString Ch::deAccent |
( |
QString |
c | ) |
|
supprime tous les accents d'un texte
- Paramètres
-
c | : une chaine (mot ou texte) |
- Renvoie
- la chaine sans accent
Cette fonction est utilisée pour enlever les accents, les diacritiques (acute, macron, breve, tilde etc...) ou les cédilles d'un texte. En effet, certains textes (récupérés sur internet) contiennent des accents ou autres signes diacritiques qui peuvent nuire à la lemmatisation. Cette fonction utilise la décomposition normalisée des caractères Unicode et supprime les signes combinants qui ont été séparés du caractère de base.
- Bogue:
- Cette fonction n'est pas utilisée. Une fonction très similaire existe ailleurs : MainWindow::oteDiacritiques