Collatinus  11.3
Fonctions | Variables
Référence de l'espace de nommage Ch

constantes et utilitaires de traitement des chaînes de caractères Plus de détails...

Fonctions

QStringList ajoute (QString mot, QStringList liste)
 Ajoute mot au début de chaque item de liste. Plus de détails...
 
void allonge (QString *f)
 modifie f pour que sa dernière voyelle devienne longue. Plus de détails...
 
QString atone (const QString a, bool bdc=false)
 supprime tous les diacritiques de la chaîne a Plus de détails...
 
QString communes (QString g)
 note comme communes toutes les voyelles qui ne portent pas de quantité. Plus de détails...
 
void deQuant (QString *c)
 supprime la quantité de la voyelle finale Plus de détails...
 
void genStrNum (const QString s, QString *ch, int *n)
 sépare la chaine d'entrée en lettres et nombre Plus de détails...
 
QString deramise (QString r)
 retourne une graphie non-ramiste de r, càd dont tous les j deviennent i, et tous les v deviennent u. Plus de détails...
 
QString deAccent (QString c)
 supprime tous les accents d'un texte Plus de détails...
 
void elide (QString *mp)
 met entre crochets la dernière syllabe de mp. Plus de détails...
 
const QRegExp reAlphas ("(\\w+)")
 Expression rationnelle pour un ensemble de lettres (avec sélection) Plus de détails...
 
const QRegExp reEspace ("\\s+")
 Expression rationnelle pour un ensemble d'espaces. Plus de détails...
 
const QRegExp reLettres ("\\w")
 Expression rationnelle pour une lettre (sans sélection) Plus de détails...
 
const QRegExp rePonct ("([\\.?!;:])")
 Expression rationnelle pour une ponctuation (avec sélection) Plus de détails...
 
bool sort_i (const QString &a, const QString &b)
 compare a et b sans tenir compte des diacritiques ni de la casse. Plus de détails...
 
bool inv_sort_i (const QString &a, const QString &b)
 compare a et b sans tenir compte des diacritiques ni de la casse. Plus de détails...
 
QString versPC (QString k)
 Comme Ch::versPedeCerto, mais ici le mot n'a pas été trouvé. Les voyelles ne sont pas marquées sauf par position... Plus de détails...
 
QString versPedeCerto (QString k)
 remplace les longues de k par +, les brèves par - et les communes par * Plus de détails...
 
QChar breve (QChar c)
 retourne la voyelle brève Plus de détails...
 
QString transforme (QString k)
 transforme les quantités en + et - en conservant les voyelles Plus de détails...
 
QString accentue (QString l)
 accentue la voyelle Plus de détails...
 
QString ajoutSuff (QString fq, QString suffixe, QString l_etym, int accent)
 ajoute le suffixe à la forme Plus de détails...
 

Variables

QString const consonnes = "bcdfgjklmnpqrstvwxz"
 Chaine donnant les consonnes. Plus de détails...
 
QString const voyelles = "āăēĕīĭōŏūŭȳўĀĂĒĔĪĬŌŎŪŬȲЎ"
 Chaine donnant les voyelles avec macron ou breve. Plus de détails...
 
QChar const separSyll = 0x00B7
 Caractère utilisé pour séparer les syllabes (ici un MIDDLE DOT : ·) Plus de détails...
 

Description détaillée

constantes et utilitaires de traitement des chaînes de caractères

Documentation des fonctions

QString Ch::accentue ( QString  l)

accentue la voyelle

Paramètres
l: une voyelle ou une diphtongue
Renvoie
la voyelle ou la diphtongue accentuée

Cette fonction place un accent aigu sur la voyelle donnée en argument. Si l'argument n'est pas une voyelle, il ne se passe rien. Cette fonction est utilisée pour accentuer un mot, dans Ch::ajoutSuff.

QStringList Ch::ajoute ( QString  mot,
QStringList  liste 
)

Ajoute mot au début de chaque item de liste.

QString Ch::ajoutSuff ( QString  fq,
QString  suffixe,
QString  l_etym,
int  accent 
)

ajoute le suffixe à la forme

Paramètres
fq: la forme avec ses quantités
suffixe: le suffixe avec ses quantités
l_etym: l'information étymologique
accent: un entier qui dit s'il faut scander ou accentuer
Renvoie
la forme avec son suffixe, scandée ou accentuée

Lors de la lemmatisation, un éventuel enclitique a été séparée de la forme. Il faut donc le recoller à la fin. Toutefois, si la forme se termine par une consonne, on se retrouve avec deux consonnes de suite et la syllabe devient nécessairement longue.

Note
uirumque devient transitoirement vĭrŭm + quĕ, ce qui donne vĭrūmquĕ.

Si le paramètre accent est nul, on procède à une scansion. Sinon, l'ensemble sera accentué et accent spécifie le comportement dans le cas des voyelles communes (voir Scandeur::scandeTxt pour les détails).

Ce même paramètre accent permet de séparer les syllabes. Il faut alors faire attention aux éventuels préfixes qui conduisent à des exceptions dans le découpage. Ces exceptions sont indiquées dans l_etym. voir LemCore::lireHyphen pour quelques détails.

Note
L'enclitique attire l'accent. Le mot rosaque sera paroxyton, rosáque même au nominatif (où le a est bref).
void Ch::allonge ( QString *  f)

modifie f pour que sa dernière voyelle devienne longue.

QString Ch::atone ( const QString  a,
bool  bdc = false 
)

supprime tous les diacritiques de la chaîne a

Paramètres
a: le mot à traiter
bdc: si bdc est à false (par défaut), les diacritiques des majuscules sont également supprimés.
Renvoie
le mot sans diacritique.
QChar Ch::breve ( QChar  c)

retourne la voyelle brève

Paramètres
c: une voyelle sans quantité en minuscule
Renvoie
la fonction retourne la voyelle brève correspondant à c. Si c n'est pas une voyelle (aeiouy), la fonction retourne c.
QString Ch::communes ( QString  g)

note comme communes toutes les voyelles qui ne portent pas de quantité.

QString Ch::deAccent ( QString  c)

supprime tous les accents d'un texte

Paramètres
c: une chaine (mot ou texte)
Renvoie
la chaine sans accent

Cette fonction est utilisée pour enlever les accents, les diacritiques (acute, macron, breve, tilde etc...) ou les cédilles d'un texte. En effet, certains textes (récupérés sur internet) contiennent des accents ou autres signes diacritiques qui peuvent nuire à la lemmatisation. Cette fonction utilise la décomposition normalisée des caractères Unicode et supprime les signes combinants qui ont été séparés du caractère de base.

Bogue:
Cette fonction n'est pas utilisée. Une fonction très similaire existe ailleurs : MainWindow::oteDiacritiques
void Ch::deQuant ( QString *  c)

supprime la quantité de la voyelle finale

Paramètres
c: le mot
Renvoie
le mot sans la quantité de la voyelle finale

Cette fonction est utilisée en cas d'élision. Elle supprime la quantité de la voyelle finale de la chaine c lorsque cette voyelle est en fin de mot ou suivie d'un "m".

QString Ch::deramise ( QString  r)

retourne une graphie non-ramiste de r, càd dont tous les j deviennent i, et tous les v deviennent u.

void Ch::elide ( QString *  mp)

met entre crochets la dernière syllabe de mp.

void Ch::genStrNum ( const QString  s,
QString *  ch,
int *  n 
)

sépare la chaine d'entrée en lettres et nombre

Paramètres
s: la chaine à découper
ch: une chaine passée par adresse qui reçoit les lettres précédant un chiffre
n: un entier passée par adresse qui reçoit la valeur numérique finale
Obsolète:
Cette fonction semble inusitée...
bool Ch::inv_sort_i ( const QString &  a,
const QString &  b 
)

compare a et b sans tenir compte des diacritiques ni de la casse.

Renvoie
true si a > b. Utilisée pour ranger les mots en fontions des fréquences descendantes
const QRegExp Ch::reAlphas ( "(\\w+)"  )

Expression rationnelle pour un ensemble de lettres (avec sélection)

const QRegExp Ch::reEspace ( "\\s+"  )

Expression rationnelle pour un ensemble d'espaces.

const QRegExp Ch::reLettres ( "\\w"  )

Expression rationnelle pour une lettre (sans sélection)

const QRegExp Ch::rePonct ( "([\\.?!;:])"  )

Expression rationnelle pour une ponctuation (avec sélection)

bool Ch::sort_i ( const QString &  a,
const QString &  b 
)

compare a et b sans tenir compte des diacritiques ni de la casse.

Renvoie
true si a < b.
QString Ch::transforme ( QString  k)

transforme les quantités en + et - en conservant les voyelles

Paramètres
k: la chaine à transformer
Renvoie
la chaine transformée

Cette fonction transforme les quantités indiquées avec macron ou breve par les signes + et -, tout en conservant la voyelle. Une "*" pour les voyelles communes. Elle est utilisée pour accentuer un mot, dans Ch::ajoutSuff.

QString Ch::versPC ( QString  k)

Comme Ch::versPedeCerto, mais ici le mot n'a pas été trouvé. Les voyelles ne sont pas marquées sauf par position...

QString Ch::versPedeCerto ( QString  k)

remplace les longues de k par +, les brèves par - et les communes par *

Documentation des variables

QString const Ch::consonnes = "bcdfgjklmnpqrstvwxz"

Chaine donnant les consonnes.

QChar const Ch::separSyll = 0x00B7

Caractère utilisé pour séparer les syllabes (ici un MIDDLE DOT : ·)

QString const Ch::voyelles = "āăēĕīĭōŏūŭȳўĀĂĒĔĪĬŌŎŪŬȲЎ"

Chaine donnant les voyelles avec macron ou breve.