Collatinus 11 — guide
index précédent : Serveur suivant : Pour les programmeurs
Pour faire son travail, Collatinus s'appuie sur une
collection de fichiers qui contiennent toutes les
connaissances nécessaires. À l'initialisation du
programme, ils sont tous lus, et les données mises
en listes et placées en mémoire vive.
Si on remarque une erreur ou une lacune dans ses résultats, et qu'on a des connaissances suffisantes en gestion et édition de fichiers, on peut commencer à les modifier. Il faut bien sûr prendre des précaution, notamment en prenant soin de faire une copie de sauvegarde avant toute intervention : on crée un répertoire dont on note bien le chemin, et on y copie les fichiers qu'on a l'intention de modifier. On peut ainsi, en cas d'échecs, les rétablir dans leur état initial.
Les fichiers les plus importants sont détaillés ci-dessous.
C'est un simple fichier dans lequel sont toutes les morphologies possibles que peuvent prendre les formes latines. Ainsi pour désigner une morphologie, on donne le numéro de la ligne où elle se trouve. Par exemple, la morphologie vocatif masculin singulier participe présent actif est désignée par le nombre 190.
C'est de loin le plus important. Y sont placés tous les modèles de flexion.
Un modèle est un ensemble de lignes. Chaque modèle est séparé du précédent par une ligne vide.
Une ligne commençant par un point d'exclamation est un commentaire. Lors de sa lecture, Collatinus n'en tient pas compte.
Chaque ligne est bâtie sur le schéma clé:valeur Tout ce qui précède le premier caractère deux points est la clé, le reste est la valeur. La première clé doit être le nom du modèle. L'ordre dans lequel apparaissent les autres clés n'a pas d'importance, mais mieux vaut rester cohérent et garder la même disposition.
Comme les mêmes séries de désinences sont souvent utilisées de nombreuses fois par des modèles et des radicaux différents, on peut mettre ces séries en variables. Ainsi, pour le modèle uita. Au lieu d'écrire :
modele:uita
R:1:1,0
des:1-12:1:ă;ă;ăm;āe;āe;ā;āe;āe;ās;ārum;īs;īs
On définit une variable de cette manière :
$<variable>:<valeurs>
Par exemple, pour définir la variable uita :
$uita=ă;ă;ăm;āe;āe;ā;āe;āe;ās;ārum;īs;īs
et la définition du modèle deviendra :
modele:uita
R:1:1,0
des:1-12:1:$uita
La variable $uita peut être utilisée pour le participe parfait :
modele:amo
(radicaux, autres désinences)
des:315-326:2:$uita
C'est un gros fichier qui donne tous les mots latins, leur modèle, leurs radicaux, et les indications morphologiques qui apparaîtront dans l'analyse.
Chaque lemme occupe une seule ligne. Six champs sont séparés par le caractère | :
Exemple :
ablŭo=ā̆blŭo|lego|ā̆blŭ|ā̆blūt|is, ere, lui, lutum|25
On place dans le fichier irregs.la les formes irrégulières. On peut hésiter entre l'ajout d'une forme dans ce fichier ou la définition d'un nouveau modèle. Si plus de trois lemmes construisent une forme dite irrégulière de la même manière, mieux vaut créer un modèle. De même, si un lemme a plus de trois formes irrégulières, mieux vaut créer un modèle pour ce lemme.
Le format est simple :
<forme>:<lemme>:<morphos>
Exemples :
ălĭud*:alius:37-39
āccēstĭs:accedo:143
āmbŏbŭs*:ambo:17,18,29,30,47,48
Les fichiers de traductions sont tous nommées lemmes.??, les deux points d'interrogation étant deux caractères qui servent à désigner la langue cible. (fr=français, it=italien, etc.)
Leur format est extrêmement simple : <lemme>:<traduction>
bin/data/assimilations.la et bin/data/contractions.la sont deux fichiers qui permettent de déclarer
index précédent : Serveur suivant : Pour les programmeurs