Collatinus  11.3
Collatinus Documentation

Collatinus est une application libre, gratuite et multi-plateforme (Mac, Windows et Debian GNU/Linux), simple à installer et facile à utiliser.

Collatinus est à la fois un lemmatiseur et un analyseur morphologique de textes latins : il est capable, si on lui donne une forme déclinée ou conjuguée, de trouver quel mot il faudra chercher dans le dictionnaire pour avoir sa traduction dans une autre langue, ses différents sens, et toutes les autres données que fournit habituellement le dictionnaire.

En pratique, il est utile surtout au professeur de latin, qui peut ainsi très rapidement, à partir d’un texte hors-manuel, distribuer à ses élèves un texte inédit avec son aide lexicale. Les élèves s’en servent souvent pour lire plus facilement le latin lorsque leurs connaissances lexicales et morphologiques sont encore insuffisantes.

Page de présentation et téléchargement sur le site Biblissima : http://outils.biblissima.fr/collatinus/ (exécutables disponibles pour Mac OS, GNU/Linux et Windows).

Sources de Collatinus Les sources de la version 11 sont sur le dépôt Biblissima dans github.

Principales fonctionnalités

Historique

Collatinus était destiné, à l'origine, à produire des documents sur papier, et c'est encore souvent dans ce but qu'il est utilisé. Il a ensuite été perfectionné pour satisfaire de nouveaux usages et besoins :

  1. Disposer, lorsqu'on lit un texte latin, d'une aide lexicale et morphologique immédiate et discrète ;
  2. Faire des recherches lexicales et stylistiques ;
  3. Donner aux élèves des tâches d'identification, de relevé, de transformation.

Parmi les nouveaux usages et besoins, nous mentionnerons :

Par exemple, un enseignant anglais a ajouté des commentaires dans le fichier CSV produit par Collatinus, tout en sélectionnant la bonne lemmatisation. L'ensemble a ensuite été mis en forme pour produire un document PDF présentant le texte, son vocabulaire et les commentaires.

Principes de fonctionnement

Contrairement à la majorité des lemmatiseurs qui utilisent une liste de formes fléchies, Collatinus utilise un lexique contenant les lemmes et les informations nécessaires pour leur flexion. L'avantage est qu'avec environ 80 000 lemmes, Collatinus est capable de reconnaître plusieurs millions de formes. L'ajout du lemme correspondant à un nouveau mot ou à une variante orthographique (médiévale, par exemple) permettrait également de reconnaître toutes ses formes fléchies.

À partir du lemme et des désinences qui lui sont associées, Collatinus peut aussi donner des tableaux de flexion qui peuvent être utiles lors de l'apprentissage du latin.

Enfin, lorsque les quantités sont connues pour le lemme, Collatinus peut scander le mot et par là même tout un texte. Lorsqu'il scande un texte, Collatinus applique les règles habituelles d'allongement et d'élision.

Un tagueur probabiliste a également été ajouté à Collatinus pour essayer de désambiguïser les lemmatisations et analyses possibles. Ce tagueur repose sur un modèle de Markov caché (HMM) pour lequel les données statistiques ont été extraites du corpus de textes lemmatisés du LASLA

Licence

Ce programme est mis à disposition par Yves Ouvrard et Philippe Verkerk sous licence GNU GPL v3.

Publications