COMPILATION:

Pour compiler les programmes il faut
* l'outil 'jam' (de chez Perforce)
* la librairie C++ Boost (www.boost.org)
* la librairie libxml (standard)

+ la librairie ICU d'IBM mais je crois seulement pour les programmes
  sur les dicos XML, donc on doit pouvoir s'en passer pour le parsing.

Pour compiler le tout il suffit de taper
$ jam
dans le repertoire principal
puis d'être (très) patient ....

la commande :
$ jam install
installe les programmes dans le repertoire $(HOME)/olive/bin

Pour les utiliser il suffit de rajouter ce repertoire dans la
variable PATH (avec le repertoire App d'Unitex).

La plupart des programmes on besoin d'une description du jeu
d'etiquettes XML (lingdef.xml) pour fonctionner qui peut
être spécifiée soit avec l'argument -l <lingdefpath>
soit avec la variable d'environement LINGDEF.




UTILISATION


unification grammar:

* Pour compiler un ensemble de grf, en grammaire d'unification :

$ grf2ugrammar [-f] <main> <dir>

avec main: le nom du graph principal
     dir : le repertoire ou sont stockés tous les graphes unitex (.grf)

le programme créé un repertoire <main>.grm/ ou sont stockes tous
les resultats intermediaires + la grammaire compilée sous le nom <main>.ugram.

l'option -f permet de supprimer le repertoire <main>.grm avant de proceder
à la compilation, sinon si le repertoire existe deja le programme ne touche à rien.

par exemple:
$ grf2ugrammar -f P ~/unitex/French/Graphs/P
cree une grammaire P.grm/P.ugram à partir du repertoire courant.


* pour pretraiter un texte brut et le transformer en automate du texte :

$ preprocess [-iso] <text>
le texte doit etre encode en utf8, ou en latin1 (avec l'option -iso)

le programme cree l'automate du texte (en XML) dans le fichier <text>.fsa.gz
plus différents fichiers intermédiaires dans /tmp/Corpus

p.ex.: $ preprocess text
-> produit text.fsa.gz

* pour appliquer une grammaire d'unification à un texte FSA :

$ uparse -g <gram> <textfsa>

ou <gram> est une grammaire produite avec grf2ugrammar
et <textfsa> est un automate du texte obtenu avec preprocess

le programme créé une chart dans <textfsa>.chart qui contient
le resultat du parsing.

p.ex.: $ uparse -g P.grm/P.ugram text.fsa.gz
-> produit : text.chart

* pour visualiser les resultat
$ chart-dump-synts [-fs] -synt <syntname> <chart>
$ chart-dump-preds <chart>

affiche tous les syntagmes <syntname> qui ont été reconnus lors du parsing.
l'option -fs c'est pour afficher les structure associées

p.ex: $ chart-dump-synts -synt P text.chart -fs

affiche tous les syntagmes P reconnus par la grammaire dans text,
avec leur structure de traits.


