Lexique syntaxique LGLex version 3.3 - 2011/03/31
http://infolingu.univ-mlv.fr/
Licence: LGPL-LR

Le lexique LGLex est un lexique syntaxique des verbes, des noms prédicatifs, 
des expressions figées et des adverbes du français généré par LGExtract 
(Constant & Tolone, 2010; Tolone, 2011) à partir des tables du 
Lexique-Grammaire sous licence LGPL-LR. Il existe sous format XML et sous 
format texte.

Remarque :
Certaines tables de noms possèdent également des entrées verbales, qui sont 
morphologiquement dérivées du nom : 
  f1a,f1b,f1c,f1d,f1r,f2a,f2b,f2c,f21,f3,f4,f5,f9,ad,dr1,drc,es,fr1,fs1,is1
D'autres possèdent des entrées adjectivales, également morphologiquement 
dérivées du nom :
  an01,an02,an03,an04,an05,an06,ansy,es
De plus, les entrées de la table d'adverbes peco peuvent également être 
interprétée comme des adjectifs prédicatifs, alors que celles des tables 
d'averbes ppco et pvco sont aussi des expressions figées.
Ces entrées supplémentaires, en plus d'être mentionnées dans le lexique 
complet, ont été extraites dans le répertoire extra-lexicon/.

_______________________________________________________________________________
Explication du contenu du lexique LGLex au format XML (dans la balise <syn-lexicon>) :

Chaque entrée est délimitée par une balise <entry> avec un attribut id qui est 
l'identifiant de l'entrée qui indique sa catégorie, la classe (ou table) dont 
elle provient et le numéro de l'entrée dans cette table. Par exemple, dans 
<entry id="V_33_24" status="completed">, l'identifiant est V_33_24, ce qui 
correspond à la 24ème entrée de la table des verbes (ou de l'entrée ayant 
la propriété <ID> valant 24) de la classe 33. Le statut peut être "completed" 
pour une entrée entièrement codée, "to complete" pour une entrée qui a au moins
une propriété non codée ou "to encode" pour une entrée qui a au moins la moitié
de ses propriétés non codées.
Remarque : On appelle ici une propriété non codée, une propriété présente dans 
la table et codée ~. Cela ne tient pas compte du codage O dans la table des 
classes qui signifie également que la propriété doit être codée, mais qui ne 
figure pas dans la table.
Ensuite, les informations sont regroupées dans 4 balises spécifiques :
- <lexical-info> : le lemme et ses informations lexicales ;
- <arguments> : les arguments et leurs distributions ;
- <all-construction> : les constructions acceptées ;
- <example> : l'exemple d'illustration.


1) <lexical-info> contient les informations lexicales liées à l'entrée et 
possède un attribut cat précisant sa catégorie ("verb" pour verbe, "noun" 
pour nom prédicatif, "adj" pour adjectif prédicatif, "expr" pour expression 
figée et "adverb" pour adverbe) :

Uniquement pour les verbes :
- <lexical-value> contient <lemma>, ayant pour valeur le lemme, qui peut être 
complété par un pronom "se", "y", "en", "le", "la", "les" et/ou par la 
négation en "ne ... pas" lorsque cette forme est obligatoire pour cette 
entrée (<ppvse>, <ppvy>, <ppven>, <ppvle>, <ppvla>, <ppvles>, <neg> avec un 
attribut valeur "true") ;
- <aux> contient une liste contenant <avoir> ou <être> avec la mention "true" 
pour indiquer l'auxiliaire de cette entrée ;
- <traduction> contient pour certaines entrées la traduction du lemme en 
anglais ;

Pour les noms, les adjectifs, les expressions figées et les adverbes :
- <lexical-value> contient <complete>, ayant pour valeur l'entrée complete 
(qu'elle soit simple ou composée) et <noun1>, <adj1>, <det2>, <noun2> 
(pour les noms), ayant pour valeur les différents composants de l'entrée. 
L'adjectif ou le verbe morphologiquement dérivé du nom peut aussi être indiqué 
(<adjassoc> ou <verbassoc>).
Liste complète des balises pour toutes les catégories :
<adj>, <adj1>, <adv>, <adv1>, <c>, <c0>, <c02>, <c1>, <c12>, <c2>, <c3>, <cc>, 
<cv>, <conj>, <conj2>, <conjcoord>, <conjsub>, <det>, <det0>, <det02>, <det1>, 
<det12>, <det2>, <det3>, <detc>, <detv>, <ilya>, <modif>, <MPA>, <noun1>, 
<noun2>, <nv>, <poss1>, <prep>, <prep0>, <prep1>, <prep2>, <prep3>, <prepdetv>,
<prepc>, <prepv>, <verb>, <verb2>, <comme>, <ce>, <il>, <ca> et aussi 
<adjassoc>, <advassoc>, <nounassoc>, <ppvassos>, <ppvseassoc>, <ppvenassoc>, 
<ppvyassoc>, <ppvnegassoc>, <verbassoc> ;

Pour les noms et les expressions figées :
- <Vsup> décrit le verbe support associé au nom déverbal (ou à l'expression 
figée composée d'un adjectif ou d'un adverbe et d'un verbe support). Il 
contient <cat>, ayant pour valeur la catégorie "verb" et une liste de <value>, 
représentant les valeurs du verbe support Vsup faisant parti de la construction 
avec l'entrée ;

Uniquement pour les noms :
- <Vconv> est construit de la même manière que <Vsup> et fait référence à un 
deuxième groupe de valeurs pour le verbe support converse Vconv tel qu'il peut 
apparaître dans certaines constructions converses (ex: "N1 Vconv Det N à N0") ;
- <det-modif-list> contient une liste de <determiner-modifier> qui contient 
<det>, ayant pour valeur le ou les déterminants séparés par des '+' (le 
déterminant <E>, représentant l'absence de déterminant) et <modif> avec la 
mention "true" si le determinant accepte un modifieur ou "false" sinon. Cela 
peut être complété par <value-modif>, spécifiant la ou les valeurs possibles 
du modifieur séparés par des '+' ;

Pour les verbes et les noms:
- <prepositions> contient <preposition> avec un attribut id, correspondant au 
numéro de l'argument concerné (0 pour sujet, 1 pour premier complément, 2 pour 
deuxième complément...), ainsi qu'une liste de <prep>, représentant les 
valeurs de la préposition Prép.
ex: Prenons le nom prédicatif "allergie" (table an01) qui a pour verbe support 
"avoir" et pour construction de base "N0 Vsup Det N Prép N1". La préposition 
de l'argument 1 est spécifiée comme suit :

<prepositions>
      <preposition id="1">
        <prep value="à" />
      </preposition>
</prepositions>

Dans le complément "Prép N1", Prép a donc pour valeur "à" (ex: Léa a une 
certaine allergie à la poussière) ;

- <locatifs> contient <locatif> avec un attribut id, correspondant au numéro 
de l'argument concerné, ainsi qu'une liste de <prep>, représentant les valeurs 
de la préposition locative Loc.


2) <arguments> décrit les distributions des différents arguments (sujets et 
compléments) avec plusieurs balises <constituent> qui possèdent un attribut 
pos, indiquant le numéro de l'argument concerné et contiennent pour chaque 
<component> :
- <cat> avec un attribut spécifiant de quelle catégorie il s'agit : "NP" 
pour un syntagme nominal, "inf" pour une infinitive (V-inf W), "comp" pour 
une complétive (Qu P), "leFaitComp" pour le groupe nominal le fait que P, 
"siPOuSiP" pour la complétive si P ou si P et "adj" pour un adjectif ;
- les traits sémantiques <hum> (humain), <nothum> (non humain), <plobl> 
(pluriel obligatoire), <npr> (nom propre), <abst> (abstrait) et <conc> 
(concret) avec la mention "true" lorsqu'ils sont vérifiés ;

Uniquement pour les verbes :
- D'autres traits sémantiques sont possibles : <source>, <destination>, 
<beneficiaire>, <detrimentaire>, <apparition>, <disparition>, <mesure>, 
<prix>; et pour les noms : <coll> (collectif), <plur> (pluriel) ;

Quelques traits supplémentaires facultatifs :
- <mood> avec un attribut indiquant le mode de la complétive ("ind" pour 
indicatif et "subj" pour subjonctif) ;
- <contr> avec un attribut indiquant quel est le numéro de l'argument 
contrôleur qui contrôle l'infinitive, qui est l'argument contrôlé.
ex: Dans l'exemple précédent, la distribution de l'argument en position 1, 
c'est-à-dire le premier complément "Prép N1", est indiquée comme suit :

  <arguments>
     ...
    <constituent pos="1">
      <component>
        <cat value="inf" />
        <contr value="0" />
      </component>
      <component>
        <cat value="ceComp" />
        <mood value="ind" />
      </component>
      <component>
        <cat value="ceComp" />
        <mood value="subj" />
      </component>
      <component>
        <cat value="NP" />
        <nothum value="true" />
      </component>
    </constituent>
     ...
  </arguments>

Le complément "Prép N1" peut être :
- une infinitive contrôlée par l'argument 0, c'est-à-dire le sujet "N0", 
(ex: Léa a une allergie à travailler) ;
- une complétive à l'indicatif (Léa a une allergie à ce que Luc voyage) ;
- une complétive au subjonctif (Léa a une allergie à ce qu'il fasse beau) ;
- un syntagme nominal (cf. exemple précédent).

Uniquement pour les verbes :
- <origin> contient une liste <orig>, ayant pour valeur le ou les intitulés 
complets des colonnes dans la table ayant contribués à définir cette 
distribution ;
- <introd-prep> contient une liste de <prep> (introduisant l'argument), 
représentant les valeurs de la préposition Prép ;
- <introd-loc> contient une liste de <loc> (introduisant l'argument), 
représentant les valeurs de la préposition locative Loc.


3) <all-constructions> liste les différentes constructions dans lesquelles 
l'entrée peut prendre part :
- <absolute-constructions> contient une liste de <construction> (absolues), 
ayant pour valeur les intitulés de toutes les colonnes spécifiant une 
construction acceptée par l'entrée et nommée de façon complète, avec tous 
les éléments dans l'ordre.
Par exemple, dans la construction "N0 V N1 Prép N2", N0 représente le sujet, 
V indique que l'entrée est verbale, N1 représente le premier complément et 
Prép N2 le deuxième complément introduit par la préposition Prép.
L'intitulé est précédé de la mention "o::" ou "true::" pour savoir si cette 
colonne a été codée '+' dans la table ("o") ou est une constante '+' dans la 
table des classes ("true"). Dans ce dernier cas, cette propriété est vérifiée 
par toutes les entrées de la table, on y retrouve donc les propriétés 
définitoires de chaque classe, avec notamment la construction de base ;
- <relative-constructions> contient une liste de <construction> (relatives), 
ayant pour valeur les intitulés de toutes les colonnes spécifiant le nom d'une 
redistribution acceptée, c'est-à-dire une transformation à partir de la 
construction de base (ex: "[passif par]") ;

Uniquement pour les noms :
- <reductionsGN> décrit les réductions de la construction de base vers une 
autre construction dans une autre catégorie syntaxique, dans le cas présent, 
un groupe nominal. Les réductions sont décrites par une liste de <construction> 
ayant pour valeur les intitulés de toutes les colonnes spécifiant une réduction 
du groupe nominal acceptée (ex: "le N entre N0 et N1") ;
- <verbales> contient une liste de <construction> verbales ayant pour valeur 
les intitulés de toutes les colonnes spécifiant une construction acceptée par 
l'entrée verbale associée (<verbassoc>) ;

Uniquement pour les adverbes :
- <structureAdv> contient la structure de base de l'adverbe composé 
(ex: "Prép Det Adj C") ainsi que ses variantes dans une liste de <construction> 
(ex: "Prép Det C"). Cette structure fait référence à "Adv" dans les 
constructions absolues et relatives (ex: la construction absolue "N0 V Adv W" 
peut se réécrire "N0 V Prép Det Adj C W"). Pour les adverbes simples, la 
structure n'est pas indiquée puisqu'elle est directement notée "Adv" dans 
les contructions.


4) <example> illustre l'entrée (uniquement pour les verbes et les noms) :
<exemple> a pour valeur un exemple de phrase contenant l'entrée.
Pour les verbes, toutes les entrées contiennent un exemple alors que pour 
les noms cela ne concerne qu'un nombre restraint d'entrées. 

_______________________________________________________________________________
Une entrée du lexique LGLex au format texte contient les mêmes informations et se présente sous cette forme :

ID=catégorie_numTable_numEntrée;status=...
lexical-info=[...]
args=(...)
all-constructions=[absolute=(...),
                   relative=(...)]
example=[...]

_______________________________________________________________________________
Un exemple verbal du lexique LGLex au format XML (le verbe "candidater" de la table 33) :

<entry id="V_33_24" status="completed">
  <lexical-info cat="verb">
    <lexical-value>
      <lemma value="candidater" />
    </lexical-value>
      <aux>
        <avoir value="true" />
      </aux>
    <locatifs />
    <prepositions />
  </lexical-info>
  <arguments>
    <constituent pos="0">
      <component>
        <cat value="NP" />
        <hum value="true" />
        <origin>
          <orig value="N0 =: Nhum" />
        </origin>
        <introd-prep />
        <introd-loc />
      </component>
    </constituent>
    <constituent pos="1">
      <component>
        <cat value="NP" />
        <nothum value="true" />
        <origin>
          <orig value="N1 =: N-hum" />
        </origin>
        <introd-prep />
        <introd-loc />
      </component>
    </constituent>
  </arguments>
  <all-constructions>
    <absolute-constructions>
      <construction value="true::N0 V à N1" />
    </absolute-constructions>
    <relative-constructions>
      <construction value="[extrap]" />
      <construction value="Ppv =: y" />
    </relative-constructions>
  </all-constructions>
  <example>
    <example value="Max a candidaté à un poste" />
  </example>
</entry>

______________________________
Même exemple au format texte :

ID=V_33_24;status=completed
lexical-info=[cat="verb",verb=[lemma="candidater"],
              aux-list=(avoir="true"),
              prepositions=(),
              locatifs=()]
args=(const=[pos="0",dist=(comp=[cat="NP",hum="true",origin=(orig="N0 =: Nhum"),introd-prep=(),introd-loc=()])],
      const=[pos="1",dist=(comp=[cat="NP",nothum="true",origin=(orig="N1 =: N-hum"),introd-prep=(),introd-loc=()])])
all-constructions=[absolute=(construction="true::N0 V à N1"),
                   relative=(construction="[extrap]",construction="Ppv =: y")]
example=[example="Max a candidaté à un poste"]

_______________________________________________________________________________
Un exemple nominal du lexique LGLex au format XML (le nom "bise" de la table fnan, ayant pour verbe support "faire" : "faire la bise") :

<entry id="N_fnan_18" status="completed">
  <lexical-info cat="noun">
    <lexical-value>
      <complete value="bise" />
      <noun1 value="bise" />
    </lexical-value>
    <Vsup>
      <cat value="verb" />
      <value value="faire" />
    </Vsup>
    <det-modif-list>
      <determiner-modifier>
        <det value="un+une" />
        <modif value="false" />
      </determiner-modifier>
      <determiner-modifier>
        <det value="un+une" />
        <modif value="true" />
      </determiner-modifier>
      <determiner-modifier>
        <det value="la" />
        <modif value="false" />
      </determiner-modifier>
    </det-modif-list>
    <prepositions />
  </lexical-info>
  <arguments>
    <constituent pos="0">
      <component>
        <hum value="true" />
        <cat value="NP" />
      </component>
    </constituent>
    <constituent pos="1">
      <component>
        <hum value="true" />
        <cat value="NP" />
      </component>
    </constituent>
  </arguments>
  <all-constructions>
    <absolute-constructions>
      <construction value="true::N0 Vsup Det N à N1" />
      <construction value="true::N0 Vsup Det N" />
    </absolute-constructions>
    <relative-constructions />
    <reductions />
  </all-constructions>
  <example>
    <example value="" />
  </example>
</entry>

______________________________
Même exemple au format texte :

ID=N_fnan_18;status=completed
lexical-info=[cat="noun",noun=[notperm=[complete="bise"],noun1="bise"]],
              Vsup=[cat="verb",list=(value="faire")],
              detN=[list-det-modif=(det-modif=[det="un+une",modif="false"],det-modif=[det="un+une",modif="true"],det-modif=[det="la",modif="false"]),
              prepositions=()]
args=(const=[pos="0",dist=(comp=[hum="true",cat="NP"])],
      const=[pos="1",dist=(comp=[hum="true",cat="NP"])])
all-constructions=[absolute=(construction="true::N0 Vsup Det N à N1",construction="true::N0 Vsup Det N"),
                   relative=(),
                   verbales=(),
                   reductionsGN=()]
example=[example=]

___________
Références :

Constant, Matthieu & Tolone, Elsa (2010). A generic tool to generate a lexicon 
for NLP from Lexicon-Grammar tables. Lingue d'Europa e del Mediterraneo, 
Grammatica comparata, vol. 1, pp. 79--93. Edité par Michele De Gioia. Aracne.

Tolone, Elsa (2011). Analyse syntaxique à l'aide des tables du Lexique-Grammaire 
du français. Thèse de doctorat, LIGM, Université Paris-Est. 326 pp.
