Grammatiske regler for disambiguering (analyse av tvetydighet), analyse av setningsstruktur og navnegjenkjenning

Føringsgrammatikkane i CG-3-format er lett tilgjengelege for nedlasting (sjå lenkjene nedanfor).

Uheldigvis finst det berre offentlege lenkjer for binærfila til multitaggaren (som gir ordanalyse). Denne er delvis basert på Norsk Ordbank, som er opent tilgjengeleg, men samansetjingsanalysen, namnegjenkjennaren og den statistiske taggaren er vanskelegare å få tak på. På http://svn.emmtee.net/tags/handon/uib/lisp/projects/morph/compounds.lisp finn ein LISP-koden som høyrer til samansetjingsanalysen (eller?).

http://svn.emmtee.net/tags/handon/uib/lisp/projects/cgp/multi-tagger/ ser ut til å køyre multi-taggaren (morfologisk analyse), medan http://svn.emmtee.net/tags/handon/uib/lisp/projects/cgp ser ut som ein implementasjon av føringsgrammatikk. Alt i LISP.

Under http://svn.emmtee.net/tags/handon/uib/lisp/projects/cgp/rules/ ligg dei føringsgrammatiske reglane i LISP CG2-format.

Data and Resources

Additional Info

Field Value
Source http://maximos.aksis.uib.no/Aksis-wiki/Oslo-Bergen_Tagger
Last Updated November 27, 2014, 20:43 (UTC)
Created November 27, 2014, 20:22 (UTC)
Format "CG (Constraint Grammar-filer), lisp-kode"