transparent gif

 

Ej inloggad.

Göteborgs universitets publikationer

A Multi-domain Corpus of Swedish Word Sense Annotation

Författare och institution:
Richard Johansson (Institutionen för data- och informationsteknik (GU)); Yvonne Adesam (Institutionen för svenska språket); Gerlof Bouma (Institutionen för svenska språket); Karin Hedberg (-)
Publicerad i:
10th edition of the Language Resources and Evaluation Conference, 23-28 May 2016, Portorož (Slovenia), s. 3019-3022
ISBN:
978-2-9517408-9-1
Publikationstyp:
Konferensbidrag, refereegranskat
Publiceringsår:
2016
Språk:
engelska
Fulltextlänk:
Sammanfattning (abstract):
We describe the word sense annotation layer in Eukalyptus, a freely available five-domain corpus of contemporary Swedish with several annotation layers. The annotation uses the SALDO lexicon to define the sense inventory, and allows word sense annotation of compound segments and multiword units. We give an overview of the new annotation tool developed for this project, and finally present an analysis of the inter-annotator agreement between two annotators.
Ämne (baseras på Högskoleverkets indelning av forskningsämnen):
NATURVETENSKAP ->
Data- och informationsvetenskap ->
Språkteknologi (språkvetenskaplig databehandling)
NATURVETENSKAP ->
Data- och informationsvetenskap ->
Språkteknologi (språkvetenskaplig databehandling) ->
Datorlingvistik
HUMANIORA ->
Språk och litteratur ->
Jämförande språkvetenskap och lingvistik ->
Lingvistik
Nyckelord:
ordbetydelsedisambiguering, word sense disambiguation, lexical semantics, corpora, annotation
Postens nummer:
233140
Posten skapad:
2016-03-12 14:18
Posten ändrad:
2016-09-23 12:43

Visa i Endnote-format

Göteborgs universitet • Tel. 031-786 0000
© Göteborgs universitet 2007