Íslenskur orðasjóður

Erla Hallsteinsdóttir

Í greininni er lýst tilurð og eiginleikum íslensks textagrunns - Íslensks orðasjóðs - sem unnið er að við Háskólann í Leipzig. Íslenskur orðasjóður er íslenskur textagrunnur með innbyggðu orðasafni sem samanstendur af u.þ.b. 250 milljónum orða og orðmynda úr íslensku nútímamáli. Íslenskur orðasjóður var unninn við Háskólann í Leipzig sem hluti af rannsóknarvinnu við verkefnið Leipzig Corpora Collection (http://corpora.informatik.uni-leipzig.de/). Textarnir í texta grunninum eru úr vefsíðusöfnun Landsbókasafns Íslands - Háskólabókasafns haustið 2005 og notendaumhverfið
var þróað við tölvunarfræðideild Háskólans í Leipzig.  Textagrunnurinn verður birtur á Veraldarvefnum til frjálsrar notkunar. Í greininni er notkunarmöguleikum textagrunnsins lýst, bæði sem orðasafns fyrir almenna notendur og sem rannsóknartækis við rannsóknir í hagnýtum og almennum málvísindum.