Vélþýðingar og bókmenntatextar

Rauðar útlínur örflögu. — Michael Dziedzic / Unsplash

Framfarir í vélþýðingum undanfarinn áratug hafa líklega ekki farið fram hjá mörgum. Á samfélagsmiðlum er hægt að þýða stöðuuppfærslur sjálfkrafa á milli mála, í vefvöfrum er hægt að þýða heilu vefsíðurnar á augabragði og svo hafa margir notað þýðingarvélar á borð við Google Translate og Microsoft Translator á ferðalögum í útlöndum eða til að glöggva sig á merkingu erlendra orða eða setninga. Mestu framfarirnar á þessu sviði byggja á nýjum aðferðum sem nota stærðfræðileg tauganet. Þó að tilraunir með nýtingu þeirra við þýðingar á milli tungumála eigi sér nokkuð langa sögu, sem nær allt aftur til níunda áratugarins, hefur aukinn aðgangur að miklu reikniafli undanfarin ár, opinn hugbúnaður sem auðveldar forriturum að vinna með tauganet og nýjar tegundir tauganetslíkana orðið til þess að gerbreyta möguleikunum á þessu sviði.

Þýðingarvélar þurfa rétt gögn

Tauganetsþýðingarvélarnar virka yfirleitt betur á sumum sviðum en öðrum. Þýðingarvél getur til dæmis verið góð í að þýða EES-reglugerðir en léleg í að þýða lýsingu á fótboltaleik. Það er vegna þess að netin þurfa að „sjá“ mjög mikið af þýðingardæmum til að „læra“ að þýða, en þá er talað um að þjálfa þýðingarvélina. Og ef vélin sér bara Evrópureglugerðir en engar þýðingar um fótbolta lærir hún ekki orðfærið og málvenjurnar sem gilda í þýðingum á leiklýsingum.

Nytjatextar og bókmenntatextar

Textum sem ætlaðir eru til útgáfu getum við (ef við erum svolítið glannaleg) skipt í tvo flokka og gerum það hér til einföldunar. Þá er annars vegar um að ræða svokallaða nytjatexta og hins vegar bókmenntatexta. Þegar við notum svona grófa flokkun er rétt að reyna að skilgreina hvað átt er við með hvoru um sig. Hér köllum við það nytjatexta þegar textanum er ætlað að koma upplýsingum á framfæri og það eina sem skiptir máli er því að merking upprunatextans skili sér. Bókmenntatexta köllum við hins vegar það þegar jafn miklu máli skiptir hvernig hlutirnir eru sagðir og það sem sagt er. Í þýðingu bókmenntatexta er markmiðið þá ekki síður að framkalla hjá lesandanum þá tilfinningu sem upprunatextinn skapar en að koma merkingu orðanna til skila. Höfundar hafa hver sinn stíl, mismunandi málvenjur gilda á mismunandi tímum og misjafnar hefðir eiga við í mismunandi bókmenntagreinum. Það er því grundvallarmunur á að þjálfa þýðingarvél til að þýða Evrópureglugerðir, þar sem sama málsnið þarf að vera á þúsundum skjala og orðaforði er að nokkrum hluta staðlaður, og bókmenntatexta þar sem stíll hvers texta getur ráðist af ótal þáttum og vandi þýðandans lýtur kannski helst að því að flytja stílinn á milli tungumála og málsamfélaga. Þá geta þýðendur einnig þurft að leysa úr öðrum vandamálum sem flækja málin enn frekar, t.d. orðaleikjum, ýmsum þáttum sem tengjast menningarlegum bakgrunni og vísunum innan og út fyrir textann.

Þessar flækjur skýra að nokkru leyti hvers vegna umhverfi þeirra sem fást við bókmenntaþýðingar hefur breyst minna undanfarin 20−30 ár en þeirra sem fást við nytjaþýðingar. Á því tímabili hefur, auk þýðingarvéla, orðið mikil bylting í rafrænni útgáfu orðabóka og sérhæfður þýðingarbúnaður hefur orðið öflugri. Þýðingarhugbúnaðurinn hlutar texta niður í smærri einingar og vinnur með svokallað þýðingarminni sem auðveldar þýðendum að halda samræmi innan texta og að endurnýta þýðingar þegar setningar endurtaka sig. Það getur gefið þýðendum meira svigrúm til að einbeita sér að flóknari hlutum þýðingarinnar og flýtt fyrir vinnunni. Á hinn bóginn hefur þessi þróun einnig haft í för með sér auknar kröfur um hraða og lægri greiðslur til þýðenda miðað við textalengd (sjá t.d. Taivalkoski-Shilov, 2018). Þá hafa þýðendur lýst því hvernig það er að þýða stuttar einingar án samhengis sem „þýðingum í myrkri“ (Moorkens o.fl. 2018) og að þýðingarminni hindri listræna sköpun, letji hugann og geri málið samleitt (Ruffo, 2022:30).

Gervigreind í stað þýðenda?

Haustið 2023 falaðist hljóðbókaútgáfan Storytel eftir liðsinni bókmenntaþýðenda við að þýða bækur með aðstoð gervigreindar, en undanfarin misseri hefur hugtakið „gervigreind“ verið notað sem einhvers konar yfirheiti yfir þá tækni sem byggir á tauganetum. Rithöfundar og þýðendur lýstu áhyggjum af þróuninni og Guðrún C. Emilsdóttir, formaður Bandalags þýðenda og túlka, sagði í samtali við Morgunblaðið að hún sæi þetta sem leið fyrirtækisins til að lækka kostnað; að hætta væri á að með vélþýðingum yrðu þýðingar alltaf einsleitari og einsleitari og að með þýðingu frumtexta fylgdi orðunum margt sem gervigreindin myndi aldrei ná utan um (Morgunblaðið, 28. september 2023).

Áhyggjur Guðrúnar endurspegla það sem fram hefur komið í erlendum könnunum og rannsóknum og þá þróun sem átt hefur sér stað, sérstaklega í nytjaþýðingum. En eru efasemdir hennar um gervigreindina réttmætar? Það hlýtur að fara eftir því hvernig við lítum á hlutverk tækninnar við þýðingar bókmenntatexta. Ef tölvustuddar bókmenntaþýðingar eru unnar með sama hætti og tíðkast við nytjaþýðingar, þ.e.a.s. textarnir eru brotnir upp í einingar, þýðingar á einingunum fengnar úr þýðingarminni eða þýðingarvélum og þýðandi vinnur á akkorði við að staðfesta þær sem eru í lagi en laga hinar til, er hætt við að bókmenntaþýðingar verði einsleitar eins og Guðrún óttast. Þó að hægt sé að komast langt með að skila réttri merkingu textans með sjálfvirkum aðferðum henta þær enn illa til að skila því hvernig hlutirnir eru sagðir. En gætu vélþýðingar og annar tölvustuðningur bætt þýðingu á bókmenntatextum með einhverjum hætti?

Geta þýðingarvélar þýtt bókmenntir?

Árið 2014, skömmu áður en tauganetsþýðingarvélarnar urðu allsráðandi, kölluðu Antonio Toral og Andy Way (2014) bókmenntaþýðingar „síðasta vígi mennskra þýðenda“, en bentu samt á að vísbendingar væru um að á milli mjög skyldra tungumála gætu þýðingarvélar þess tíma gagnast sem hjálpartæki við bókmenntaþýðingar, sérstaklega í sumum greinum bókmennta.

Undanfarin ár hafa ýmsar tilraunir verið gerðar með vélþýðingar bókmenntatexta. Í þeim tilraunum er mat á gæðum þýðinganna einn helsti vandinn. Sjálfvirkar aðferðir við mat á þýðingarvélum byggja á samanburði vélþýddra setninga við viðmiðunartexta sem þýddur er af manni. Mælingin byggir svo á því hversu mörg orð eða orðastæður eru sameiginlegar í textunum. Þess háttar aðferðir geta gagnast vel þar sem málsnið og orðaforði er staðlaður en síður þegar þýðandinn hefur meira frelsi í orðavali og framsetningu. Nýlegar aðferðir byggja á að nota mállíkön til að greina merkingu þýddra setninga og meta hvort merkingin sé sú sama og í viðmiðunartexta og geta þær í mörgum tilvikum gagnast betur en hefðbundnu aðferðirnar. Þær eiga samt, eins og eldri aðferðir, ekki gott með að ná utan um hversu nálægt þýðingin kemst því að skapa sömu stemningu og frumtextinn.

Rannsóknir á þessu sviði snúast því oft um að skoða hvernig þýðendum gengur að vinna með tæknina: Hvort hún flýti eða tefji fyrir, hvort hún fletji textann út eða hjálpi við að ná anda frumtextans, hvort hún auki eða dragi úr einsleitni o.s.frv. Andrew Rothwell (2023) lýsir tilraun þar sem notuð er þýðingarvél sem lagar sig jafnóðum að leiðréttingum þýðandans. Hann segir að nútímaverkfæri beini þýðandanum alls ekki á rangar brautir eins og stundum sé haldið fram eða dragi úr sköpunargleði hans, heldur geti þau þvert á móti aukið á sköpunargleðina með því að auðvelda vinnu við fyrstu drög að þýðingu, hjálpað til við að greina erfið álitamál og geti gagnast í hugmyndavinnu þegar upp koma flókin úrlausnarefni. Þannig geti tæknin unnið gegn einsleitni, ef rétt er á haldið, og gefið þýðandanum meira rými til að vinna úr því sem vélin nær ekki utan um. En til að það gangi eftir er ólíklegt að sömu aðferðir og hafa þróast við þýðingar nytjatexta eigi við.

Þróun á komandi árum

Á næstu árum er líklegt að þróun verði í aðferðum sem auðvelda tölvustuddar bókmenntaþýðingar. Þýðingarvélar geta gefið margar tillögur að þýðingu á einum og sama textanum og hugsanlega verður auðveldara að laga þýðingarvélar að tilteknum bókmenntagreinum og stíl auk þess sem aðrar aðferðir í máltækni geta auðveldað þýðendum að finna viðeigandi samheiti eða að umorða texta. Mikill munur er þó á getu tækninnar eftir því hvert upprunamálið og markmálið er. Þýðingar á stöðluðum textum yfir á íslensku eru enn nokkuð ófullkomnar, ef undanskilin eru nokkur svið. Á meðan vélþýðingar á bókmenntatextum á milli tungumála fjölmennari málsvæða hafa enn ekki náð miklu skriði er því líklegt að talsverða vinnu þýðenda þurfi enn í að gera vélþýdda bókmenntatexta tilbúna til útgáfu. Að minnsta kosti ef ekki á að gera það á kostnað ánægju lesenda. Og það er auðvitað kjarni málsins: Að lesendur hafi aðgang að vönduðum þýðingum sem endurspegla frumtextann. Á meðan þýðingarvélar geta ekki framkallað þær stendur þetta „síðasta vígi“ þýðenda.

Birt þann 8. febrúar 2024
Síðast breytt 8. febrúar 2024

Pistlar

Vélþýðingar og bókmenntatextar

Höfundur

Heimildir