Gépi fordítás
A Wikipédiából, a szabad lexikonból.
Gépi fordításnak nevezzük azt a fordítási eljárást, amikor egy adott nyelvű szöveget egy másik nyelvű szövegre számítógépes program segítségével fordítunk le.
A szövegek gépi fordítására ma már léteznek számítógépes programok, de ezek felhasználási területe még korlátozott. Elsősorban olyankor lehetnek hasznosak, ha a cél a megértés, vagy információszerzés. A felhasználás egyik területe az, amikor segítségével az idegen nyelvet egyáltalán nem beszélők a számukra érthetetlen szövegek tartalmáról képet nyernek. A másik elterjedt alkalmazása, hogy gyors áttekintés, vagy kereshetőség érdekében nyersfordítást készítenek. A programok általában arra még nem alkalmasak, hogy a gépi fordítás utószerkesztésével, az emberi fordítással azonos minőségű fordítást gyorsabban előállítsuk elő.
Többféle probléma nehezíti az ilyen programok létrejöttét:
- Egy szó többféle fogalmat jelölhet. Például a vár szó a várást jelenthet, vagy a hegy tetején álló várat is.
- Kifejezések felismerése. Kifejezések, mint "nyugtával dicsérd a napot" mást jelentenek együtt, mint az egyes szavak fordításából alkotott mondat. A fordítóprogramnak a kifejezéseket föl kell ismerni minden formában (múlt, jelen, jövőidő, feltételes mód stb..), és a másik nyelvű helyes jelentést megmutatni. Emellett föl kell ismernie, hogy az adott esetben egyáltalán kifejezésszerű használatról van-e szó, vagy esetleg csak az adott szavak fordítását kellene használni.
- szerkezeti (nyelvtani) többértelműség: Például: A "Látom a hölgyet a távcsővel." mondat a triviális jelentése mellett jelentheti azt is, hogy egy olyan hölgyet látok, akinél egy távcső van.
További részproblémák is származhatnak a fenti két alapproblémából, melyeket hosszasan lehetne sorolni. A gépi fordítás eredményeinek mosolyogtató gyöngyszemeit is hosszasan lehetne idézni.
A kifejezések fordítására már elég régóta kifejezésgyűjteményeket használnak, melyek azonban nem oldják meg tökéletesen a kifejezések fölismerését.
Próbálkozások folynak korpusz szintű fordítóprogramok előállítására. A korpusz ez esetben nagymennyiségű gépen tárolt fordított szöveget jelent. Új szöveg esetén a fordító megpróbálja a tárolt szövegek alapján a meglévő fordítást a fordítandó szövegre illeszteni. Mindezt a környezettel súlyozva, tehát például biológiai szöveg esetén először a biológiai tárgyú szövegek között keresve.
A szokásos módszerek:
- Direkt fordítás. Ez a szóról szóra történő fordítás. A fordítás végén az egyes szavakat és szórendet a célnyelv szabályai szerint helyesbítik. Ez egy kezdetleges módszer, mely általában rossz minőségű, érthetetlen eredményt ad. Ennek ellenére még ma is születnek ilyen megoldások, mert a kifejlesztésük olcsó és gyors.
- RBMT (Rule-Based Machine Translation) Szabály alapú gépi fordítás. A szabályalapú fordítás szótáron és nyelvi szabályokon alapul. Az elemzési folyamat során a forrásnyelvi mondatokhoz egy belső reprezentációt (általában fastruktúrákat) rendelnek. A generálás ezen belső reprezentáció célnyelvi kifejtése. Az fordítás történhet közvetlenül a két nyelv között (transfer) vagy közvetítőnyelven keresztül (interlingua).
- EBMT (Example-Based Machine Translation=példán alapuló fordítás). Ennek lelke egy fordítási memória, melyben gyakran előforduló mondatokat vagy kifejezéseket tárolnak. A fordítandó mondathoz leghasonlóbb tárolt mondatokból rakják össze a lefordított mondatot.
- SBMT (Statistics-Based Machine Translation=statisztikán alapuló fordítás). Ez a korpuszra alapozott módszer. A gép a fordítás előtt nagyszámú lefordított szöveget analizál. Ennek során előáll egy szótár és egy nyelvtani szabálygyűjtemény, a fordítás ezek alapján történik. Ez a módszer ma igen népszerű, mert nem igényli a résztvevő nyelvek ismeretét. A fordítási minőség emiatt általában igen rossz. A pentagon ma ezt a módszert használja, mivel így nincs szüksége emberi közreműködésre a szabályok leírásához.
- HAMT (Human-Aided Machine Translation= emberi közreműködéssel végzett fordítás). A gép és az ember kéz a kézben dolgozik. Hosszú mondatok esetén az embertől kér a számítógép segítséget, vagy arra kéri az embert, hogy a hosszú mondatokból rövideket csináljon. (Úgynevezett irányított nyelv). A gép több jelentésű szavak esetén az embertől kéri a helyes szó kiválasztását.
A gyakorlatban használt rendszerek sokszor sokféle módszer keverékéből állnak. A szabályalapú és az példán alapuló módszereket használják a leggyakrabban.
A piaci helyzet megtévesztő. Látszólag sok fordítóprogram van, valójában általában ugyannak a programnak a különféle alkalmazásait látjuk viszont. Például a Systran program működik a Babelfishben, a Google-ben, az AltaVistában és a Wordlingóban is.
A piacon sok program nevezi magát fordítóprogramnak, a név azonban félrevezető, mert durva segítségnél többet ezek nem adnak, mi több, a fordítás után sokszor teljesen értelmetlenné válhat az eredeti szöveg.
A fordítási segítségek közül említésre méltóak az ún. fordítási memóriák (angolul translation memory), melyek a szöveggel tanulnak, azaz megjegyzik a kézi fordításokat, és kívánságra ezeket beillesztik a fordítandó szövegbe. Lehetnek hasznosak, de bizonyos esetekben lehetnek kontraproduktívak is.
Tartalomjegyzék |
[szerkesztés] Külső hivatkozások
[szerkesztés] Fordítóprogramok, magyar
- www.webforditas.hu – ingyenes szöveg- és weblapfordító szótárral
- Ingyenes web-oldal és szöveg fordító
- Ingyenes szöveg fordító és szótár


Based on work by