Strojový překlad / Machine Translation

Kdy a jak použít strojový překlad?

Strojové překlady jsou mezi námi už dlouhá léta. Do širšího povědomí se ale dostaly až v poslední době, a to hlavně díky zlepšující se kvalitě přeloženého textu.
Strojové překlady se posunuly do další vývojové fáze – dřívější statistické (SMT – Statistic Machine Translation) modely jsou nahrazovány neurálními (NMT – Neural Machine Translation).
Jednoduše řečeno – strojové překladače se začaly učit. Nejen z dat, které mu poskytneme, ale i ze svých vlastních chyb.

Tento na první pohled malý krůček ale znamená velký krok pro výslednou kvalitu přeloženého textu.

Stále však platí, že lidský překlad nenahradí – neznamená to tedy konec překladatelů ani překladatelských agentur. Jen se práce s překlady mění, respektive služby spojené s překlady.

Aspena používá pro zákazníky, kteří mají o strojový překlad zájem, dva hlavní strojové překladače – DeepL a Google Cloud Translate.  
Každý je vhodný na něco jiného – DeepL oproti Google sice nabízí omezený počet jazyků, je pomalejší, ale často vykazuje lepší kvalitu výsledného překladu.
Mezi další překladače, se kterými pracujeme, patří KantanMT, Omniscien, Amazon MT a Tilde MT.

Zde se dostáváme k základní otázce – kdy a jak použít strojový překlad.

Jak již bylo řečeno, lidský překlad strojovým nahradit nelze. Jsou ale případy, kdy použití strojového překladu může být vhodné – např. pro interní seznámení s textem v jiném jazyce nebo na testování vícejazyčného prostředí při psaní softwaru nebo aplikace.

Podívejme se na základní překlad. Ten je definován jako převod z jednoho přirozeného jazyka do druhého, a to při zachování významu. 

Po překladu lidským překladatelem budete mít text, jehož smyslu budete rozumět bez jakékoliv znalosti zdrojového jazyka.

Při použití strojového překladu budete mít text, který se dá zjednodušeně popsat takto:

  • velké části budete rozumět také (jak velké záleží na použitém překladači, jazykové kombinaci, zdrojovém textu, míře vytrénování překladače , apod.),
  • část textu bude spíše srozumitelná pro toho, kdo zná zdrojový jazyk (odhadne, jak to stroj „myslel“, když text přeložil),
  • část textu smysl dávat nemusí žádný.

Není to tak dávno, kdy nesrozumitelné (až nesmyslné) části po strojovém překladu byly v řádech desítek procent z celkového objemu textu. To se rychle mění, a je to právě díky využití neuronových sítí a hlubokého učení (deep learning).

Je však nebezpečné spoléhat se na to, že strojově přeložené dokumenty zajistí 100% srozumitelnost.

Strojové překlady bez dalších úprav nejsou vhodné k jakékoliv publikaci. Tu zajistí až další krok se zapojením lidského překladatele; a tím je post-editing (MTPE – Machine Translation Post-Editing).

Aspena nabízí dvě možnosti post-editingu:

Light Post-Editing – revize textu lidským překladatelem, jejímž cílem je zajistit jen nejnutnější opravy textu tak, aby výsledek byl jako celek srozumitelný pro koncového uživatele – nezabývá se stylistikou, neřeší preferenční změny. Není účelem zajistit překlad, který je srovnatelný s lidským překladem. Z velké části se používá pro urgentní interní překlady.

Full Post-Editing – hlubší revize textu, jejíž cílem je dosáhnout kvality srovnatelné s lidským překladem. To může ve výsledku znamenat i to, že některé části překladatel přeloží znovu a strojově přeložený text ignoruje. 

Z našeho pohledu je strojový překlad jednou ze služeb v našem portfoliu – není to náhražka klasického překladu.

Je důležité si uvědomit, že ne všechny dokumenty jsou vhodné pro strojový překlad. Jedná se zejména o dokumenty, které obsahují kreativní texty, specifický styl vyjadřování (ironie, vtipy, básnické obraty apod.)

Naopak například technické, stereotypní, standardizované texty vhodné jsou.

Stojí za zmínku, že i z původně nevhodného textu pro strojový překlad se může stát kvalitně přeložený text. Záleží na vhodně zvolené kombinaci strojového překladače a lidského překladatele.

Neméně důležitou věcí k zamyšlení je to, zda si strojový překlad má zákazník vypracovat sám nebo zadat překladatelské agentuře.

DeepL i Google nabízí překlady formou kopírování textů do webového rozhraní a následném zkopírování zpět do dokumentu. To může být pracné, zdlouhavé a není zachováno formátování.
DeepL na rozdíl od Googlu nabízí i překlady celých souborů (v současné době jen MS Word a PowerPoint), ale v rámci varianty zdarma je omezen počet a velikost dokumentů (3 dokumenty měsíčně). I v případě placených verzí je počet dokumentů a objem omezen.
Pro pořádek je třeba uvést, že Google nabízí překlady základních dokumentů v prostředí jejich webové aplikace Google Docs.
DeepL také nabízí desktopovou aplikaci pro Windows a Mac, která práci částečně zjednodušuje, ale stále má své limity.

Co ale dělat, když nechci být limitován velikostí a druhem zdrojového souboru?
Když potřebuji přeložit webové stránky, položky v softwarovém kódu, databázové soubory nebo složité grafické tiskoviny vytvořené v inDesignu?
A ještě konkrétněji – co když potřebuji přeložit například e-shop, který má několik miliónů slov?

Zde vstupuje na pomyslné jeviště Aspena jako překladatelská agentura.
Pro zákazníky, kteří požadují strojový překlad, je to v procesu našeho zpracování jen jeden krok v rámci standardního workflow; nejsme omezeni velikostí souborů, počtem dokumentů ani zdrojovým formátem.

Kromě standardních formátů, jako je MS Word, Excel, PowerPoint a podobně, zajistíme překlady například těchto formátů:

  • soubory xml, resx, po, json, csv, ….
  • webové html a php soubory ….
  • grafické podklady vytvořené v inDesignu, Illustratoru, FrameMakeru, AutoCADu ….
  • textové soubory txt, inf, ini, reg ….
  • a další

Velkou výhodou je propojení strojových překladačů a našich CAT nástrojů (CAT – Computer Assisted Translation). To je softwarové prostředí pro zpracování překladů za pomoci překladových pamětíterminologických slovníků, které jsou individuální pro každého zákazníka.
Pozor ale na často mylnou představu o tom, co vlastně CAT nástroj je – není to strojový překlad, je to jen prostředí, ve kterém pracují profesionální překladatelé.

Spojení CAT nástroje a strojového překladače je u našich stálých zákazníků vždy výhodnější než prostý překlad přes webové rozhraní nebo aplikaci DeepL, Googlu nebo dalších enginů (překladačů).
Překladové paměti a terminologické slovníky zajistí lepší konzistenci a přesnější překlady.

Jsme také schopni tyto překladače trénovat na základě dat zákazníka (většinou použitím již dříve vypracovaných překladů). V současné době DeepL trénování neumožňuje, ale Google a další nástroje ano.

Teď už zbývá jen jediné – napište nám na sales@aspena.com a my Vám rádi poradíme s výběrem nejvhodnějšího způsobu zpracování překladů, a to buď s využitím strojového překladu, nebo standardním způsobem lidským překladatelem.

Je velmi pravděpodobné, že jakákoliv varianta strojového překladu bude zahrnovat spolupráci s lidským překladatelem – ať už Light nebo Full Post-Editing, nebo kombinaci jazykové, odbornépředtiskové korektury. Možností a kombinací je mnoho, záleží vždy na tom, co naši zákazníci očekávají a potřebují.

Autor: Břetislav Svoboda, obchodně technický ředitel

MÁME TISÍCE SPOKOJENÝCH ZÁKAZNÍKŮ,
STAŇTE SE JEDNÍM Z NICH

Reference