Vertaaldag  Archief

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

Vertalen met googletranslate

Robbert-Jan  Henkes

Wat een goede vertaling is, daar valt over te twisten. Maar wat de beste vertaling is, valt eigenlijk heel makkelijk vast te stellen.

De beste vertaling is de vertaling die – terugvertaald – het origineel exact kopieert. Of althans het dichtst benadert.

Anders gezegd: het origineel is de ideale vertaling van de vertaling.

Goed kunnen vertalingen op allerlei manieren zijn. Mooi van taal, vlot leesbaar, getrouw van betekenisoverdracht, bijna net echt Nederlands of vrijwel foutloos. Het kan een vertaling zijn die je aanstaat of eentje waar je niks in ziet. Je kan vertaalstrategie zus hebben en vertaalstrategie zo. Je kunt bijvoorbeeld sprekende, betekenisdragende namen vertalen (‘Basjmatsjkin’ uit Gogols Overjas of Mantel als Vanderschoen of Schoemans) of de namen zo laten. Het is een keuze die de vertaler maakt, en die keuze kan de lezer bevallen of niet. Er wordt over getwist, geredekaveld, gedelibereerd en gedebilereerd. En dan vallen de kwalificaties ‘goed’ en ‘slecht’ al snel.

Goed kunnen vertalingen op allerlei manieren zijn. En daarmee ook slecht. Want als een keuze goed kan zijn, kan hij ook slecht gevonden worden. Het is maar hoe je er zelf over denkt. Maar er kan er maar één de beste keuze zijn. En dat is als de terugvertaling van de vertaling identiek is aan het origineel. Dan is er sprake van de ideale vertaling. Geheel transparant, want de vertaler heeft er niets van zichzelf ingelegd. Gelukkig gebeurt het nooit. En wat zouden we eraan hebben? We krijgen een tweede origineel dat identiek is aan het eerste, en de vertaling is toch anders – want het is een andere taal.

Alle vertalers doen het weer anders. Op hun manier, goed en slecht en alles daartussenin. De ideale, beste, transparante vertaling, één op één inwisselbaar met het origineel, bestaat niet. Zo terugvertalen dat de terugvertaling, terugvertaald, weer exact dezelfde vertaling wordt – kan zelfs googletranslate niet.

Zelfs googletranslate vertaalt niet altijd exact hetzelfde terug van wat hij net vertaald heeft. Zelfs googletranslate ontkomt niet aan doorfluisterspelletjes (kapotte telefoon, Chinese whispers). En dat is vreemd. Want van een robot mag je toch een beetje consequentie verwachten.

Casus 1
Neem deze paar regels, uit de droom van de negende avond van Frits van Egters:

‘Ik weet het,’ dacht hij, ‘het is de dode.’ Hij wilde het pak op de grond leggen, maar kon zijn rug niet buigen. ‘Nu komen alle verschrikkingen tegelijk,’ dacht hij, ‘het is een gruwelijke straf.’ Het pak werd slap en begon aan de einden naar beneden te buigen.

Ze werden zo vertaald door Sam Garrett:

 “I know what it is,” he thought, “it is the dead man.” He tried to put down the package, but could not bend his back. “Now all the horrors are coming at once,” he thought, “it is a dreadful punishment.” The package grew limp and began sagging at both ends.

Terwijl googletranslate het zo doet (verschillen in vet aangegeven):

“I know,” he thought, “it’s the dead man.” He wanted to put the suit on the floor, but couldn’t bend his back. “Now all the horrors are coming at once,” he thought, “it’s a horrifying punishment.” The suit went limp and started bending down at the ends.

Dat heet blind vertalen. Dat is waar vertaalmachines goed in zijn, in machinevertalen.1 Van ‘pak’ steevast ‘suit’ maken, van ‘wilde’ ‘wanted’ en van ‘slap worden’ ‘go limp’. Als je de Russische naam Petroesjka door google haalt, gaat hij ook altijd Peterselie heten. Waarschijnlijk omdat die betekenis het vaakst voorkomt. Maar ‘vaak’ is een vaag begrip voor een algoritme. Bij googletranslate is het altijd of nooit. Uitzonderingen, context kent hij niet. De woordenschat is beperkt. Het een is altijd het een en nooit het ander.

Als we de Engelse googlevertaling laten terugvertalen door googletranslate, krijgen we dit (verschillen met de Revetekst in vet).

‘Ik weet het’, dacht hij, ‘het is de dode man.’ Hij wilde het pak op de grond leggen, maar kon zijn rug niet buigen. ‘Nu komen alle verschrikkingen tegelijk’, dacht hij, ‘het is een gruwelijke straf.’ Het pak werd slap en begon aan de uiteinden te bukken.

Het is fijn dat ‘the suit’ hier weer ‘het pak’ is geworden en niet ‘het kostuum’ of zo. Terwijl dat laatste wel de intentie van google was (de intentionaliteit van de automatische vertaler...). De ‘dode man’ is gewoon een gok van google: het had net zo goed een vrouw kunnen zijn. Het ‘bukken’ aan de uiteinden is niet echt begrijpend vertalen. Ook vreemd is trouwens de afwisseling van enkele en dubbele aanhalingstekens die google erin brengt. Welk algoritme zou dat op zijn geweten hebben?

Maar nu komt het. Als je hiervan weer Engels laat maken, krijg je dit (verschillen met de eerste googlevertaling in vet):

“I know,” he thought, “it’s the dead man.” He wanted to put the suit on the floor, but couldn’t bend his back. “Now all the horrors come together,” he thought, “it’s a horrifying punishment.” The suit went limp and began to bend at the ends.

Je zou verwachten dat de tweede googlevertaling identiek zou zijn aan de eerste: niets heeft het systeem immers verlaten. Maar nee, we krijgen twee duidelijke verslechteringen, ‘come together’ in plaats van ‘come at once’ en ‘began to bend’ in plaats van ‘started bending’. Het lijkt wel of er meer Nederlands in doorklinkt. De woordenschat convergeert en verschraalt: ‘tegelijk’ en ‘samen’ wordt altijd als ‘together’ vertaald, en ‘together’ altijd alleen maar als ‘samen’. Waarmee het woord ‘tegelijk’ uit het googlevertaalwoordenboek verdwijnt.

Zou de volgende vertaalslag weer anders zijn? Ja (verschillen met de eerste Nederlandse googlevertaling in vet):

‘Ik weet het’, dacht hij, ‘het is de dode man.’ Hij wilde het pak op de grond leggen, maar kon zijn rug niet buigen. ‘Nu komen alle gruwelen samen’, dacht hij, ‘het is een gruwelijke straf.’ Het pak werd slap en begon aan de uiteinden te buigen.

Het woord ‘verschrikkingen’ heeft plaatsgemaakt voor ‘gruwelen’, ‘tegelijk’ voor ‘samen’, en het verkeerde ‘bukken’ is per ongeluk het juiste ‘buigen’ geworden. Twee keer ‘gruwel’, twee keer ‘buigen’: streeft googletranslate naar een totale entropie van woordenschat?

Een volgende doorfluisterronde levert geen veranderingen meer op. Dit is met andere woorden het definitieve geredigeerde en persklaar gemaakte googletranslate-origineel van de betreffende regels van De Avonden. Daar kan Reve nog een puntje aan zuigen!

Casus 2
Bovenstaande vertaling was vrij basic, Nederlands -> Engels en Engels -> Nederlands. Maar het probleem van googletranslate is dat alle vertalingen via het Engels gaan. Dat merk je pas goed als het Engels woorden heeft die voor meerdere uitleg vatbaar zijn. Homoniemen met name. Het ‘pak’ van hierboven (‘suit’ of ‘package’) maar dan in het Engels. Bijvoorbeeld ‘to lie’ voor liegen en liggen, ‘play’ voor spel en toneelstuk, ‘piece’ voor gedeelte en toneelstuk, ‘pupils’ voor pupillen en leerlingen, ‘cancer’ voor kreeft en kanker, en zo zijn er nog heel wat meer. Mijn voorbeeld hier is het woord ‘glasses’, wat zowel ‘bril’ als ‘glazen’ kan betekenen. Wat bedoeld wordt, volgt meestal feilloos uit de context. Behalve voor googletranslate, want die heeft alleen maar de woorden en de woordcombinaties die erin gestopt zijn.

Nemen we een eenvoudig zinnetje als:

De ober zette het dienblad op tafel. Ik pakte de glazen.

Valt nauwelijks mis te verstaan. Wat zegt google?

The waiter put the tray on the table. I picked up the glasses.

Klopt als een autobus. En als we dat zinnetje terugvertalen?

De ober zette het dienblad op tafel. Ik pakte de bril op.

Dat klopt plotseling niet meer. Dezelfde verwarring hebben we hierboven gezien met ‘pak’ en ‘suit’. Maar om te bewijzen dat álles via het Engels gaat, zullen we het Nederlandse zinnetje, toch echt het moeilijkste niet, ‘rechtstreeks’ laten vertalen in het Frans, Duits, Russisch, Bulgaars, Italiaans, Spaans, Afrikaans en Zweeds. En dan krijgen we, voor ‘De ober zette het dienblad op tafel. Ik pakte de glazen.’ het volgende te zien:

[F] Le serveur posa le plateau sur la table. J’ai pris les verres. (glazen)
[D] Der Kellner stellte das Tablett auf den Tisch. Ich nahm die Brille. (bril)
[R] Официант поставил поднос на стол. Я поднял очки. (bril)
[B] Сервитьорът постави таблата на масата. Взех чашите. (glazen)
[I] Il cameriere mise il vassoio sul tavolo. Ho preso gli occhiali. (bril)
[S] El camarero puso la bandeja sobre la mesa. Recogí los vasos. (glazen)
[A] Die kelner het die skinkbord op die tafel neergesit. Ek tel die bril op. (bril)
[Z] Servitören lade facket på bordet. Jag tog upp glasögonen. (bril)

Vijf brillen en drie glazen. Wil dat zeggen dat het Frans, Bulgaars en Spaans niet via het Engels gaan? Nee. Er is alleen voor de andere optie gekozen. Die toevallig hier de juiste is. Want als we van de glazen een bril maken: ‘Ik pakte de bril’ dus, blijven we de ‘glazen’ houden. Dus: ‘De ober zette het dienblad op tafel. Ik pakte de bril.’ wordt:

[F] Le serveur posa le plateau sur la table. J’ai pris les verres. (glazen)
[B] Сервитьорът постави таблата на масата. Взех чашите. (glazen)
[S] El camarero puso la bandeja sobre la mesa. Recogí los vasos. (glazen)

Met andere woorden, het blijft via het Engels gaan. Het algoritme is: [glazen/bril] -> [glasses] -> [glazen]; of [glazen/bril] -> [glasses] -> [bril]. Verder niets. En de oplossing wordt consequent volgehouden.

Welke oplossing wordt gekozen hangt ervan af welke woordcombinaties zijn ingevoerd door de gebruikers in verschillende talen. De combinatie ‘de glazen’ wordt automatisch of als ‘bril’ of als ‘glazen’ vertaald. Maar als je ‘mijn glazen’ zegt (stel je bestelt een kopstoot of een glas water bij de wijn) krijg je andere vertalingen. Het Engels verandert dan ook ‘picked up’ in ‘took’, omdat die woordcombinatie in die betekenis kennelijk het meest door gebruikers als vertaling wordt aangedragen. En/of het meeste voorkwam in het corpus websites dat de machine betrekt. En daarmee veranderen automatisch alle vertalingen in ‘bril’. Dus: ‘De ober zette het dienblad op tafel. Ik pakte mijn glazen.’ wordt:

[E] The waiter put the tray on the table. I took my glasses.
[F] Le serveur posa le plateau sur la table. J'ai pris mes lunettes.
[D] Der Kellner stellte das Tablett auf den Tisch. Ich nahm meine Brille.
[R] Официант поставил поднос на стол. Я взял свои очки.
[B] Сервитьорът постави таблата на масата. Взех си очилата.
[I] Il cameriere mise il vassoio sul tavolo. Ho preso i miei occhiali.
[S] El camarero puso la bandeja sobre la mesa. Tomé mis lentes.
[A] Die kelner het die skinkbord op die tafel neergesit. Ek neem my bril.
[Z] Servitören lade facket på bordet. Jag tog mina glasögon.

Dat wil zeggen: de combinatie ‘mijn glazen’ wordt in alle talen, via ‘my glasses’, consequent begrepen als ‘mijn bril’.

Googletranslate uitlachen heeft weinig zin. Je gaat ook robothonden niet uitlachen die de trap niet opkomen.

Engels blijft de toetssteen in googlevertalië. Dat is misschien niet erg en zelfs onvermijdelijk, maar het is goed je er rekenschap van te geven, want je hebt plotseling de mogelijkheid tot heel grappige misverstanden, die het leven er alleen maar vrolijker op maken.

 

Noot
1 Zie over het machinevertalen de stukken in Webfilter over googletolkvertalen ‘Een Russische Google-roulette’ van Isabelle Bambust uit 2017 en ‘Hoop anyway, man!’ en ‘Lebe das jahrige Vondelpark!’ van Jan Gielkens uit 2014 resp. 2017; daarnaast de artikelen in Filter 24:2 (2017) van Désirée Schyns (‘Doe mij maar een Picardie string’) en van Gys-Walt van Egdom e.a. (‘Machinevertaling ...’) en van Philippe Noble (‘Flirten met Deep-L’) in Teksten in beweging, bundel voor Ton Naaijkens (Vantilt 2019).
De uitvinding van het machinevertalen, middels de substantie ‘babeliet’, moeten we sinds kort toeschrijven aan Alfred Jarry, die haar helaas geheim hield, zie Marij Elias hierover in ‘Babelite’, een herpublicatie op Webfilter van haar artikel uit Filter 1:1.
De vertaling van De Avonden door Sam Garrett komt ter sprake in twee Webfilter-stukken van Bert de Waart: ‘Decemberpudding en oliebollen’ uit 2016 en ‘Hoho, dat gaat zomaar niet’ uit 2018.

 

Reageren? info@tijdschrift-filter.nl.