Doe mij maar een Picardie string    13-18

Google Translate kan (nog) niet contextueel en cultureel vertalen

Désirée Schyns

Ongeveer een jaar geleden wilden we naar het kwartet Vertigo gaan luisteren dat zou optreden in Saint-Valery-sur-Somme, in Picardië, aan de baai van de Somme. Ik wist helemaal niet dat het een mooie historische stad is met een rijk verleden. Dat ontdekte ik via internet toen ik de naam van het stadje intikte. Het toeval wilde dat Google me meteen naar een Nederlandstalige site loodste en niet naar een Franstalige, maar deze omweg bleek bijzonder vruchtbaar. Niet omdat ik zo meer te weten kwam, integendeel, maar omdat mij al snel duidelijk werd dat ik een vertaling van Google Translate aan het lezen was, waarbij ik herhaalde malen moest stoppen door een mengeling van ongeloof, irritatie en (leed)vermaak. Natuurlijk zou ik deze ‘vertaling’ in de beste Filter-traditie ook op haar eigen merites moeten beoordelen en als een dadaïstisch experiment kunnen smaken, maar de tekst is niet zo bedoeld. Wat dacht u van ‘De jacht op de hut en garnalenvisserij zal altijd blijven, en het kweken van kwelder lam.’ Ik zou haar kunnen ontvreemden, uit de toeristische context kunnen ontvoeren en flarden kunnen integreren in een prozagedicht, maar in wat volgt wil ik toch als een heuse schooljuffrouw fouten destilleren om zo de capaciteiten van menselijke vertalers beter in de verf te zetten en aandacht te vragen voor het cultuurhistorische kennisdomein in het onderwijs aan beginnend lerende vertalers.

Iedereen weet het zo langzamerhand wel: de vertalingen van Google (ter herinnering: het is een computervertaalprogramma dat de vertaling tussen tachtig talen ondersteunt, in totaal 6320 talencombinaties) worden weliswaar steeds beter, maar schieten veelal nog hopeloos tekort en bevatten vaak hilarische zinnen. Succes verzekerd wanneer je de blunders van het programma ten gehore brengt. Tegelijkertijd komen er soms uitstekende oplossingen uit de bus en dwingt de anonieme flitsende vertaler ook bewondering af, vooral omdat het zo razendsnel gaat. Tot zover niets nieuws onder de zon. Je komt Google Translate steeds vaker tegen als je surft en shopt op het net: de snelle vertaalmachine wordt door merken ingezet voor parfumreclame, bij online kledingverkoop en op toeristische sites. Het kosteloze Google Translate werd in Nederland ook al gebruikt om een niet-Nederlandstalige (Russische) verdachte op te roepen die voor de politierechter moest verschijnen (maar niet kwam opdagen omdat de machine een onduidelijke vertaling had geproduceerd).1 Machine Translation (MN) wordt in de vertaalindustrie steeds vaker gebruikt en dan vooral bij technische teksten, omdat het enorm veel tijdwinst oplevert.2

Wat mij in het geval van St. Valery eigenlijk irriteerde was dat degene die verantwoordelijk is voor de site, het in 2003 opgerichte France-Voyage.com, zich niets gelegen laat liggen aan de kwaliteit van zijn vertalingen en argeloze lezers opzadelt met ridicule zinnen die de toerist met een kluitje in het riet sturen. Dat parfummerken Google Translate gebruiken, valt nog enigszins te begrijpen omdat de korte teksten vooral bedoeld zijn als sfeertekening en weinig informatie bevatten, maar in het geval van St. Valery gaat het om cultuurhistorische informatie voor toeristen. Het bedrijf presenteert zich als ‘Een vooraanstaande gids voor toerisme in Frankrijk. Onmisbaar voor mensen die op zoek zijn naar praktische en culturele informatie bij het voorbereiden van hun vakantie. Iedereen vindt iets van zijn gading bij France-Voyage.com, wij zijn er voor eenvoudige dagtrips of langere gezinsvakanties en weekendjes weg met vrienden.’3 Maar wij willen geen cent aan vertaalkosten uitgeven, zou ik daaraan willen toevoegen. Op de Nederlandstalige site staat een duidelijk niet door de machine vertaalde zin: ‘Deze pagina bevat ook automatisch vertaalde informatie die, in vergelijking met de originele tekst, onduidelijk kan zijn. We hopen niettemin dat ook dit u zal helpen bij uw zoektocht naar informatie.’

Bij France-Voyage.com gaan ze er blijkbaar van uit dat zoiets als connotatie niet bestaat, dat inhoud en vorm van een tekst kunnen worden gescheiden. Alsof taal geen cultuur is, alsof lezen geen verband houdt met rondwaren in een weefsel, met stijl, met context en met een bepaalde vorm van voorpret, zeker als je op reis gaat. Het plaatsen van de door Google gemaakte vertaling4 zonder postediting5 laat zien dat er niet is nagedacht over de communicatieve functie van de tekst, noch over een doelpubliek.6 Omdat de tekst niet meer is nagekeken, ontbeert de vertaling structuur, coherentie, syntactische variatie en worden er fouten gemaakt tegen het Nederlandse taaleigen. Terwijl ik dit schrijf schiet het door me heen dat dit type vertaling gedoemd is om anoniem en zonder perspectief eeuwig op internet rond te zwerven. Zal een dergelijke tekst een toekomst hebben? Zal ooit iemand zeggen ‘Nog eens even kijken wat er over St. Valery wordt verteld bij France voyage.com?’ Deze digitaal geboren woorden7 bergen iets paradoxaals in zich, alsof ze er even mogen zijn, voor kort gebruik (snelle informatie), en dan weer kunnen worden weggeworpen. Ze zijn gemaakt om in de prullenbak te verdwijnen, maar door het digitale tijdperk blijven ze zichtbaar op het net. Er is bij mijn weten nog weinig onderzoek verricht naar het functioneren en voortleven van machinevertalingen in een digitale context. De teksten zijn zonder herkomst en eigenaar (‘agency’, wie is de maker, voor welk doelpubliek werd de vertaling vervaardigd en welke recontextualisering is er met de vertaling gepaard gegaan?), alsof ze met een projectiel de ruimte in werden geschoten. De weg van brontekst naar doeltekst is onmogelijk te reconstrueren.8 Je kunt niemand aanspreken op een dergelijke vertaling, in ieder geval niet de maker ervan, alleen degene die op het onzalige idee kwam de ‘vertaling’ te publiceren. Het doorgeven van cultureel erfgoed mislukt op deze manier jammerlijk en de geschiedenis van het stadje St. Valery wordt achteloos vertrappeld. Op de site van France-Voyage.com staan ook vertalingen in het Engels, Duits, Italiaans en Spaans en voor zover ik kan nagaan is ook hier zonder enige revisie te werk gegaan. De Nederlandse tekst (waartoe ik me hier beperk) is een betekenisloze aaneenrijging van woorden en maakt antireclame voor St. Valery. Waarom zou een bedrijf als France-Voyage een stad willen aanprijzen via een dergelijke woordenbrij? Alleen omdat het op deze manier niets kost?

Franse wervende teksten bevatten vaak veel historische informatie. Deze wijze van presenteren is totaal anders dan de Nederlandse. Als je bijvoorbeeld naar de site van Delft gaat, een stad met een zeer rijk verleden, merk je dat informatie over de geschiedenis van de stad verstopt zit in de tekstjes over de diverse musea en bezienswaardigheden en dat de makers van de site toeristen proberen te lokken via shop-mogelijkheden, restaurants, rondvaartboten en natuurlijk Delfts Blauw. Ik vermoed dat Nederlandse vakantiegangers ook niet zitten te wachten op de historische details die in de informatie over St. Valery verwerkt zitten, maar eerder geïnteresseerd zullen zijn in de jachthaven en de adressen van winkels en restaurants. Een menselijke vertaler die vertrouwd is met interculturaliteit had France voyage.com hierop kunnen wijzen. Als je de denkwijze van de makers van de Franse site reconstrueert, kom je dus op overwegingen als: een vertaler is te duur, vertalen is woorden opzoeken in een woordenboek, een vertaling heeft niets te maken met interculturaliteit en lezersverwachting, als je een derde begrijpt van de geboden informatie krijg je toch al een indruk, het geeft niet dat de tekstverzorging en de schrijfwijze een slordig visitekaartje afgeven, ondanks kromme zinnen komen ze toch wel naar St. Valery. De makers zijn zich niet bewust van de tekortkomingen van een automatische vertaling van een cultuurhistorische tekst en weten niet wat vertalen betekent en welk een enorme wereld achter het woord vertaling schuilgaat. Deze kleine case is voor mij een aanleiding om te bekijken wat een vertaler in vergelijking met Google Translate allemaal kan. De benodigde competenties zijn al heel vaak geformuleerd. Zo werden ze beschreven in ‘De Europese norm voor vertaaldienstverlening’ (2006) voor vertaler en revisor: vertaalcompetentie, taalkundige en tekstuele competentie in brontaal en doeltaal, onderzoekscompetentie, culturele competentie, technische competentie.9 Misschien kan het geen kwaad om sommige competenties in het onderwijs Toegepaste Taalkunde,10 maar ook bij vertaalcolleges aan Nederlandse universiteiten, nog meer nadruk te geven in het licht van de razendsnelle ontwikkeling die Machine Translation doormaakt. Ik doel dan op het gedetailleerd beschrijven van vertaalcompetentie in het tijdperk van de MT (dingen die de machine kan, kun je aan de machine overlaten) en op culturele competentie.

Saint-Valery-sur-Somme is een middeleeuws stadje met jachthaven. In de prehistorie was er al een nederzetting en ook de Grieken zouden er sporen hebben nagelaten. Nog in 800 werd het gebied Leuconaus genoemd, zo maak ik uit het Frans op.11 De Romeinen en de Galliërs woonden er een tijdlang vreedzaam samen. De bewoners werden vanaf 611 tot het christendom bekeerd. De abdij met de relikwieën van de heilige Valery kende een tijdlang grote voorspoed dankzij de steun van Franse koningen maar raakte later in verval. De stad kreeg in 1197 stadsrechten. Het wordt hoog tijd voor een paar voorbeelden uit de automatisch vertaalde tekst: ‘Sommige beroemde mensen als Willem de Veroveraar in 1066, zijn gestopt, en Jeanne d’Arc, gevangene van het Engels, stak de stad in 1430.’12 Afgaande op het Frans13 wordt er bedoeld dat Willem de Veroveraar, de Normandische koning van Engeland, aan land ging in St. Valery-sur-Somme (kort voor de Slag bij Hastings) en dat Jeanne d’Arc als gevangene van de Engelsen (en niet van de Engelse taal) in 1430 via de stad op weg ging naar haar gruwelijke lot, de brandstapel in Rouen.

De Grieken zouden zich er vanaf 700 v.Chr. hebben gevestigd en Saint Valery werd toen Leuconaus (‘wit schip’) genoemd, maar archeologisch onderzoek heeft nooit overblijfselen van een Griekse nederzetting blootgelegd. ‘Les grecs (à partir de 700 avant Jésus-Christ) se seraient établis à Saint-Valery alors appelé Leuconaus “vaisseau blanc”. Cette installation grecque n’a jamais été confirmée par l'archéologie.’ In het Nederlands wordt de Griekse taal een inwoner die iets kan roepen: ‘Grieks (vanaf 700 v.C.) werd resident in Saint-Valery Leuconaus riep toen “wit schip”. Deze Griekse systeem is nooit bevestigd door de archeologie.’ De waarschijnlijkheid ontbreekt in de vertaling (‘se seraient établis’), een menselijke vertaler had de meertaligheid onmiddellijk herkend en gezien dat Leuconaus een Griekse benaming is voor Saint-Valery en ‘wit schip’ betekent. De machine ontbeert cultuurhistorische kennis, kan niet interpreteren en de polysemie van het Franse installation niet herkennen. Het woord kan zowel ‘vestiging’ als ‘nederzetting’ betekenen, en in technische zin: ‘inrichting’, ‘constructie’ of ‘systeem’. Hier heeft de machine automatisch voor een technisch begrip gekozen.

Aan het einde van de elfde eeuw neemt Bernard II, heer van Saint Valery, samen met Godfried van Bouillon deel aan de Eerste Kruistocht. Bij zijn terugkeer richt hij een leprozerie in om de met lepra besmette kruisvaarders te verzorgen. De ‘vertaling’ luidt: ‘Bij zijn terugkeer, Bernard creëert een melaatse buiten de muren van de stad om zijn collega-kruistocht met lepra.’14 In de brontekst staat maladrerie, een woord dat behoort tot het middeleeuwse Frans, net als ladre: iemand die aan lepra lijdt. Met voorbijgaan aan dit alles vertaalt Google ‘creëert een melaatse’ (in plaats van ‘richt een leprozerie in’).

Hierna volgt de ‘info’ over het lokale eten, waarvan het water je niet bepaald in de mond loopt: ‘Platvis, zeekraal, de bisteu, de Picardie string en sloeg taart behoren tot de meest populaire gerechten in de vele winkels en restaurants.’15 Bisteu is de naam van een aardappeltaart met spek; met de pikante ‘Picardie string’ wordt ficelle picarde bedoeld: flensjes met ham, champignons en sjalotjes; de mysterieuze ‘sloeg taart’ is een gâteau battu, een lichte cake, brioche, die vooral bij het ontbijt wordt gegeten.

Als je bovenstaande zinnen nader bekijkt, kom je tot een zevental handicaps van Google Translate (met overlapping) die je als een indicatie zou kunnen opvatten voor de competenties die (beginnende) vertalers moeten aanleren. De belangrijkste fouten hebben te maken met het niet kunnen interpreteren, het niet in acht nemen van de context, gebrek aan cultuurhistorische kennis, met stilistiek, woordvolgorde, taaleigen en coherentie:

1 Vertalers worden geacht polysemie te herkennen en in staat te zijn te desambigueren. Google vertaalt ‘gevangene van het Engels’ in plaats van ‘van de Engelsen’ (in het Frans ‘prisonnière des Anglais’). De machine vertaalt ook ‘Griekse systeem’ in plaats van ‘nederzetting’.

2 Vertalers worden geacht archaïsch taalgebruik op een juiste manier te vertalen (zie het voorbeeld van de maladrerie).

3 Vertalers worden geacht te weten dat (in het Nederlands) een mens tot armoede kan vervallen, maar een abdij niet. De vertaling van de zin ‘l’abbaye tombe peu à peu dans l’indigence’ (De abdij raakt langzaam maar zeker in verval) toont aan dat de machine dat niet weet (‘de abdij wordt langzaam in armoede vervallen’). Bovendien wordt de zin ineens passief zonder dat daar een reden voor is. De machine kan gangbare collocaties in ieder geval niet onderscheiden van niet-gangbare.

4 Vertalers worden geacht realia te herkennen en er oplossingen voor te vinden; ze hebben strategieën voor het weergeven van CSE’s (cultuurspecifieke elementen). Zie de voorbeelden van de streekgerechten.  

5 Vertalers worden geacht te interpreteren: De Griekse taal kan niet een ‘wit schip’ roepen.

6 Vertalers worden geacht het gebruik van werkwoorden in de brontekst te kunnen plaatsen en interpreteren en geven blijk van tijdsbesef: ‘L’occupation gauloise est attestée dès le Ve siècle avant J.-C.’ vertaald als ‘De Gallische bezetting wordt getuigd van de vijfde eeuw voor Christus’ (Reeds vanaf de vijfde eeuw voor Christus waren er Galliërs aanwezig). Een vertaler herkent het stijlmiddel, het gebruik van het praesens historicum en gebruikt daarvoor in de plaats (waarschijnlijk) de ovt in het Nederlands. In het hiernavolgende voorbeeld worden de ovt en tt door elkaar gebruikt (plundert, veroverde, verwoestte, draagt), een vertaler brengt eenheid aan.

7 Vertalers worden geacht verbanden te leggen en oog te hebben voor context. Zij moeten over geografische kennis beschikken (zich realiseren dat een zin over een geografische component beschikt): ‘La même année Richard Coeur de Lion pille le Vimeu, s’empare de la ville, brûle les navires, dévaste l’abbaye et emporte les reliques du saint à Saint-Valery... en Caux.’ ‘In datzelfde jaar Richard Leeuwenhart plundert Vimeu, veroverde de stad, brandende schepen, verwoestte de abdij en draagt relieken van de heilige in Saint Valery... en Caux.’ (En neemt de relieken van de heilige Valery mee naar Saint-Valery-en-Caux). Een vertaler had herkend dat hier wordt gespeeld met: Saint-Valery-sur-Somme en Saint-Valery-en-Caux (beide in Picardië), met een Saint Valery aan het water en een Saint Valery in het veld (caux is Picardisch voor ‘champ/veld’).

De essayist en psychiater Theodore Dalrymple stelt het volgende:

Hoe lang je ook surft op internet, het kan geen vervanging zijn voor het langzame aankweken van beoordelingsvermogen en een kritische geest, of voor het ontwikkelen van een volwassen perspectief. Overmatig vertrouwen op gemakkelijk toegankelijke bronnen zou kunnen leiden tot een permanent oppervlakkige kijk op de dingen.16

Nu de roep om het inzetten van CAT (computer assisted translation) in vertaalopleidingen in Nederland en Vlaanderen steeds luider klinkt, om de studenten zo goed mogelijk voor te bereiden op het ‘werkveld’, maak ik van bovenstaande case gebruik om te pleiten voor het bevorderen van vertaalcompetentie (in het eerste en tweede jaar van de bachelor) via teksten met een informatieve en culturele inslag. Dit kan ook de basis vormen voor het leren van literair vertalen. Literair vertalen is immers meer dan ‘literatuur’ in de enge zin van het woord. Het vertalen van journalistiek-informatieve teksten is net zo goed een onderdeel van literair vertalen. Het vroeg inzetten van ‘vertaaltools’ impliceert dat je de studenten vooral technische (lange) teksten wilt leren vertalen, terwijl er in feite meer behoefte is aan vertalers met cultuurhistorische kennis, zoals bovenstaande voorbeelden aantonen. Bovendien creëren vertaaltools (als enige hulpmiddel bij het vertalen) de illusie dat overal met één enkele klik een antwoord tevoorschijn kan worden getoverd. CAT kent geen tekstweefsel, negeert de context en richt zich net als Google Translate op losse woorden (zie de ‘sloeg taart’). Het klakkeloos overnemen van de woordvolgorde in de vreemde taal is nagenoeg nooit de beste strategie. Natuurlijk zijn vertaaltools onontbeerlijk bij het vertalen van technische teksten met veel terminologie, waarin net zo goed retorische elementen zitten en cultuurhistorische begrippen voorkomen, maar voor het vertalen van cultuurhistorische teksten bieden ze weinig soelaas en zeker geen tijdwinst. Juist omdat studenten niet alleen op het ‘werkveld’ moeten worden voorbereid, maar ook op het beantwoorden van vragen die je niet met technische bedrevenheid kunt oplossen, lijkt het me bovendien een heilloze weg om de technologie steeds vroeger in het universitaire onderwijs alomtegenwoordig te maken. Studenten moeten achtergrondkennis krijgen. In het ‘werkveld’ wordt van hoger opgeleiden verwacht dat ze perspectieven aanreiken bij complexe (maatschappelijke) vraagstukken. Dat ze binaire tegenstellingen kunnen overstijgen en complexiteit inzichtelijk maken. Hun blik moet tijdens het onderwijs verruimd en niet beperkt worden. Via het vertalen van journalistieke en/of cultuurhistorische teksten leren studenten om teksten te analyseren en te interpreteren en komen zij in contact met vertaalproblemen waarbij hun eigen onderscheidingsvermogen en hun vermogen om keuzes te maken zo veel mogelijk worden aangescherpt. Ook leren zij zo zelf verantwoordelijkheid te nemen voor hun eigen leeswijze en interpretaties. In het vertaalonderwijs moet er zeker aandacht zijn voor vertaaltools, maar in de eerste plaats voor het leren herkennen van ‘klassieke vertaalproblemen’ en voor het schrijven van een vertaling voor een welbepaald doelpubliek. Daarnaast lijkt het me van belang aankomende vertalers te leren hoe zij automatisch vertaalde ‘content’ moeten post-editen. Dat is nog een hele klus als je het voorbeeld van Saint-Valery in aanmerking neemt. Inderdaad, je kunt de tekst beter zelf vertalen.

 

Noten
1 Zie de bijdrage van Isabelle Bambust ‘Een Russische Google-roulette’ op Webfilter: http://www.tijdschrift-filter.nl/webfilter/vrijdag-vertaaldag/2017/week-11-isabelle-bambust.aspx [Geraadpleegd op 31 mei 2017.]
2 Joke Daems, Sonia Vandepitte, Robert Hartsuiker & Lieve Macken, ‘The impact of Machine Translation Error Types on Post-Editing Effort Indicators’, in: Proceedings of the 4th Workshop on Post-Editing Technology and Practice (WPTP4), Miami, November 3, 2015, p. 31–45, https://biblio.ugent.be/publication/6990271/file/6990287 [Geraadpleegd op 25 mei 2017.]
3 Mijn vertaling. In het Frans: ‘Un guide de référence du Tourisme en France. Il met à disposition des vacanciers toutes les informations pratiques et culturelles pour bien préparer leur séjour. De la simple escapade aux vacances en famille en passant par le week-end entre amis, tout le monde trouve son compte sur France-Voyage.com.’
4 Dat de vertaling door Google Translate tot stand kwam blijkt uit de proef op de som: ik heb Franse zinnen laten vertalen via Google en de zinnen waren identiek aan de gepubliceerde tekst op de site van St. Valery.
5 Voor de relatie tussen Machine Translation (MT) en Post-Editing zie het artikel van Daems, Vandepitte, Hartsuiker & Macken (noot 2).
6 Voor een uitgebreide analyse van de communicatieve functie van een tekst en het vertalen van een Nederlandstalige toeristische tekst, zie Jacqueline Hulst ‘Recente ontwikkelingen binnen de vertaalwetenschap: De doeltekst centraal’, in: Colloquium Neerlandicum 11 (1991), http://www.dbnl.org/tekst/_han001199101_01/_han001199101_01_0011.php [Geraadpleegd op 25 mei 2017.]
7 Ik ontleen dit aan Liedeke Plate & H.G. Els Rose ‘Rewriting, a Literary Concept for the Study of Cultural Memory: Towards a Transhistorical Approach to Cultural Rembrance’, Neophilologus 97 (2013): p. 611–625.
8 Zie Van Egdom, Bloemen & Segers elders in dit nummer.
9 Marcel Thelen, ‘De Europese norm voor vertaaldiensten en het vertaalonderwijs’, in: Chris Van de Poel & Winibert Segers (eds.), Tolk- en vertaalcompetentie. Onderwijs-en toetsvormen. Leuven/Den Haag: Acco, 2010, p. 75–89.
10 In Vlaanderen zijn de voormalige ‘tolkenscholen’ sinds 2013 onderdeel van de universiteit. Toegepaste taalkunde in Gent bijvoorbeeld (onderdeel van de Faculteit Letteren en Wijsbegeerte) biedt voor Engels en Frans vanaf BA1 tot en met BA3 vertaalonderwijs aan. Voor de andere talen is dat vanaf BA2. Vervolgens kunnen studenten een master Vertalen kiezen. Er bestaat ook een master Tolken en Meertalige Communicatie.
11 Met dank aan Harm-Jan van Dam die me door zijn immer aandachtige lezen wees op een fout in de Franse tekst. Het gebied werd nog in 700 Leuconnay genoemd, of een variant op deze schrijfwijze.
12 ‘Des personnages illustres, comme Guillaume le Conquérant en 1066, y ont fait escale, et Jeanne d'Arc, prisonnière des Anglais, a traversé la ville en 1430.’
13 Vgl. http://www.france-voyage.com/tourisme/saint-valery-somme-990.htm
14 ‘A son retour, Bernard crée une maladrerie en dehors des murs de la ville pour ses compagnons de croisade atteints de la lèpre.’
15 ‘Le poisson plat, la salicorne, le bisteu, la ficelle picarde et le gâteau battu font partie des mets les plus appréciés dans ses nombreux commerces et restaurants.’
16 Theodore Dalrymple, ‘ICT: goed gereedschap, slechte baas. Niets meer onthouden’ (vertaald uit het Engels door Felix Huygen), De Groene Amsterdammer, 18 mei 2017, p. 24–27.

 

Lees meer over: