Lange tijd was de universele vertaler een obsessie voor popcultuur. Star Trek presenteert het als een draagbare machine, die lijkt op een microfoon, die de meeste talen onmiddellijk kan vertalen . De Hitchhiker's Guide to the Galaxy bevat een Babel-vis, een wezen dat, wanneer het in je oor zit, onmiddellijke vertaling biedt van elke taal in de Melkweg.
Het zou dus geen verrassing moeten zijn dat de hedendaagse mens een apparaat probeert te maken dat net zo goed werkt. Er zijn tientallen vertaal-smartphone-apps, maar de meeste vertalen woorden op een eenvoudige, één-op-één basis; een gebruiker typt of spreekt een woord en de app kaatst terug met een vertaling. Het doel en de echte monetaire meevaller is nu dat ingenieurs en ondernemers het mogelijk maken dat twee mensen in verschillende talen kunnen converseren, terwijl een klein apparaat vertalingen in realtime uitspreekt.
Bestaande vertaal-apps
Op een reis naar Griekenland werd de Engelstalige Andrew Lauder ziek.
"Ik ging naar de apotheek en zij verstonden geen Engels, dus ik kreeg geen medicijnen", zegt Lauder, CEO van Vocre Translate. De medicijnlabels waren letterlijk letterlijk Grieks voor hem. Taalbarrières zijn gebruikelijk voor wereldreizigers. In een vreemd land worden kleine transacties zoals het kopen van medicijnen of het verkrijgen van een routebeschrijving - een andere moeilijkheid waar Lauder voor stond - gigantische taken.
Toen hij terugkwam, creëerde Lauder Vocre Translate, een app voor het vertalen van stemmen en tekst. Het begon als een tekst-naar-tekst-app (MyLangauge genaamd), en werd vervolgens in eerste instantie omgezet in een spraak-naar-tekst-model dat, net als andere apps waaronder SayHi Translate, een traditioneel model gebruikte waarin een woord direct naar een ander woord vertaalt. Zeg 'Hallo' en de smartphone of tablet piept een geautomatiseerde 'Hola' terug. 'Tot ziens' wordt 'Sayonara'. Enzovoort, net als een tekstvertaler.
Om de eenvoudige audio-vertaling te maken, hadden de makers van deze apps gegevens nodig. Vocre haalde zijn informatie uit opnames en documenten uit het publieke domein, zoals oude films of openbare hoorzittingen. "We smeekten in feite een voicemailtranscriptieservice om ons hun cloud te laten gebruiken voor spraakherkenning", zegt SayHi CEO Lee Bossier.
Zodra de technici audio- en tekstgegevens hadden, koppelden ze de audio en tekst woord voor woord. Spraakherkenningssoftware herkent "kaas" en zet deze om in tekst. Dat wordt omgezet in het Frans en de app vindt de Franse uitspraak voor 'fromage'.
Dat gezegd hebbende, als een gebruiker brutaal iets 'cheesy' noemt, werkt de vertaler niet zo goed, omdat gesproken taal lang niet zo statisch is als geschreven taal. Cadans, jargon, verbuiging, uitspraak, dialect en gespreksstroom kunnen van betekenis veranderen
Na verloop van tijd wilde Lauder echter een meer conversatie-apparaat. In een e-mail zegt hij: “Op basis van onze gebruiksgegevens hebben we vastgesteld dat mensen heel anders praten dan ze schrijven. Gesproken woorden zijn veel spontaner en veel minder formeel en letterlijk. ”Dus gebruikte hij statistische machinevertaling, een benadering die ook door Google wordt gebruikt en die gegevens gebruikt om algemeen woordgebruik te vinden, waarbij het traditionele woord-naar-woord vertaalmodel werd verlaten. Kortom, Vocre leert wanneer het wordt gebruikt. “Het leert op basis van elk gesprek, elke zin die er doorheen gaat. Het wordt iets slimmer na verloop van tijd, "zegt Lauder.
Toch hebben beide apps momenteel een paar seconden nodig om te vertalen, maar zijn ongetwijfeld effectief, vooral in overleg met lichaamstaal, voor transactionele gesprekken zoals het bestellen van een maaltijd. Mensen bestellen immers al jaren voedsel in niet-moedertaal en slagen er altijd in om nog steeds te eten. Maar ze hebben geen diepgaande, complexe gesprekken kunnen voeren.
Met Vocre en SayHi kunnen gesprekken stijf door elkaar lopen, maar het is niet hetzelfde als chatten in je moedertaal. Google is van plan dit volledig te veranderen.
Google's aanpak (statistische machinevertaling)
Bij het leren van een nieuwe taal op school beginnen we met individuele woordenschattermen. Maar taal is vloeiender - woorden hebben context nodig.
"De aanpak van [Google] is een meer algemene aanpak", zegt Josh Estelle, een software-engineer voor Google Translate. "In plaats van al deze regels hard te coderen, proberen we de regels te leren door naar gegevens te kijken."
Het technologiebedrijf vermijdt de één-op-één, woord-voor-woord methode en gebruikt in plaats daarvan statistische machinevertaling, niet kijkend naar wat woorden betekenen maar hoe taal wordt gemodelleerd, die het leert door gegevens . Het richt zich dus op het bos, niet op de bomen. Een Engels voorbeeld: we kennen de definities van het woord "break" en "up". Maar de uitdrukking "break-up" is niet de letterlijke combinatie van de twee woorden.
Statistische machinevertaling vereist gegevens. Bergen ervan. Voor de methode werkt het niet alleen het feit dat "fromage" Frans is voor kaas, maar 100 voorbeelden van zowel "fromage" als kaas die in echte zinnen worden gebruikt.
Estelle zegt dat als een Engelse spreker twee menu's heeft, identiek behalve het feit dat men in het Engels en één in het Chinees heeft gedrukt, "je waarschijnlijk wel kunt achterhalen wat het Chinese karakter is voor" soep "." Context is koning. Maar om die context te creëren, hebt u toegang nodig tot miljoenen menu's en elk ander denkbaar document.
Dat is precies wat Google heeft. Zonder de webgigant om enorm veel gegevens te verzamelen, zou een echte Babel-vis niet kunnen bestaan. Het kruipt op internet en verzamelt alles - tekst en audio. Vervolgens worden deze gegevens ingevoerd in algoritmen die alles met al het andere vergelijken. Deze vergelijkingen helpen bij het achterhalen van de manier waarop taal van nature werkt.
"Een ding dat mensen verrast als we het over Vertalen hebben, is dat ons team geen taalkundigen heeft", zegt Estelle. “We hebben 71 talen gelanceerd en ik zou zeggen dat ons team niet weet hoe ze de overgrote meerderheid van de talen moeten spreken. Een menselijke vertaler zal niet in staat zijn om al deze voorwaarden en dingen zo snel te leren als onze [gegevens] kunnen leren van het web. "
Wat is het punt?
Net als Google ziet Facebook voordelen. Overweeg het eigen uitstapje van de sociale media naar vertaling.
"De missie van Facebook is het verbinden van de hele wereld, en een van de belemmeringen voor het verbinden van de wereld is dat niet iedereen dezelfde taal spreekt", zegt Tom Stocky, een technisch directeur bij Facebook. "Wat de vertaling betreft, denk ik dat de echt ambitieuze visie voor de toekomst is of je Facebook in je eigen taal kunt gebruiken en met elke andere taal kunt communiceren."
Afgelopen augustus heeft Facebook Jibbigo overgenomen, een app voor het vertalen van spraak naar spraak die beschikbaar is voor Android- en iOS-apparaten.
Scherpe Facebook-gebruikers zullen opmerken dat de sociale site al wat vertaling gebruikt. Als je ooit een Spaans bericht op je Engelstalige pagina hebt gehad, heb je meteen de kans gekregen om het in je moedertaal te vertalen.
Maar Stocky ziet de stemcomponent als een potentiële spelwisselaar. De opkomst van smartphones en tablets verwelkomt een eeuwig onderling verbonden wereld en de opkomst van spraakherkenningssoftware nodigt uit tot nieuwe middelen voor webinteractie. Stocky ziet een toekomst waarin gebruikers gewoon een commando kunnen uitspreken voor hun smartphones en kunnen communiceren met andere gebruikers, afgezien van taalverschillen.
"Er is geen twijfel mogelijk dat dit uiteindelijk zal gebeuren, want de enige beperkingen zijn de kracht van de taalengine en natuurlijk verwerkingstijd en verwerkingskracht", zegt hij.
Laura Murphy, professor aan de afdeling mondiale gezondheidssystemen en ontwikkeling aan de universiteit van Tulane en een erkend technologisch scepticus, twijfelt aan de waarde van een universele vertaler en hoeft niet meer dan één taal te kennen.
Ze denkt dat het apparaat enigszins nuttig kan zijn bij reizen, zakelijke en internationale relaties, maar niet baanbrekend. Op een bepaald niveau hebben we al vertalers (mensen) en de meesten die in buitenlandse betrekkingen werken, kennen de juiste talen. Een apparaat, denkt Murphy, kan negatieve gevolgen hebben.
"Ik denk dat het mensen lui kan maken, " zegt Murphy. Het vertalen van talen kan een mentale uitdaging zijn door het brein - vooral een die meer dan twee talen kent - op een andere manier te laten werken, maar de oefening is desalniettemin lonend. De hersenen komen uit een plaats van taalkundige empathie die zelfs de beste stemvertaler nooit zou kunnen bereiken.
Hoewel deze universele communicatie positief kan zijn, erkent Murphy: "het kan ertoe leiden dat mensen denken dat ze communiceren als ze dat niet zijn." Cultuur is niet altijd volledig belichaamd in taal (neem bijvoorbeeld sarcasme) en communicatie is niet altijd over de informatie die wordt doorgegeven.
Wanneer kunnen we deze technologie verwachten?
"In 2005 kostte het ons 40 uur om 1000 zinnen te vertalen", zegt Estelle van Google. "Vandaag vertalen we het equivalent van 1000 zinnen om de 10 milliseconden."
Zoals Richard Anderson in de tv-serie The Six Million Dollar Man uit de jaren 70 beroemd zegt: "We hebben de technologie." Nu is het wachten op het verzamelen en analyseren van gegevens. Hoe lang dat gaat duren, is onbekend volgens Estelle. Maar voorzichtige schattingen brengen zo'n apparaat binnen tien jaar in onze handen.
Hoewel app-makers zoals Bossier of gigantische bedrijven zoals Google en Facebook niet hun eigen versies van de Bijbelse toren van Babel willen bouwen, wil het wel een einde maken aan brabbelen. Het stelt een wereld voor waarin we allemaal communiceren, over medicijnen, over politiek, over ideeën.
En die wereld is misschien niet ver weg.
Noot van de redactie: we hebben dit verhaal op 4 april 2014 bijgewerkt om de Vocre Translate-technologie nauwkeurig te beschrijven.