Karen Jacobsen, een Australische zangeres en stemactrice, kreeg het optreden in 2000, kort na aankomst in New York. De producenten - bedrijfstypes - stuurden haar drie weken lang naar een opnamestudio, waar ze vier uur per dag doorbracht met dingen als "bij de volgende kruising linksaf" en "herberekenen." Uiteindelijk was het niet haar stem dat was gespannen. "Ik zei 'ongeveer' ongeveer 186 keer, " herinnert Jacobsen zich. "Dat soort dingen kunnen ervoor zorgen dat je krankzinnig wordt."
gerelateerde inhoud
- Van Ptolemy tot GPS, de korte geschiedenis van kaarten
Twee jaar later kreeg ze een telefoontje van een vriendin. "Karen, " flapte haar vriend. “Ik kocht mijn man een van die nieuwe GPS-dingen, en we zetten het op de Australische stem. Jij bent het! 'Zo ontdekte Jacobsen dat haar stem aanwijzingen gaf aan 400 miljoen mensen over de hele wereld.
Haar werk belicht de hybride van bloed en technologie die in de nu alomtegenwoordige stemmen terechtkomt die ons vertellen waar we moeten zijn: meer dan een miljard mensen vertrouwen elke maand op Google Maps en 80 procent activeert de stemoptie.
In de begindagen van de spraaksynthese - denk aan de robotgeluiden van Speak & Spell uit de late jaren zeventig - converteerde een algoritme tekst naar een monotone stream. Toen databases toenamen, kon je een stemacteur als Jacobsen opnemen, die een corpus van lettergrepen en woorden uitsprak, welke algoritmen zouden combineren en wijzigen volgens basisregels. Meer recent hebben softwarecoders bij bedrijven zoals Nuance, die navigatie-interfaces voor auto's ontwerpt, een derde aanpak ontwikkeld: diep leren toepassen op spraaksynthese. Het combineert opgenomen woorden en gesynthetiseerde fragmenten, vertrouwend op kunstmatige intelligentie om de uitspraak nog menselijker te maken. "Ze klinken griezelig natuurlijk", zegt Vlad Sejnoha, Chief Technology Officer van Nuance.
Natuurlijk blijven taal eigenaardigheden een uitdaging voor spraaksystemen. “Denk aan 'bough' versus 'gekocht' of 'lees' versus 'lees', zegt een woordvoerder van Google. “Maar hopelijk kan de gebruiker altijd raden wat we bedoelden.” Nu AI auto-navigatiesystemen leert om intelligenter te spreken, zal het vervolgens de online wereld doorzoeken en uitzoeken waar u naartoe wilt, zelfs voordat u dat doet.

Abonneer je nu op het Smithsonian magazine voor slechts $ 12
Dit artikel is een selectie uit het juli / augustus nummer van Smithsonian magazine
Kopen