Spraakherkenningssoftware, de meesten van ons waarschijnlijk wel eens, is een behoorlijk cool ding. Maar het praten met machines - of het nu een smartphone, tv-scherm of dashboard is - nou ja, niet zo veel. Advies vragen over een apparaat? Reeks geek. Elk woord uitspreken zodat u begrepen kunt worden? Hoe cool kun je echt zijn?
Maar Apple, trouw aan zijn vorm, heeft deze kop op zich genomen door drie iconen van cool to star in te huren in hun nieuwste advertentiecampagne voor Siri, de stem van de iPhone 4S. Er zijn Zooey Deschanel (Adorable Cool) en John Malkovich (Cerebral Cool) en Samuel L. Jackson (Ultimate Cool), en allemaal maken van woordspelletjes met een telefoon de sport van goden.
Critici wijzen er echter op dat Siri in het echte leven niet zo responsief of alwetend is als ze in commercials wordt geportretteerd. Ik weet zeker dat ook u geschokt bent om dit te horen. Anderen zien het hele ding als rijp voor parodie - zie hoe Zooey's broer Jooey een grappige of die versie van de regenachtige dag van Zooey en Siri samen doet.
Ongeacht. Siri is een zanger geworden in het robotkoor, de "You Got Mail" -stem van een nieuwe generatie.
Het is in sommige kringen modieus om te suggereren dat Siri Steve Jobs niet waardig is, dat als hij nog in leven was, Jobs het van de markt zou hebben gehaald of, op zijn minst, nooit zo'n spraakmakende advertentie zou hebben goedgekeurd campagne voor zo'n gebrekkig product.
Maar zoals Jobs opvolger, Tim Cook, eerder deze week zei, iPhone 4S-eigenaren zoals Siri. Volgens een enquête uit maart zegt bijna 90 procent dat ze het minstens één keer per maand gebruiken. En houd in gedachten dat Siri, een van de weinige Apple-producten waarvan werd gezegd dat ze in bèta was toen het werd uitgebracht, haar eerste verjaardag pas in oktober zal vieren. Ze leert nog steeds taal en, nog belangrijker, begint net het potentieel van kunstmatige intelligentie aan te boren.
Siri zal waarschijnlijk een middelpunt van de Apple TV zijn, die naar verwachting in december zijn debuut zal maken. Maar de kans is groot dat de plaats waar praten met machines mainstream zal zijn in onze auto's.
Rijd, zei ze
Natuurlijk gebeurt dat al, maar je moet nog steeds overschakelen naar robot-spreken als je begrepen wilt worden. En zelfs dan is er geen garantie. Dat zal deze zomer beginnen te veranderen wanneer sommige nieuwe modellen worden uitgerust met iets dat Dragon Drive wordt genoemd!
Het is de uitvinding van Nuance Communications, een in Massachusetts gevestigd bedrijf dat een krachtpatser is geworden op het gebied van spraakherkenning. (Het wordt algemeen beschouwd als het brein achter Siri.) Nuance en spraakherkenning in auto's hebben vorige week een grote sprong voorwaarts gemaakt toen het bedrijf aankondigde dat Dragon Drive! zal in de cloud kunnen tikken.
Wat dit betekent is dat het systeem zijn rekenkracht en geheugencapaciteit aanzienlijk zal vergroten. En dat betekent dat de stem in uw dashboard meer Siri-achtig wordt en u in staat stelt ermee te praten. Nooit meer monosyllabisch geschreeuw. De dag komt dat je terloops kunt vermelden dat je zin hebt in een paar Allman Brothers en seconden later komt "Whipping Post" door de speakers.
De sleutel is hoe goed we in staat zijn om machines context en pragmatiek te leren - hoe taal wordt gebruikt in sociale situaties. En dat is een lastige zaak. Om te beginnen moet zelfs het meest geavanceerde apparaat voor spraakherkenning wachten tot een mens klaar is met spreken, zodat het de hele zin kan analyseren en interpreteren. Dan is er de 'theorie van de geest', het vermogen om te begrijpen dat andere mensen andere overtuigingen en bedoelingen kunnen hebben dan de onze. Voor zover we weten, kunnen alleen mensen dit doen.
Een recent onderzoek door twee Stanford-psychologen kan je een idee geven van wat er bij het helpen van machines aan de hand is. Onderzoekers Michael Frank en Noah Goodman hebben een online-experiment opgezet waarbij deelnemers werd gevraagd naar een reeks objecten te kijken en vervolgens te selecteren welke naar een bepaald woord werd verwezen. Een groep deelnemers zag bijvoorbeeld een blauw vierkant, een blauwe cirkel en een rood vierkant. De vraag voor die groep was: stel je voor dat je met iemand praat en naar het middelste object wilt verwijzen. Welk woord zou je gebruiken, "blauw" of "cirkel"?
De andere groep werd gevraagd: Stel je voor dat iemand tegen je praat en het woord 'blauw' gebruikt om naar een van deze objecten te verwijzen. Over welk object hebben ze het?
De antwoorden hebben de onderzoekers geholpen een beter beeld te krijgen van hoe een luisteraar een spreker begrijpt en hoe een spreker beslist wat te zeggen. Daaruit ontwikkelden ze het soort wiskundig model dat het denkproces van een computer kan uitbreiden en verfijnen.
Frank zei: "Het zal jaren werk kosten, maar de droom is van een computer die echt nadenkt over wat je wilt en wat je bedoelt in plaats van alleen wat je zei."
Een manier van spreken
Hier zijn enkele recentere ontwikkelingen in spraakherkenning:
- Siri zwijgt: IBM neigt echt nerveus te zijn over het achterhalen van bedrijfsgeheimen, dus het verbiedt zijn werknemers nu het gebruik van openbare sites voor bestandsoverdracht, zoals Dropbox. Maar het heeft ook een verbod op het gebruik van Siri op kantoor, omdat beveiligingsmedewerkers zich zorgen maken dat iemand, terwijl hij met zijn telefoon praat, gevoelige informatie kan onthullen die op de servers van Apple terechtkomt.
- Neem dat, Apple !: Samsung lanceerde deze week zijn nieuwe Galaxy X III-smartphone in Londen, en hoewel het grote touchscreen veel aandacht krijgt, beschikt het ook over nieuwe spraak- en gezichtsherkenningssoftware.
- Doe wat ik zeg, niet wat ik doe: en Samsung stopt daar niet. Het heeft onlangs een patentaanvraag ingediend voor een robot die menselijke spraak begrijpt. De robot zou zijn "luistermogelijkheden" kunnen aanpassen om rekening te houden met omgevingsgeluid dat de gegeven opdrachten kan onderbreken of verstoren. Het zou ook in staat zijn om te herkennen wie er tegen spreekt, zelfs als het achtergrondgeluid erg hard is.
Infographic-bonus: u denkt dat uw auto nu geautomatiseerd is. Wacht tot het volledig is aangesloten op internet. Lees meer over wat een verbonden auto kan doen.