https://frosthead.com

Hoe een menselijke stem op te bouwen

Een van de meer herkenbare stemmen ter wereld is van Stephen Hawking - hoewel het natuurlijk helemaal niet de stem van de beroemde wetenschapper is, maar een die door de computer wordt gegenereerd in reactie op zijn gezichtsbewegingen. Hij gebruikt nu al bijna 25 jaar een synthesizer om te spreken, zijn stem en vermogen om lang geleden verloren te gaan aan ALS, of de ziekte van Lou Gehrig. Tegenwoordig wordt de Britse astrofysicus geïdentificeerd door zijn robotachtige monotone, een die in feite een Amerikaans accent heeft.

Maar de waarheid is dat Hawking die door de computer gegenereerde stem deelt met duizenden andere mensen, sommige jonge meisjes, sommige oudere vrouwen en anderen van alle leeftijden en etnische groepen over de hele wereld. Allemaal, niet in staat om op natuurlijke wijze te spreken, beschouwen het als hun eigen, hoewel er niets unieks aan is.

En dat lijkt Rupal Patel gewoon niet goed.

Patel is een spraakwetenschapper en directeur van het nieuwe Centre for Speech Science and Technology aan de Northeastern University. Ze heeft lang lang het gevoel gehad dat een stem een ​​individu helpt definiëren; het geeft duidelijk aan hoe iemand in de wereld bekend is. Zelfs als mensen niet kunnen praten, zegt ze, zouden ze dan niet de gelegenheid moeten hebben om te communiceren via stemmen die trouwer zijn aan wie ze zijn?

Sinds enkele jaren ontwikkelen zij en collega-spraakwetenschapper Tim Bunnell een manier om op maat gemaakte stemmen te construeren met als essentie alles wat een persoon kan maken. Ze richten zich op de toonhoogte en het volume van die geluiden en ook op hoe de persoon bepaalde letters kan uitspreken, zoals 'ss' of 'ch'. Het doel is om zo goed mogelijk in te stemmen op de identiteit van een stem.

Dan wordt het een kwestie van het bouwen van een nieuwe stem - een met veel meer duidelijkheid - door geluiden van een donor met een vergelijkbaar geslacht, leeftijd, grootte en geografische achtergrond te oogsten. Om een ​​stem te doneren, wordt een persoon opgenomen die een selectie van korte zinnen leest die cumulatief elke combinatie van geluiden in een taal behandelen. In het ideale geval neemt hij of zij maar liefst 3000 verschillende zinnen op. Dit duurt uren. En hoewel opname niet in een enkele sessie hoeft te gebeuren, kan hij meer geluiden een donor bieden, hoe beter een stem kan worden geproduceerd.

Uit die verzameling geluiden maakt speciaal ontworpen software woorden met een reverse-engineered stem die dicht in de buurt komt van hoe een persoon klinkt als hij of zij geen spraakstoornis had.

Is dit schaalbaar?

Gaat er niet een niet zo klein leger donoren een enorm aantal zinnen lezen om een ​​database van geluiden op te bouwen die kan worden omgezet in gepersonaliseerde stemmen?

Ja het zal, Patel zegt in een recent TED-gesprek, daarom zet ze door met wat zij het Human Voicebank Initiative noemt.

De website van het project, VocaliD.org, heeft zowel een aanmeldpagina voor donoren als een andere voor diegenen die een persoonlijke stem willen krijgen. Laatstgenoemden moeten hun namen en andere relevante informatie opgeven, zoals hun spraakvaardigheid, die kan variëren van 'volledig niet-vocaal' tot 'kan geluiden maken, maar geen woorden' tot 'sommige woorden gebruiken voor communicatie'.

Hoewel er slechts een handvol stemmen is gecreëerd tijdens de kinderschoenen van het project, hebben meer dan 10.000 mensen zich al aangemeld als stemdonor, zegt Patel. "Enkele honderden" anderen, zegt ze, hebben zich aangemeld om nieuwe stemmen te krijgen.

Toch zijn er verschillende hindernissen waarmee de voicebank wordt geconfronteerd, zegt Patel, waaronder donoren al het materiaal laten lezen dat nodig is om een ​​stem te bouwen. Die uitdaging is nog groter als we bedenken dat vrijwilligers op dit moment in een professionele studio moeten opnemen om te zorgen dat wetenschappers monsters van hoge kwaliteit hebben. Patel zegt dat er hulpmiddelen worden ontwikkeld waarmee donoren hun zinnen thuis kunnen opnemen.

Haar visie is om tegen 2020 een miljoen verschillende stemmonsters te verzamelen. Maar al haar werk maakt indruk. De site bevat een audiobestand van slechts twee zinnen lang, aangeboden door een jonge vrouw die wordt beschreven als iemand met een 'ernstige spraakstoornis'. Haar woorden zijn zo duidelijk als de dag:

“Deze stem is alleen voor mij. Ik kan niet wachten om het met mijn vrienden te proberen. '

Hier is Rupal Patel die het Human Voicebank-initiatief uitlegt in een TED-talk:

Stemmen horen

Hier is meer recent onderzoek naar het effect van stemmen:

  • Luister naar je moeder: alleen al het geluid van de stem van een moeder kan premature baby's beter laten eten, volgens een studie gepubliceerd in Kindergeneeskunde. Met het gebruik van fopspenen uitgerust met sensoren, hebben onderzoekers van het Monroe Carell Children's Hospital in Nashville baby's beloond die correct zuigen met opnames van hun moeders die slaapliedjes zingen. Baby's in de studie die de speciale fopspenen gebruikten - en de stem van hun moeder hoorden - waren in staat om een ​​week eerder uit de sondes te komen dan degenen die dat niet deden.
  • Welkom bij de echokamer: uit eerder onderzoek is gebleken dat mensen de voorkeur geven aan stemmen die klinken alsof ze van kleine vrouwen of grote mannen komen, maar een nieuwe studie van de University of British Columbia beweert dat stemmen die we echt leuk vinden, klinken als die van onszelf, met name die accenten hebben waarmee we vertrouwd zijn. De onderzoekers zeiden ook dat mensen de voorkeur leken te geven aan de stemmen van mannen die kortere woorden gebruikten en vrouwen die ademend klonken.
  • Olifanten vergeten nooit een stem: Afrikaanse olifanten zijn blijkbaar behoorlijk goede luisteraars. Volgens een tweejarig onderzoek in Kenia kunnen ze menselijke stemmen onderscheiden op basis van geslacht, leeftijd en zelfs etnische groep. Onderzoekers registreerden Maasai mannen, vrouwen en kinderen die schreeuwden en speelden het via een luidspreker verborgen voor olifantenkuddes. Pas toen de dieren de stem hoorden van volwassen Maasai-mannetjes - de groep waarmee olifanten veel vaker confrontaties hebben - reageerden ze, beschermend rond kalveren kruipend. Ze reageerden niet op stemmen van volwassen mannen van een andere stam, de Kamba, die als boeren zelden in conflict komen met de kuddes.
  • Ze horen je pijn: na het voltooien van een reeks hersenscans op hoektanden, zeggen wetenschappers in Schotland dat honden net mensen zijn, omdat ze een deel van hun hersenen hebben dat is gewijd aan het herkennen en interpreteren van stemmen. En dat is volgens de onderzoekers de reden waarom je hond zo afgestemd lijkt te zijn op je gevoelens.
  • Ik wist dat er iets anders aan je was: plastische chirurgie verandert niet alleen je uiterlijk; het kan ook de manier veranderen waarop een persoon klinkt. Volgens een paper gepubliceerd in het tijdschrift Plastic and Reconstructive Surgery, ontdekten onderzoekers in Iran dat patiënten met neuscorrectie of neusklussen vaak dachten dat hun stemmen na de procedure meer nasaal klonken.
Hoe een menselijke stem op te bouwen