Talesystemer - talegjenkjenning og talesyntese

Det talte ord i de elektroniske mediene er viktig i dag. Det kan være fint å ha litt kjennskap til hvordan slik tale er bygget opp elektronisk og kjenne litt til det matematiske verktøyet vi har til rådighet. På BKI drives det undersøkelser i matematiske modeller i dette emnet. Utgangspunktet har vært Knut Sørsdal's arbeid med en inversjon i seismikk. Det spesielle med dette feltet er at de har en analogi i talegjenkjenning og talesyntese som brukes som en del av BKI's internasjonale arbeid med språkoversettelse av tekst og tale. Generering av syntetisk tale har en teknologi som er svært lik den som brukes for å generere syntetiske seismogram.

Her kan du høre noen av de syntetiske stemmene som brukes av BKI

Målrettet arbeid med webTV og taleteknologi

Google har utviklet en oversetter av tekst som ligger på BKI's forside. Den oversetter greit mellom ca. 40 språk. I nær fremtid vil det også bli lansert en tjeneste som oversetter muntlig tale mellom verdens språk. Du kan snakke på norsk og ut av høytaleren kommer engelsk, eller hindi og kinesisk. Google arbeider nå mye med automatisk tekstgenerering av engelsk tale på YouTube-videoer. BKI bruker i dag syntetisk tale mellom norsk og engelsk. Det går enda ikke automatisk mellom språkene. Det er snakk om syntetiske stemmer som leser fra en tekst og tekstene oversettes direkte til et annet språk. Teksten brukes som input til en syntetisk stemme som leser teksten høyt. Vi oppfordrer til at man setter seg inn i teknologien. Den teknologi som brukes for å kjenne igjen en stemme og oversette den til tekst er den samme som brukes for å tolke et seismogram. Prosessen som ligger til grunn kalles dekonvolusjon. Når denne prossesen er utført, overlates den dekonvolverte talen til statistiske prosesser (Markov kjeder)for at den skal kunne tolkes som meningsfullt språk. Både dekonvolution og Markov kjeder brukes i seismikk i dag.

Vi har laget en video som berører noen få av de ideer som settes ut i livet på BKI:

Video om BKI-Talesyntese på YouTube

For den som driver med oljeleting eller er ansatt i et oljerelatert selskap i Norge og er blitt oppsagt på grunn av nedbemanning er det ingen grunn til å gå arbeidsledig. Forskning innen stemmesyntetisering og stemmegjenkjenning er i sterk utvikling. Matematikken som ligger under teknologien for å finne olje - er som nevnt ovenfor - akkurat den samme som brukes i stemmeforskningen. Les mer om dette her og finn linker:

Les mer her (Engelsk)

Test på Google Språkoversetter på YouTube:
Google bruker sitt translate-program på subtittel-tekster som kan legges inn på YouTube videoer direkte etter at de har lagt ut. Følgende video er en testvideo for slike tekster. Språkvalget ligger nede i høyre hjørne.



Knut Sørsdals kurs i "Frelsens vei" gjøres nå tilgjengelig på 35 språk på YouTube. Se hvordan språkmodulen kan startes her:



Kurs i talesyntese oversatt automatisk fra engelsk
Google-oversettelsen er ikke førsteklasses. Kan du engelsk bør du starte her.