Talesystemer - talegjenkjenning og talesyntese

Det talte ord i de elektroniske mediene er viktig i dag. Det kan være fint å ha litt kjennskap til hvordan slik tale er bygget opp elektronisk og kjenne litt til det matematiske verktøyet vi har til rådighet. Det har vært gjort noen undersøkelser i matematiske modeller som kan anvendes på dette emnet. Utgangspunktet har vært Knut Sørsdal's arbeid med en inversjon i seismikk. Det spesielle med dette feltet er at de har en analogi i talegjenkjenning og talesyntese. Generering av syntetisk tale har en teknologi som er svært lik den som brukes for å generere syntetiske seismogram.

Her kan du høre noen av de syntetiske stemmene som brukes idag.

Målrettet arbeid med webTV og taleteknologi

Google har utviklet en oversetter av tekst som ligger på BKI's forside. Den oversetter greit mellom ca. 40 språk. I nær fremtid vil det også bli lansert en tjeneste som oversetter muntlig tale mellom verdens språk. Du kan snakke på norsk og ut av høytaleren kommer engelsk, eller hindi og kinesisk. Google arbeider nå mye med automatisk tekstgenerering av engelsk tale på YouTube-videoer. Det brukes i vårt arbeid dag syntetisk tale mellom norsk og engelsk. Det går enda ikke automatisk mellom språkene. Det er snakk om syntetiske stemmer som leser fra en tekst og tekstene oversettes direkte til et annet språk. Teksten brukes som input til en syntetisk stemme som leser teksten høyt. Vi oppfordrer til at man setter seg inn i teknologien. Den teknologi som brukes for å kjenne igjen en stemme og oversette den til tekst er den samme som brukes for å tolke et seismogram. Prosessen som ligger til grunn kalles dekonvolusjon. Når denne prossesen er utført, overlates den dekonvolverte talen til statistiske prosesser (Markov kjeder)for at den skal kunne tolkes som meningsfullt språk. Både dekonvolution og Markov kjeder brukes i seismikk i dag.

Video om Talesyntese på YouTube

For den som driver med oljeleting eller er ansatt i et oljerelatert selskap i Norge og er blitt oppsagt på grunn av nedbemanning er det ingen grunn til å gå arbeidsledig. Forskning innen stemmesyntetisering og stemmegjenkjenning er i sterk utvikling. Matematikken som ligger under teknologien for å finne olje - er som nevnt ovenfor - akkurat den samme som brukes i stemmeforskningen. Les mer om dette her og finn linker:

Les mer her (Engelsk)

Test på Google Språkoversetter på YouTube:
Google bruker sitt translate-program på subtittel-tekster som kan legges inn på YouTube videoer direkte etter at de har lagt ut. Følgende video er en testvideo for slike tekster. Språkvalget ligger nede i høyre hjørne.

Kurs i talesyntese oversatt automatisk fra engelsk
Google-oversettelsen er ikke førsteklasses. Kan du engelsk bør du starte her.