Obrada i prepoznavanje govora

Obrada i prepoznavanje govora

Uključene obrazovne institucije

Elektrotehnički fakultet / Fakultet organizacionih nauka, Univerzitet u Beogradu

Upoznavanje studenata sa osnovama nauke o govoru. Razumevanje osnovnih principa fonetskih i fonoloških procesa. Osposobljavanje studenata da razumeju i koriste osnovne računske alate za fonološke procese, za projektovanje jednostavnih sistema produkcije govora i prepoznavanje govora. Pored navedenog, kurs ima za cilj da pruži uvid u osnovne karakteristike realnih audio signala i specifične postupke obrade koji se koriste u različitim audio aplikacijama: u akviziciji audio signala, modifikaciji audio signala u realnom vremenu, sistemima za prenos informacija u audio domenu.

Studenti će biti osposobljeni za računarsko projektovanje sistema za prepoznavanje i obradu govornog signala. U okviru kursa studenti će se kroz odabrane praktične realizacije upoznavati sa specifičnim tehnikama obrade signala u audio sistemima i zahtevima koji se u njima postavljaju.

Teorijska nastava

Analiza diskretizovanog signala govora: vremensko-frekvencijska analiza, analiza zasnovana na LPC koeficijentim, cepstralna analiza govora, automatska ekstrakcija i praćenja govornih formanata, automatsko izdvajanje govornog ‘pitch’ signala. Fonetski procesi: fonetska artikulacija i generisanje govora, akustički modeli generisanja govora, koartikulacija, karakterizacija govornog signala, percepcija zvuka, percepcija govora. Fonološki procesi: foneme, obeležja. Prepoznavanje govora: akustičko preprocesiranje, korišćenje skrivenih Markovljevih lanaca. Akustičko modeliranje. Obrada i povećanje kvaliateta govornog signala: Wiener-ovi filtri, spektralno oduzimanje. Sinteza govora: artikulacioni metod, spektralni metod, metod vremenskih oblika, metod faze. Algoritmi za kodovanje signala govora na niskim bitskim brzinama.
Audio signali: karakteristike, akvizicija. Obrada audio sigana u spektralnom domenu. Sistemi za obradu audio signala sa više brzina. Amplitudski, frekvencijski i vremenski procesori. Implementacija audio efekata u realnom vremenu. Poništavanje akustičkog eha. Filtarske banke i ekvalizacija sistema za reprodukciju zvuka. Obrada signala za prilagođenje osobama sa specijalnim potrebama – slušni aparati, kohlearni implanti. Prenos informacija u audio domenu i primena u IoT sistemima.

Praktična nastava

Korišćenje računara sa obukom za korišćenje softverskih paketa za simulaciju rada dinamičkih sistema. Realizacija algoritama obrade audio signala na digitalnom procesoru.