Beszédfelismerés és Hangbányászat szakmai műhely
- A vezető konzulens:
Dr. Mihajlik Péter,
IB154.
- Elsősorban azzal foglalkozunk, hogy a természetes (zajokat is
tartalmazó, spontán) hang- és beszédjelből hogyan tudjuk a
szövegtartalmat számítógéppel minél pontosabban
kinyerni. Rengeteg probléma merül fel a nyelvfelismeréstől a
beszélőváltás automatikus észlelésén keresztül a
háttérbeszélgetések és zene kezeléséig, továbbá számos
technikai kihívással kell megbírkózni: legyen a szövegkiírás
valós idejű (vagy gyorsabb), a memória és számítási igények
legyenek kézbentarthatóak stb. Főbb eszközeink a matematikai
statisztika, mélytanuló rendszerek, digitális jelfeldolgozás,
programozási és scrpit nyelvek, jelentős részben nyílt
forráskódú szoftvereszközökbe rejtve. Számos gyakorlati, valós
életben is működő alkalmazás megvalósításában részt vettünk
(pl. M1 TV műsorok gépi feliratozása). Az országban a
beszédfelismerés területén az első számú kutatóhelynek
számítunk, nemzetközi kapcsolatrendszerünknek is köszönhetően
számos hallgatónk folytatta kiváló eredménnyel neves külföldi
kutatóegyetemeken a pályáját.
- Nagyon izgalmas, sokoldaú, világszerte "hot topic" a
beszédfelismerési terület, már számos alkalmazása működik jól a
gyakorlatban de még mindig dinamikus a fejlődése. A nálunk
megismert eszközök, módszerek számos szintén húzóágazatnak
számító területen jól használhatók (pl. önvezető autók, arc- és
kézírásfelismerés), mondhatnánk úgy is, hogy a jövő mérnöke
számára lényegében nélkülözhetetlenek lesznek a nálunk
megtanulható ismeretek.
Ipari partner: SpeechTex
- A hallgatók feladata a napjainkban legsikeresebb speciális
mélytanuló struktúra megismerése, először egyszerűbb, majd
összetetteb feladatokra alkalmazása, kísérletek végzése,
kiértékelése. Jó eredmények esetén lehetőség van az ipari
alkalmazásokba történő implementációban is részt venni.
- http://alpha.tmit.bme.hu/~mihajlik/
- Vissza a fő
oldalra
Utolsó módosítás: 2016.09.05.
Németh Felicián