Beszédszintézis - Laboratóriumunk hazánkban egyedülálló magyar nyelvű gépi szövegfelolvasó (Text-to-Speech, TTS) technológiák kutatásában, fejlesztésében. Mit is jelent ez? Tetszőleges gépelt szöveget természetes hangzású emberi beszéddé alakítunk! Női és férfi hangon egyaránt! Megoldásaink a beágyazott rendszerektől kezdve, okostelefonokon át, a nagyteljesítményű szerverekig elérhetőek Linux, Windows és Android rendszereken.
Intelligens interakciók - A technológia egyre inkább mindennapi életünk részese, ezért kiemelten fontosnak tartjuk az ember-gép és ember-robot kapcsolat kutatását. Többek között foglalkozunk humanoid robot vezérléssel, multimodális interfészek kialakításával, okostelefonos és okosTVs alkalmazások felhasználói élményének növelésével, továbbá vak-, látássérült és beszédsérült felhasználóknak speciális felületek kialakításával.
Modern gépi tanulás - Mind a beszédszintézis, mind az intelligens interakciók és a kapcsolódó határterületek kutatása és fejlesztése a statisztikai módszerek, valamint a modern gépi tanulás magas szintű ismereteit igénylik. Elsődleges tématerületeink a rejtett Markov-model (Hidden Markov Model, HMM) és a mély neurális hálózatok (Deep Neural Networks, DNN) alap- és alkalmazott kutatása.
A hallgató feladata a félév során a gépi tanulás és a mély neurálos hálózatok alapjainak és a rendelkezésre álló eszközöknek a megismerése, majd ezek felhasználásával egy probléma megoldása. A választott probléma lehet a felhasználó szokások elemzésével kapcsolatos (viselkedés előrejelzése, felhasználó felismerés, képi információk feldolgozása), lehet numerikus adatok alapján történő előrejelzéssel kapcsolatos (hőmérsékleti adatok, fogyasztási adatok előrejelzése historikus adatok alapján), illetve kapcsolódhat a beszédtechnológiai felhasználáshoz beszélő felismerés és klasszifikáció formájában.
A hallgató feladata, hogy megvizsgálja a rendelkezésre álló módszereket, majd létrehozzon egy beszédrögzítő alkalmazást, pl. Androidon vagy iOS-sen. A végső cél egy olyan multiplatform hangadatbázis-gyűjtő, és feldolgozó rendszer, melynek segítségével számítógépen és akár okostelefonon keresztül is megvalósulhat az adatgyűjtés.
A hallgató feladata a félév során az, hogy megismerje a beszédszintetizátor és beszédfelismerő működését, és ezek felhasználásával készítsen egy egyszerű alkalmazást, amely egy okosotthon alap irányítási funkcióit képes megvalósítani. Ilyen például, hogy szóban lekérdezze az aktuális hőmérsékletet vagy felkapcsolja a világítást a helyiségben.
Utolsó módosítás: 2016.09.05. Németh Felicián