|
Távközlési és Mesterséges Intelligencia Tanszék
Budapesti Műszaki és Gazdaságtudományi Egyetem - Villamosmérnöki és Informatikai Kar |
|
Tanszékünkön alapvetően közösen készítjük a kiírásokat az Önálló laboratórium, Szakdolgozat, Diplomatervezés tárgyakra. Ez azt jelenti, hogy a legtöbb témát felvehetik BSc-s és MSc-s hallgatók is, tantárgytól (önlab/szakdolgozat/diplomatervezés), szaktól, szakiránytól/ágazattól függetlenül. Ez úgy lehetséges, hogy sokszor egy téma kellően általános ahhoz, hogy a különböző tárgyat felvevő hallgatók különböző konkrét feladatot végezhessenek az adott témán belül. Néha azonban ez nem lehetséges: ez esetben a konkrét témakiírás egyértelműen rendelkezik, hogy ki választhatja, avagy ki nem választhatja az adott témát.
További információ itt található.
A téma tartalmazza
A téma ne tartalmazza
| TMIT2023-245 | |
| Idősorok szegmentációja gépi tanuló módszerrel path signature alapú idősor reprezentáció | |
| Kulcsszavak: idősorok, nem-paraméteres gépi tanulás, szegmentáció, matematikai reprezentáció | |
Témavezető / oktatók: Szűcs Gábor
/ Németh Marcell
| Az idősoros adatok szegmentációja kiemelkedő fontossággal bír a különböző területeken, mint például a pénzügyi elemzés, egészségügyi monitorozás, vagy az iparban történő folyamatoptimalizáció. A projektmunka célja a felügyelt és nem-paraméteres gépi tanulási módszerek alkalmazásával a komplex idősoros adatok részletekre bontása és szegmentálása meghatározott statisztikai tulajdonság és/vagy nem ismert mögöttes dinamika alapján. Szegmentáció során a cél az adathalmazokat kisebb, jelentős részekre vagy szegmensekre bontani az idősorok struktúrájának és változásainak jobb megértésének érdekében. Szegmentációt alkalmazhatunk például pénzügyi idősorokon az érdekes események vagy trendváltozások azonosítására. A path signature egy olyan matematikai eszköz, amely az idősoros adatokat a mintasorozatok időbeli változásainak struktúráján keresztül írja le. Az signature-ök hierarchikus struktúrával rendelkeznek, ahol az egyes szintek az idősorok egyre magasabb rendű struktúráit írják le. Ezek felhasználásával teszik lehetővé az idősorok bonyolultságának és mintázatainak rugalmas és hatékony kezelését. A hallgató feladata a félév(ek) során a nem felügyelt, path signature alapú idősor szegmentáció irodalmának feldolgozása és state-of-the-art módszereinek megismerése után választott adathalmazokon kutatást végezni a megismert technikák alkalmazhatóságának lehetőségeiről, továbbá feltárni a lehetséges továbbfejlesztési lehetőségeiket. A kutatás fő irányvonala a path signature alapú szegmentációs módszerek továbbfejlesztése, illetve újabb alacsony- és magas-dimenziós mintabeágyazások kutatása, amelyek segítségével hatékonyan csoportosíthatóak az idősoros adatok összetartozó részletei. Tudományos érdeklődés esetén lehetőség van kutatási munkára is, a téma mély, elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. |
| TMIT2023-244 | |
| Tudományos kutatás mesterséges intelligencia területén | |
| Kulcsszavak: mesterséges intelligencia, mély tanulás elmélete, gépi látás, Google TensorFlow, neurális hálók, konvolúciós hálók, TDK, iMSc | |
Témavezető / oktatók: Szűcs Gábor
| Ezt a témát elsősorban olyan tudományos érdeklődésű hallgatóknak ajánljuk, akik szívesen elmélyülnek az elméleti területekbe is, szívesen írnának TDK-t vagy akár nemzetközi publikációt is, illetve azoknak, akik gondolkodnak doktoranduszi pálya lehetőségen. Különböző izgalmas tanszéki tudományos kutatásokba lehet bekapcsolódni a mesterséges intelligencia (MI) területén, mint pl. gépi tanulás, mély neurális hálók, információ visszakeresés, gépi felismerés képeken, mintafelismerés, multimédia tartalmak elemzése, ahol például az egyik nagy kihívás a tartalmakban összefüggések keresése. A hallgató feladata az angol nyelvű szakirodalom megismerése és elméleti részekbe való elmélyülés után új algoritmusok kidolgozásában való részvétel jól elkülöníthető részfeladattal. Választható alkalmazási területek: adat-, szöveg- és multimédiabányászat, mély tanuló rendszerek. A kutatás iMSc és doktorandusz hallgatókkal együtt csoportosan történik egyénre szabott részfeladatokkal. Néhány részfeladat: 1) Aktív tanulás lehetőségeinek matematikai vizsgálata 2) Mély tanuló algoritmusok (főként mély neurális hálók) tudományos kutatása képfeldolgozási feladatoknál 3) Elméleti modellek kidolgozása osztályozásra zajos környezetben 4) Nagy adathalmazokon alapuló előrejelzések. Várjuk az elméleti érdeklődésű hallgatókat, akik szívesen vesznek részt a közös gondolkodásban és TDK munkában. |
| TMIT2023-246 | |
| Gráf beágyazások elavulásának vizsgálata | |
| Kulcsszavak: gráfok, gépi tanulás, neurális hálózat, gráf neurális hálózat, mély tanulás, beágyazás, reprezentáció tanulás, ajánlórendszerek, szociális hálózatok, hálózatok, hálózattudomány | |
Témavezető / oktatók: Szűcs Gábor
| A gráf beágyazási algoritmusok rendkívül hasznos eszközt jelentenek több különböző domainben, pl. ajánlórendszerekben, szociális hálóknál, in-silico gyógyszerkutatásban, stb. A projekt célja különböző gráf beágyazási algoritmusok vizsgálata, azok időbeli elavulásának mérése downstream feladatokon. |
| TMIT2025-206 | |
| Tudományos kutatás Gráf Neurális Háló és általános AI témakörökben | |
| Kulcsszavak: AI, kutatás, gráf neurális hálók, mélytanulás | |
Témavezető / oktatók: Szűcs Gábor
/ Kiss Richárd
| Gráf Neurális Háló témakör --- A feladat során egy gráf neurális háló alapú ajánlórendszert kell megvalósítani, melyben mesterséges zajt szúrunk be a gráf éleibe, majd zajszűrő módszereket alkalmazunk annak csökkentésére. Fontos vizsgálni, hogy a háló milyen hatékonysággal képes kiszűrni a zajos éleket, és hogyan változik a modell teljesítménye a zaj előtti és utáni állapotban. Az gráfos adathalmazt két részre osztva elemezni kell a 2 rész eloszlását is. Emellett az él mintavételezési stratégiák szerepét is tanulmányozni kell, különös tekintettel arra, hogy a friss élek előnyben részesítése javítja-e az ajánlórendszer tanulási és predikciós képességét a véletlenszerű mintavételezéshez képest. Végül az attention súlyokat is meg kell vizsgálni annak érdekében, hogy feltérképezzük, képesek-e a releváns, zajmentes vagy friss élek erősebb kiemelésére, ami további betekintést nyújt a modell zajkezelő képességébe és működésébe. |
| Ipari partner: Idomsoft Zrt TMIT2025-154 | |
| Bűnügyi adatok elemzése és modellezése | |
| Kulcsszavak: deep neural network, mély neurális háló, gépi tanulás, deep learning, bűnügyi adatok | |
Témavezető / oktatók: Gyires-Tóth Bálint
/ Unyi Dániel
| Az MI fejlődése új perspektívát nyit a bűnügyi adatok elemzésére és bűnügyi nyomozások hatékonyságának növelésében. Ennek a projektnek a fókusza az ismeretlen elkövetők keresésére és a sorozat jellegű bűnesetek azonosítására irányul, kiemelve a mélytanulás különböző technikáinak alkalmazását. A modellezés során kiemelt módszerek között szerepelnek az autoenkóder hálózatok, melyek képesek az adatok reprezentációját saját maguk által megtanulni, ezzel segítve a nem triviális mintázatok és kapcsolatok feltárását. Emellett mélytanulás alapú ajánló rendszereket alkalmazunk, amelyek segíthetnek az elkövetői profilképek és az elkövetett bűncselekmények közötti összefüggések feltárásában. A gráf neurális hálózatok használata a bűnesetek közötti összetett kapcsolatokat vizsgálja, különös tekintettel a sorozat jellegű bűnesetek azonosítására. A hallgató feladata a félév során a kapcsolódó irodalmak és eszközök megismerése és feldolgozása, illetve mélytanulás alapú bűnügyi modellek tervezése, kialakítása és tesztelése. A feladat során megfelelő előrehaladás esetén lehetőség van piaci fejlesztéshez való kapcsolódáshoz. A munka a legelterjedtebb, magas szintű deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka előrehaladtával nagyteljesítményű GPU erőforrást biztosítunk. A feladatok megoldása jelentős mennyiségű programozást kíván (Python nyelven). Tudományos érdeklődés esetén lehetőség van kutatási munkára is, a téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintű angoltudás. |
| TMIT2025-183 | |
| Gráf Neurális Hálózatok és alkalmazásaik | |
| Kulcsszavak: gráf neurális hálózatok, deep learning, mélytanulás | |
Témavezető / oktatók: Gyires-Tóth Bálint
/ Unyi Dániel
| A mesterséges intelligencia egyik legizgalmasabb területe a Gráf Neurális Hálók (GNN-ek) kutatása és alkalmazása. A gráfokkal bonyolult kapcsolatrendszereket (pl. közösségi hálók, molekulák, térképek/közlekedés) írhatunk le, a GNN-ek pedig képesek ezekből új tudást kinyerni. Elképzelhető feladatok: 1. Magyarázhatóság: miért dönt a neurális háló úgy, ahogy? 2. Skálázhatóság: komplex hálózatok kezelése és hatékony tanítása. 3. Vizualizáció: interaktív eszközök fejlesztése gráfok és reprezentációik bemutatására. 4. GraphRAG: nyelvi modellek és gráf alapú keresés ötvözése. 5. Bioinformatikai alkalmazások: alkalmazás a génszerkesztés területén. A konkrét témát a hallgató saját érdeklődésének megfelelően, közösen határozzuk meg. Elvárások: szorgalmas munkavégzés, angol nyelvtudás, programozási ismeretek. Python és Deep Learning keretrendszerek (PyTorch/TensorFlow) ismerete, TDK és tudományos érdeklődés előnyt jelent. |
| TMIT2025-153 | |
| Deep learning alapú idősor és szekvenciális adat modellezés | |
| Kulcsszavak: deep neural network, mély neurális háló, gépi tanulás, deep learning, szekvenciális adatok modellezése | |
Témavezető / oktatók: Gyires-Tóth Bálint
| Számos adat (beszéd; videó; szövegek; emberek, objektumok mozgása; tőzsde hírek és árfolyammozgás; interakciók, stb.) szekvenciális adatstruktúrát követ. Szekvenciális adatok modellezése során három fő kihívással állunk szemben: (1) a figyelembe vett korábbi elemek (receptív mező) méretének a növelése, (2) többskálás modellezés, (3) sokdimenziós adatok modellezése. Szekvenciális adatok modellezésének jelenleg az egyik leghatékonyabb módszere mély tanulás alapon történik. A hallgató feladatat a fenti három tématerület egyikét közösen kiválasztva új típusú megoldások kidolgozása, és ezek alkalmazása adott tématerületen. Feltételek: A munka a legelterjedtebb, magas szintű deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka előrehaladtával nagyteljesítményű GPU erőforrást biztosítunk. A feladatok megoldása jelentős mennyiségű programozást kíván (elsősorban Python-ban). Megfelelő előrehaladás esetén lehetőség van hazai és nemzetközi projektekbe való becsatlakozásra. A téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Legalább fél év deep learning tapasztalat. Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintű angoltudás. Előny: kapcsolódó tárgyban szerzett 4-es vagy 5-ös osztályzat. Tudományos (TDK, cikkek, PhD) érdeklődés. |
| Ipari partner: Nemzeti Adó- és Vámhivatal TMIT2025-155 | |
| Közigazgatási és adózási mintázatok elemzése és modellezése | |
| Kulcsszavak: deep learning, MI, közigazgatás, adózás | |
Témavezető / oktatók: Gyires-Tóth Bálint
| A hallgató munkájának célja olyan módszerek és eljárások kidolgozása, melyek segítenek a közigazgatási és adózási adatvagyonban rejlő mintázatok feltárásában és modellezésében fejlett gépi tanulási módszerek segítségével. A fókusz olyan problémák megoldásán van, mint például a csalárd számlázási hálózatok azonosítása, vagy az online pénztárgépek tranzakciós adatainak elemzése, amelyek segítik az adatvezérelt döntéshozatalt. A hallgató először szimulált, mesterségesen generált tesztadatokon dolgozik. Ezen adatok célja a módszerek kipróbálása, kalibrálása, a megközelítések értékelése. Megfelelő előrehaladás, precíz munkavégzés és adatetikai irányelvek betartása esetén lehetőség nyílik anonimizált, valós adatokon való munkára is, szintén ellenőrzött környezetben, az adatkörök szakértőinek támogatásával. A feladat során használt módszerek közé tartoznak többek között: - felügyelt és felügyelet nélküli tanulási technikák (pl. random forest, boosting, autoenkóderek), - anomália detekciós algoritmusok, - idősoros elemzés és előrejelzés, - értelmezhető gépi tanulási módszerek (explainable AI). A hallgató feladata: - kapcsolódó szakirodalom és módszertanok megismerése, - adatfeldolgozás, vizualizáció és előkészítés, - modellek tervezése, fejlesztése és kiértékelése, - eredmények dokumentálása és prezentálása. Elvárások: - középhaladó Python programozási ismeretek, - érdeklődés a gépi tanulás és adatelemzés iránt, - precíz dokumentáció és etikus adatkezelés, - olvasási szintű angol nyelvtudás, - heti rendszerességű munka. A munka szoros együttműködésben zajlik a Nemzeti Adó- és Vámhivatal (NAV) Mesterséges Intelligencia Munkacsoportjával, valós problémák mentén. A téma folytatható TDK dolgozatként, szakdolgozatként vagy MSc diplomamunkaként is, és kutatási irányban akár PhD-témaként is lehet folytatni. |
| Ipari partner: Continental Automotive Hungary Kft. TMIT2025-157 | |
| ['PIA'] Mély tanulás önvezető környezetben | |
| Kulcsszavak: deep learning, self-driving cars, Duckietown, adas, PIA | |
Témavezető / oktatók: Gyires-Tóth Bálint
| [EN] Developing self-driving vehicles is one of the most challenging tasks in machine learning nowadays. Current supervised learning approaches can achieve state-of-the-art results with an adequate dataset. However, collecting a representative dataset for a self-driving solution is a challenging task. Therefore, the possibility of training the self-driving models in a simulator and applying the trained model in the real-world is a promising approach. The task is to train a deep reinforcement learning or a deep imitation learning agent in the simulator of the Duckietown self-driving environment (https://github.com/duckietown/gym-duckietown), and evaluate its behaviour in both the simulator and the real world. |
| Ipari partner: Continental Automotive Hungary Kft. TMIT2025-158 | |
| [PIA] Magyarázható MI autóipari feladatokra | |
| Kulcsszavak: deep learning, XAI, self-driving cars, ADAS, PIA | |
Témavezető / oktatók: Gyires-Tóth Bálint
| A téma a BME VIK és Continental Deep Learning Competence Center együttműködésében létrejött PIA (Professional Intelligence for Automotive) részeként kerül meghirdetésre. A témára magyar és külföldi hallgatókat egyaránt várunk. A téma részletes kiírása angol nyelven érhető el. |
| Ipari partner: Idomsoft Zrt TMIT2025-159 | |
| Arcjellemzők automatikus felismerése arcképfotókon mélytanulással | |
| Kulcsszavak: deep neural network, deep learning, face attribute recognition | |
Témavezető / oktatók: Gyires-Tóth Bálint
/ Kalapos András
| A mesterésges intelligencia korszakában az arcfelismerés és az arcjellemzők automatikus azonosítása kulcsfontosságúvá vált számos alkalmazási területen. A feladat elsődleges élja az arcképfotókon található fontos arcjellemzők, például a szem színe, haj színe és típusa, orr típusa, automatikus felismerése mélytanulási technikák segítségével (beleértve konvolúciós és transzformer architektúrák). A feladatban hangsúlyos elem a hierarchikus osztályozás, lesz, amely lehetővé teszi az alacsony szintű jellemzők, például a szemszín vagy hajszín, kategorizálását, majd ezek kombinálását magasabb szintű csoportokba. A mélytanulásnak ezen hierarchikus megközelítése javíthatja a rendszer pontosságát és skálázhatóságát, különösen, ha számos változatos arcjellemzőt kell azonosítani. A feladat során megfelelő előrehaladás esetén lehetőség van piaci fejlesztéshez való kapcsolódáshoz. A munka a legelterjedtebb, magas szintű deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka előrehaladtával nagyteljesítményű GPU erőforrást biztosítunk. A feladatok megoldása jelentős mennyiségű programozást kíván (Python nyelven). Tudományos érdeklődés esetén lehetőség van kutatási munkára is, a téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintű angoltudás. Előny: "Deep Learning a gyakorlatban Python és LUA alapon" (VITMAV45) tárgyban szerzett 4-es vagy 5-ös osztályzat. |
| TMIT2025-214 | |
| Önvezető járművek környezeti modellezése mélytanulással | |
| Kulcsszavak: deep neural network, deep learning, autonomous vehicles | |
Témavezető / oktatók: Gyires-Tóth Bálint
/ Kalapos András
| Az önvezető járművek fejlődésében kulcsfontosságú a környezet pontos és időben történő modellezése. A feladat célja a Waymo nyers szenzoradataiból kiindulva a közlekedési környezet okupanciájának (azaz a különböző térbeli cellák foglaltsági állapotának) és a járművek áramlásának (mozgásirány és sebesség) előrejelzése mélytanulási módszerekkel. A probléma összetett, mivel nemcsak az egyes közlekedési szereplők (autók, gyalogosok, kerékpárosok) aktuális helyzetét kell modellezni, hanem azok jövőbeli mozgását és a teljes tér foglaltsági dinamikáját is. A feladat során a hallgatók különböző, összetett (konvolúciós, transformer, rekurrens) neurális hálózatokkal kísérletezhetnek a probléma tér- és időbeli kihívásának kezelésére. https://waymo.com/open/challenges/2024/occupancy-flow-prediction/ |
| Ipari partner: Ericsson Magyarország TMIT2025-162 | |
| Médiaátvitel QUIC felett | |
| Kulcsszavak: média, médiaátvitel, QUIC, MoQ | |
Témavezető / oktatók: Lévai Tamás
/ Németh Felicián
, Pelle István
, Rétvári Gábor
| A Media over QUIC (MoQ) média tartalmak alacsony késleltetésű továbbítására szolgáló új szabvány. Felhasználási köre kiterjed többek között a live streamingre, játékokra, konferenciahívásokra. Ennek megvalósítására a MoQ publisher-subscriber modellt követ, és tartalomelosztó rendszerekhez (CDN) hasonló architektúrát használ WebTransport vagy pusztán QUIC protokoll felett. A QUIC-nek köszönhetően gyorsabb kapcsolatfelépítést (lásd 0RTT), adaptív torlódáskezelési algoritmusokat, NAT átjárhatóságot, és több kapcsolat összenyalábolásának támogatását nyújtja. A hallgató feladata csatlakozni a tanszéken az Ericsson magyarországi kutatóközpontjával szoros együttműködésben zajló kutatási és fejlesztési projekthez, melynek célja a Media over QUIC megismerése, kapcsolódó prototípusok fejlesztése, teljesítménymérése és kiértékelése. |
| TMIT2025-192 | |
| Emberi alakzatokat tartalmazó pontfelhők szegmentálása | |
| Kulcsszavak: pontfelhő, szegmentálás, mikroszolgáltatás | |
Témavezető / oktatók: Németh Felicián
/ Lévai Tamás
, Pelle István
| Egy nagyobb videokonferencia rendszer részeként egy olyan mikroszolgáltatást készítettünk, mely a bemeneti pontfelhőkön képes kijelölni emberi alakok arcát illetve kezeit. A kialakított szolgáltatás erős korlátokkal rendelkezik mind a teljesítmény (leginkább a futási idő és a detekció pontossága), mind a skálázódás terén. A feladat célja ezen szolgáltatás továbbfejlesztése, problémáinak kezelése. A feladat során lehetőség nyílhat akár a használt detekciós modell cseréjére is megvizsgálva más, nyilvánosan elérhető modelleket, azok teljesítményének elemzésével együtt. A téma kapcsán kérjük, Pelle Istvánt keressék. |
| Ipari partner: Ericsson Magyarország TMIT2025-161 | |
| Forráskód értelmezés AI/ML segítségével | |
| Kulcsszavak: AI, code comprehension, RAG, LLM | |
Témavezető / oktatók: Rétvári Gábor
/ Lévai Tamás
| A fejlesztési projekthez csatlakozó programozók számára az egyik legnehezebb feladat az ismeretlen örökölt kódbázis megismerése. Ez jellemzően számos információforrás áttekintését jelenti, mint például a forráskód, a soron belüli megjegyzések, az egység/integrációs tesztek, a dokumentáció, a hibajegyek, a Git repo előzmények, stb. A visszakereséssel kiegészített generálás (Retrieval augmented generation, RAG) egy AI/ML-asszisztens módszertan, amely segítheti ezt a folyamatot: a programozó természetes nyelven tehet fel kérdéseket a kódbázissal kapcsolatban, és egy kódasszisztens természetes nyelven válaszol. A RAG alapja egy beágyazási modell, amely nagydimenziós vektorok segítségével képes reprezentálni a különböző adatdarabokat (kód, dokumentáció stb.), egy vektoradatbázis, amely a vektorok alapján karbantartja és keresi az adatokkal kapcsolatos tartalmakat, valamint egy nagy nyelvi modell (LLM), amely a végső választ generálja. A feladat a RAG megértése, a kapcsolódó szoftvereszközök tanulmányozása (beágyazási modellek, mint például a CodeBERT vagy a code2vec, vektoradatbázisok, mint a Weaviate, és LLM-ek, mint a llama), és egy egyszerű kódasszisztens létrehozása, amely képes megválaszolni egy kódprojekthez kapcsolódó alapvető kérdéseket. A kiemelkedő teljesítményt nyújtó hallgatókat felkérjük, hogy csatlakozzanak a BME-Ericsson kódmegértéssel kapcsolatos kutatási együttműködéséhez. |
| TMIT2025-189 | |
| Generatív MI-vel támogatott IaC | |
| Kulcsszavak: IaC, generatív MI | |
Témavezető / oktatók: Sonkoly Balázs
/ Pelle István
| Infrastructure as code (IaC) megoldások használatával felhőalapú alkalmazások kitelepítését, azok infrastruktúrájának létrehozását végezhetjük automatizáltan. A téma célja annak feltérképezése, hogy mely IaC eszközökhöz érhetők el generatív mesterséges intelligenciával támogatott megoldások, melyek lehetővé teszik az IaC fejlesztési lépések bizonyos elemeinek kiváltását emberi nyelven írt promptok segítségével. A téma további célja ezen megoldások képességeinek felderítése, adott esetben azok bővítése. A téma kapcsán kérjük Pelle Istvánnál érdeklődjenek. |
| TMIT2025-190 | |
| Serverless federated learning keretrendszer | |
| Kulcsszavak: serverless, federated learning | |
Témavezető / oktatók: Sonkoly Balázs
/ Pelle István
| A federated learning egy olyan gépi tanulási technika, amely lehetővé teszi több eszköz vagy szervezet számára, hogy közösen képezzenek egy megosztott modellt anélkül, hogy megosztanák nyers adataikat. Ez a megközelítés fokozza az adatvédelmet, mivel a bizalmas információk helyben maradnak, miközben továbbra is kihasználható a résztvevő entitások kollektív tudása. A serverless compute szolgáltatások lehetővé teszi a fejlesztők számára, hogy alkalmazásokat építsenek és futtassanak szerverek kezelése nélkül, átadva ezt a felelősséget a felhőszolgáltatónak. Ez a modell az eseményvezérelt végrehajtásra összpontosít, ahol a kód adott események által aktiválódik és automatikusan méreteződik a kereslet függvényében, így téve (költség)hatékonyabbá az alkalmazásokat. Ezen feladat célja a fenti két koncepció kombinálása egy serverless federated learning keretrendszerben. A téma kapcsán kérjük Pelle Istvánnál érdeklődjenek. A témával kapcsolatos kérdésekkel kérjük, hogy Pelle Istvánt keressék. |
| TMIT2025-191 | |
| Késleltetésérzékeny/MI alkalmazások kitelepítése nyílt forráskódú FaaS segítségével | |
| Kulcsszavak: FaaS, serverless | |
Témavezető / oktatók: Sonkoly Balázs
/ Pelle István
| A Function as a Service (FaaS) megoldások úgy teszik lehetővé alkalmazáskomponensek kitelepítését, hogy a fejlesztőktől átvállalják a futtatáshoz szükséges infrastruktúra elemek kezelésének feladatait. A legtöbb ilyen megoldás azonban nem kifejezettem késleltetésérzékeny vagy mesterséges intelligencia alkalmazások futtatását célozza. A téma célja nyílt forráskódú FaaS megoldások képességeinek megismerése ilyen alkalmazások futtatására, illetve egy választott FaaS megoldás képességeinek kiterjesztése az adott alkalmazási terültnek megfelelő elemekkel. A témával kapcsolatban kérjük, Pelle Istvánt keressék. |
| TMIT2025-193 | |
| Gyakorlati feladatok készítése Amazon Web Services platformon | |
| Kulcsszavak: AWS | |
Témavezető / oktatók: Sonkoly Balázs
/ Pelle István
| A Cloud Native hálózati funkciók fejlesztése (VITMCA12) c. tárgy keretében a hallgatók részben az Amazon Web Services eszközeinek használatával ismerkedhetnek meg. A tárgy gyakorlatai során a hallgatók hozzáférést kapnak az AWS Academy e-learning platformjához is, melyben olyan gyakórlófeladatokat végezhetnek el, melyeket a platform automatikusan képes értékelni. A tárgy oktatói saját feladatokat is kidolgoztak, ezekhez azonban vagy nem érhető el egyáltalán automata kiértékelő rendszer, vagy annak használata kissé körülményes. A témát választó hallgató feladata a következők közül egy vagy több területet érinthet: a már létező kiértékelési automatizmusok felhasználóbarátabbá tétele, az automatikus kiértékeléssel még nem rendelkező feladatokhoz kiértékelő módszer fejlesztése, illetve új feladatok kidolgozása. A témával kapcsolatos kérdésekkel kérjük, hogy Pelle Istvánt keressék. |
| Ipari partner: Ericsson Magyarország TMIT2025-196 | |
| Gráf Neurális Hálók (GNN) Alkalmazása Különböző Területeken | |
| Kulcsszavak: ML, AI, GNN | |
Témavezető / oktatók: Toka László
/ Rétvári Gábor
, Sonkoly Balázs
| A gráf neurális hálók (GNN-ek) napjainkban egyre népszerűbbé válnak különféle területeken, ahol a problémák gráfstruktúrával leírhatók. A projekt célja, hogy a hallgatók megismerkedjenek a GNN-ek alapjaival, majd alkalmazzák ezeket a technikákat különböző területeken, például kódmegértésben, tudásgráfok elemzésében vagy sportanalitikában. A résztvevők választott alkalmazási területen egy konkrét problémát oldanak meg, például a kódfüggőségek modellezését, entitások és relációk feltárását tudásgráfokon, vagy sportteljesítmény előrejelzését gráf alapú csapatkapcsolatok modellezésével. Fő célkitűzések: A GNN-ek elméleti alapjainak megértése és azok implementálása. Egy adott területen alkalmazható GNN-modell tervezése és fejlesztése. Az alkalmazott modell hatékonyságának és eredményeinek kiértékelése valós adatok felhasználásával. |
| Ipari partner: Ericsson Magyarország TMIT2025-197 | |
| MI szoftverfejlesztéshez | |
| Kulcsszavak: MI, AI, szoftver, software, LLM, GNN | |
Témavezető / oktatók: Toka László
/ Rétvári Gábor
, Sonkoly Balázs
| A projekt célja, hogy bemutassa, hogyan segítheti a mesterséges intelligencia a kódmegértést, amely a szoftverfejlesztés egyik alapvető aspektusa. A hallgatók MI-alapú eszközöket és technikákat vizsgálnak meg, amelyek támogatják a meglévő kódbázisok elemzését, hibák azonosítását, dokumentáció készítését és a szoftver karbantarthatóságának javítását. A projekt során fejleszteni fognak egy olyan prototípust, amely megkönnyíti a fejlesztők számára a komplex kódok megértését és elemzését, különös tekintettel a kódszemantika, függőségek és potenciális hibák feltárására. Fő célkitűzések: A mesterséges intelligencia szerepének feltárása a kódmegértés támogatásában. Egy olyan MI-alapú eszköz tervezése és fejlesztése, amely segíti a fejlesztőket a kód megértésében és karbantartásában. Az eszköz hatékonyságának értékelése komplex kódbázisok egyszerűsítésében és hibák feltárásában. |
| TMIT2025-156 | |
| Vizsgálatok a természetes és mesterséges intelligencia peremvidékén | |
| Kulcsszavak: ai, intelligencia, mesterséges, természetes, pszichológia, gondolkodás, kreativitás | |
Témavezető / oktatók: Gulyás András
/ Heszberger Zalán
| A mesterséges intelligencia rendre megveri az embert a domain specifikus feladatokban, melyekre pozícionált AI alapú megoldások skálája egyre bővül. Ésszerű feltenni a kérdést, hogy milyen típusú feladatok azok (illetve maradtak-e még ilyenek), amelyekben az emberi intelligencia rövid, illetve középtávon nem látszik helyettesíthetőnek mesterséges megoldással. A félév során átbeszéljük az emberi és mesterséges gondolkodás mechanizmusait és teszteket készítünk olyan esetekre, ahol nem egyértelmű mesterséges intelligencia fölénye. A témára mélyebb érdeklődésű hallgató jelentkezését várjuk, akinek szokása kérdéseken merengeni. |
| TMIT2025-194 | |
| Sportanalitika | |
| Kulcsszavak: labdarúgás, kosárlabda, sport, analitika, adat, adatbányászat, football, basketball, analytics, big data, data mining | |
Témavezető / oktatók: Toka László
| Van egy mondás, mely szerint "a sport a legfontosabb a lényegtelen dolgok között". Ezt igazolja az élsport növekvő szerepe, nem csupán szurkolói szemszögből, de a gazdasági megfontolásokat tekintve is. A 2012-es londoni olimpia megnyitóját kb. 900 millió néző követte, míg a 2014-es labdarúgó világbajnokság döntőjét már egymilliárdan látták. A fokozódó érdeklődés egy részről a sport analitika előtérbe kerülésével is együtt jár, kiváltképp a labdarúgás és kosárlabda tekintetében. Jelenleg, még sok a nyitott kérdés, amelyet az emberi intuíció segítségével válaszolunk meg, annak ellenére, hogy rendelkezésre áll a konkrét adathalmaz, amiből az igazság leszűrhető lenne. A hallgató feladata lesz a sportelemzések alapjául szolgáló rögzített adatok formátumainak megismerése, a jelenleg alkalmazott analitikai módszerek felkutatása, illetve újszerű összefüggések keresése. |
| Ipari partner: Ericsson Magyarország TMIT2025-195 | |
| Adatelemzés az okos világban | |
| Kulcsszavak: adat, elemzés, data, analytics, IoT, 5G, FinTech | |
Témavezető / oktatók: Toka László
/ Gulyás András
| A jelentkezők - megismerkednek az adatelemzés alapjaival, - felhasználási területek széles skáláján (IoT, 5G, FinTech) kipróbálva azokat. Az adatelemző fogások elsajátítása alapvető szükséggé válik bármilyen területen is helyezkedik el egy mérnök. |
| TMIT2025-198 | |
| Felhő alapú mesterséges intelligencia használata VR játékokban | |
| Kulcsszavak: AI, VR, cloud gaming | |
Témavezető / oktatók: Sonkoly Balázs
/ Dóka János
, Nagy Bálint György
| A virtuális valóság és a mesterséges intelligencia képességei és felhasználási területei robbanásszerűen fejlődnek az elmúlt években. A virtuális valóság egyre népszerűbbé válik a játékiparban és az oktatásban, míg a mesterséges intelligencia használata számos területen elterjedt, mint például az autonóm járművek, az egészségügy, a pénzügyi elemzések és az értékesítési felügyelet. A virtuális valóság és a mesterséges intelligencia összekapcsolása új lehetőségeket teremthet a felhasználók számára. A hallgató feladata létrehozni egy olyan rendszert, amely felhasználja a felhőben futó mai legmodernebb mesterséges intelligenciák tudását, és azokat integrálja egy VR játékba. |
| Ipari partner: Ericsson Magyarország TMIT2025-199 | |
| Felhő alapú AR (Augmented Reality) játékok fejlesztése | |
| Kulcsszavak: AR, felhő, online gaming | |
Témavezető / oktatók: Sonkoly Balázs
/ Nagy Bálint György
| A modern felhő platformok és új típusú hálózatok (pl. 5G) szorosan integrált rendszerében számos új, extrém alkalmazás válik megvalósíthatóvá. Ilyenek például az AR/VR alkalmazások, amik a felhő platformok számítási kapacitásával kombinálva sok "elborult" ötlet megvalósítására adnak lehetőséget. A hallgató feladata új AR játék alkalmazások kidolgozásában és implementálásában való aktív részvétel. |
| TMIT2025-203 | |
| Esport analitika | |
| Kulcsszavak: esport, esport analitika, esports analytics, AI, machine learning, deep learning, data mining | |
Témavezető / oktatók: Toka László
/ Szmida Patrik
| Az esport az elmúlt években robbanásszerű növekedésen ment keresztül, mára már világszerte több tízmilliós nézőközönséget vonz. Míg a hagyományos sportokban az adatelemzés és a mesterséges intelligencia módszerei játékosok és csapatok fejlesztésére már bevett gyakorlatnak számítanak, az esportban ezek alkalmazása napjainkban kezd kibontakozni. A hallgató feladata lesz, hogy megismerje az esport mérkőzések során keletkező adatok gyűjtésének és feldolgozásának módszertanát, valamint gépi tanulási technikák segítségével elemezze profi játékosok és csapatok teljesítményét. A hangsúly egy teljes AI-alapú elemzési folyamat felépítésén van, az adat-előkészítéstől a prediktív modellezésig. |
| TMIT2025-204 | |
| Kézilabda videóelemzés Gépi Tanulási módszerekkel | |
| Kulcsszavak: sport, kézilabda, analitika, video analysis, machine learning, AI, gépi tanulás, computer vision, gépi látás | |
Témavezető / oktatók: Toka László
/ Mihályi Balázs
| A kézilabda az egyik legdinamikusabb csapatsport, mégis jóval kevesebb figyelmet kapott a sportanalitikában, mint a labdarúgás vagy a kosárlabda, ahol az adatvezérelt módszerek és a gépi tanulás már széles körben alkalmazottak. Mivel a videóadatok központi szerepet töltenek be a modern sportanalitikában, a gépi tanulási módszerek kiegészíthetik a hagyományos videóelemzést, olyan összefüggések feltárásával, amelyek meghaladják a pusztán emberi szemmel láthatót. A hallgató megismerkedik a kézilabdához kapcsolódó videóalapú sportanalitikával, a tipikus adatformátumokkal, a bevett megközelítésekkel, és új megoldásokat kereshet ebben a folyamatosan fejlődő területen. |
| TMIT2025-205 | |
| Esport analitika a Counter-Strike 2-ben | |
| Kulcsszavak: esport, esport analitika, esports analytics, AI, machine learning, deep learning, data mining, Counter Strike, CS2 | |
Témavezető / oktatók: Toka László
/ Szmida Patrik
| Az esport az elmúlt években robbanásszerű növekedésen ment keresztül, mára már világszerte több tízmilliós nézőközönséget vonz. Míg a hagyományos sportokban az adatelemzés és a mesterséges intelligencia módszerei játékosok és csapatok fejlesztésére már bevett gyakorlatnak számítanak, az esportban ezek alkalmazása napjainkban kezd kibontakozni. Különösen igaz ez a Counter-Strike 2-re, amely napjaink egyik legnépszerűbb e-sport címe. A hallgató feladata lesz, hogy megismerje a mérkőzések során keletkező adatok gyűjtésének és feldolgozásának módszertanát, valamint gépi tanulási technikák segítségével elemezze profi játékosok és csapatok teljesítményét. A hangsúly egy teljes AI-alapú elemzési folyamat felépítésén van, az adat-előkészítéstől a prediktív modellezésig, különös tekintettel a játékosok mozgásmintáinak és szokásainak vizsgálatára. |
| Ipari partner: HUN-REN SZTAKI TMIT2025-220 | |
| Elosztott hálózatbiztonsági csapdarendszer és elemzési funkciók fejlesztése | |
| Kulcsszavak: hálózatbiztonság, honeypot, AI, anomáliadetekció | |
Témavezető / oktatók: Sonkoly Balázs
| A feladat a HunCERT Probe projekt keretében elkészült és folyamatosan fenntartott komplex elosztott hálózatbiztonsági csapdarendszer bővítése, új, elsődlegesen ipari célú képességekkel történő kiegészítése. A feladatnak ki kell terjednie a csapdarendszer dinamikusabb, adaptív működési képességének fejlesztésére, aminek része a dinamikus orkesztrációs lehetőségek vizsgálata is. Ezenkívül további cél a csapdarendszerből érkező eseményadatok fejlett, akár AI eszközökkel támogatott elemzése, trendelemzés, anomáliadetekció, támadói profilok építése és az ehhez szükséges funkciók kidolgozása. |
| TMIT2025-163 | |
| CEX-DEX arbitrázs vizsgálata: tranzakciós adatok elemzése | |
| Kulcsszavak: ethereum, blokklánc, adatfeldolgozás | |
Témavezető / oktatók: Tapolcai János
/ Ladóczki Bence
| A közelmúltban készült egy tanulmány, amely rámutatott arra, hogy az Ethereum kriptovalutában a tranzakciók körülbelül 15%-a arbitrázstevékenységhez köthető. Az arbitrázsrésztvevők gyakran igyekeznek leplezni tevékenységüket, ezért komoly kihívást jelent annak meghatározása, hogy egy adott tranzakció valóban arbitrázshoz kapcsolódik-e. Az új eredmény (15%) meglepően magas, mivel korábban mind a matematikai modellek, mind az empirikus mérések ennél lényegesen alacsonyabb arányt jeleztek. Amennyiben a matematikai (sztochasztikus) modellek jól tükrözik a valóságot, eredményüknek összhangban kell lennie az empirikus mérésekkel. A közelmúltban kidolgoztunk egy új matematikai modellt az arbitrázshaszon becslésére, amely ugyancsak jelentősen magasabb arányt adott, mint a korábbi megközelítések. A hallgató feladata e két megközelítés - az empirikus mérés és az elméleti modell - összehasonlítása lenne. Ehhez részben a mérések reprodukálására, részben azok kiegészítésére van szükség. A mérésekhez használt forráskód nyilvánosan elérhető, ahogyan a tranzakciós adatbázis is. A feladat tehát ezek működésének megértéséből, kisebb módosításából, majd a vizsgálatok újrafuttatásából állna. Elsősorban olyan hallgatók jelentkezését várom, akiket érdekel a kutatás világa, és szívesen szánnak időt elmélyültebb tudományos munkára. A téma kiváló kiindulópont lehet egy izgalmas TDK-dolgozat elkészítéséhez. Az lenne a kérésem, hogy mielőtt jelentkezel olvass bele ebbe a cikkbe: https://arxiv.org/pdf/2507.13023 |
| TMIT2025-165 | |
| Figyeld a blokkláncot - és tweetelj, ha baj van! | |
| Kulcsszavak: ethereum, blokklánc | |
Témavezető / oktatók: Tapolcai János
/ Ladóczki Bence
| A közelmúltban felfedeztünk az ethereum lánc egy sebezhetőségét: https://telex.hu/techtud/2025/07/31/bme-elte-kutatas-ethereum-blokklanc-sebezhetoseg A szabadon hozzáférhető historikus adatok vizsgálata során nem találtunk szisztematikus csalásra utaló nyomokat. Feltételezzük, hogy ha történt is ilyen támadás, az valószínűleg egy konkrét slot megszerzésére irányult, és időben korlátozott volt. Vannak elképzeléseink a lehetséges motivációkról, de ezek tisztázásához praktikus lenne a közösség segítségét kérni. Valós időben sokkal több minden megfigyelhető lenne - izgalmas eredménye lenne az önlabnak egy ilyen támadást "fülön csípni". A hallgató feladata egy olyan webalkalmazás fejlesztése, amely kapcsolódik egy Ethereum blokkláncot szinkronizáló csomóponthoz, lekéri annak metrikáit, és ha RANDAO-manipulációra utaló gyanús eseményt észlel - akár véletlen egybeesés, akár tudatos támadás eredményeként -, automatikusan egy rövid, közérthető tweet formájában közzéteszi, hogy mi történhetett. A cél, hogy az üzenetekre érkező reakciók alapján jobban megértsük az esetleges motivációkat. A projekt során fel kell telepíteni és szinkronizálni egy Ethereum klienst, az eseményeket ki kell nyerni, továbbítani kell egy webszerver felé, tárolni egy adatbázisban, és megjeleníteni egy webes felületen. Emellett automatikusan generált Twitter-üzeneteket is ki kell küldeni. Elsősorban olyan hallgatók jelentkezését várom, akiket érdekel a kutatás világa, és szívesen szánnak időt elmélyültebb tudományos munkára. Előnyt jelent, ha érdeklődsz a webfejlesztés iránt, és van tapasztalatod PHP, MySQL vagy hasonló technológiák használatában. A téma remek kiindulópont lehet egy izgalmas TDK-dolgozathoz, de akár egy későbbi kutatási projekt / doktori alapját is képezheti. Az lenne a kérésem, hogy mielőtt jelentkezel olvass bele ebbe a cikkbe: https://eprint.iacr.org/2025/037.pdf |
| Ipari partner: Ericsson Magyarország TMIT2025-164 | |
| 3- illetve 4-összefüggő gráfok konstrukciója | |
| Kulcsszavak: gráfelmélet | |
Témavezető / oktatók: Tapolcai János
/ Babarczi Péter
| Az elmúlt években több új eredmény született 3- és 4-összefüggő gráfok felépítéséről. Ilyenkor a gráfok olyan G_0,...,G_N sorozatát állítják elő, hogy G_0 egy nevezetes gráf, G_k = G, és minden G_{i+1} úgy keletkezik G_i-ből, hogy a gráfon picit lokálisan változatnak (mint például fülfelbontásnál 2-összfüggő gráfok esetén). A módszer hatékony lehet távközlési hálózatok konfigurálására, amikor a hálózati topológia gráfra számolnák ilyen gráf sorozatot, majd a lokáli változtatásokkal összhangban a hálózat konfigurációját is módosítanánk. A hallgató feladata lenne ezeket az eredményeket megismerni és megvizsgálni hogyan alkalmazhatóak távközlési hálózatok konfigurálására. A téma Lendület pályázatomhoz kapcsolódik. |
| TMIT2025-170 | |
| Mikroarchitektúra alapú Side Channel Analysis - Cache Timing Támadások Implementálása | |
| Kulcsszavak: Raccoon támadás, oldalsáv-csatorna, cache időzítés, TLS 1.2, Diffie-Hellman, rejtett szám probléma, rácsalapú támadás, FLUSH+RELOAD technika, mikroarchitektúrális támadás | |
Témavezető / oktatók: Ladóczki Bence
| A Side Channel Analysis (SCA) egy kriptoanalitikai technika, amely a kriptográfiai algoritmusok implementációjában lévő fizikai tulajdonságokat (időzítés, energiafogyasztás, elektromágneses sugárzás) használja fel titkos információk megszerzésére. A mikroarchitektúra támadások az SCA egy speciális alcsoportja, amely a processzor belső működésének sebezhetőségeit használja ki. Ebben a labor projektben a hallgató a cache memória alapú timing támadásokat fogja megismerni és implementálni, különös figyelmet fordítva a Raccoon támadásra. A Raccoon egy nemrégiben publikált sebezhetőség (CVE-2020-1968), amely a TLS 1.2 protokoll Diffie-Hellman kulcscsere implementációjában lévő sebezhetőséget használja ki session kulcsok megszerzésére. A projekt során a hallgató először megismeri a cache memória működését (L1, L2, L3 szintek), a cache hit/miss mechanizmusokat, valamint azt, hogy ezek időzítési különbségei hogyan használhatók fel kriptoanalitikai célokra, majd elsajátítja a FLUSH+RELOAD technikát, amely lehetővé teszi a cache állapotának megfigyelését és manipulálását. A gyakorlati rész során implementálni kell egy működő Raccoon támadást, amely valós TLS kapcsolatokon keresztül gyűjt időzítés információkat. A támadás során a hallgató chosen ciphertext támadást hajt végre, vizsgálni kell az ASN.1 struktúrákat, és oracle query mechanizmust kell kifejleszteni. Az összegyűjtött side channel adatokat felhasználva Hidden Number Problem (HNP) instance-okat kell készíteni, majd lattice algoritmusokat (BKZ redukció) kell alkalmazni a titkos kulcsok helyreállítására. |
| TMIT2025-171 | |
| DANE Protokoll Megismerése És A Konfigurációs Hibák Elemzése | |
| Kulcsszavak: DANE protokoll, TLS, TLSA rekord, DNSSEC, tanúsítványkezelés, SMTP biztonság, STARTTLS downgrade, DNS alapú hitelesítés, PKI alternatíva, konfigurációs hibaelemzés | |
Témavezető / oktatók: Ladóczki Bence
| A DNS-based Authentication of Named Entities (DANE) egy 2012-ben javasolt internetes biztonsági protokoll, amely a Transport Layer Security (TLS) kapcsolatok biztonságát hivatott növelni azáltal, hogy alternatívát nyújt a hagyományos Certificate Authority (CA) alapú Public Key Infrastructure (PKI) modell helyett vagy mellett. A hagyományos CA-alapú PKI modell nem túl biztonságos: bármely CA tud bármely domain-re tanúsítványt kibocsátani. Számos CA létezik és muszáj megbízni bennük. Ez azonban nem túl jó, számos CA-t feltörtek és hamis tanúsítványokat bocsátottak ki, sőt néhány CA direkt hamis tanúsítványokat bocsát ki. A DANE protokoll kulcsötlete a Domain Name System (DNS) felhasználása. A DANE használatához a domain tulajdonos publikálhatja TLS szerverének tanúsítványát (vagy nyilvános kulcsát) DNS rekordként, úgynevezett TLSA rekordként a DNS szerverére. Ez a TLSA rekord DNS Security Extensions (DNSSEC) aláírással kell, hogy rendelkezzen integritásának garantálása érdekében. A DANE különösen fontos szerepet játszik az SMTP biztonságában, ahol megoldást nyújthat olyan kihívásokra, mint a STARTTLS downgrade támadások és a fogadó hitelesítése. Egy közelmúltbeli tanulmány szerint a DANE deployment jelentősen megnövekedett, több mint 1 millió domain rendelkezik TLSA rekordokkal rendelkező SMTP szerverekkel. Ebben a labor projektben a hallgatónak a DANE protokoll deployment kihívásait és konfigurációs problémáit kell vizsgálnia. A projekt célja megérteni, hogy miért nehéz helyesen telepíteni és menedzselni a DANE-t, különös figyelmet fordítva a TLSA rekordok és a megfelelő tanúsítványok közötti szinkronizálási problémákra. A hallgatónak pillanatképeket kell készítenie DNS rekordokról a .com, .net, .org és .se második szintű domainekről, elemeznie kell a TLSA rekordok és a megfelelő tanúsítványok közötti eltéréseket, és meg kell vizsgálnia, hogy ezek a problémák mennyire elterjedtek. |
| TMIT2025-172 | |
| Deep Learning Alapú PIN Felismerés Rejtett Kézmozgásból - ATM Biztonsági Elemzés | |
| Kulcsszavak: ATM biztonság, PIN felismerés, deep learning, kézmozgás elemzés, shoulder-surfing támadás, gépi tanulás, biometriai elemzés, video analízis, banki biztonság, ellenlépések értékelése, kriptográfiai védelem, személyes azonosítószám, automatizált pénzkiadó, fedett billentyűzet, neurális hálózat, számítógépes látás, biztonsági sebezhetőség, viselkedéselemzés, fizikai biztonság, hitelesítési mechanizmus | |
Témavezető / oktatók: Ladóczki Bence
| Az Automated Teller Machine-ek (ATM-ek) a legszélesebb körben használt rendszerek készpénzfelvételhez. Az Európai Központi Bank jelentése szerint 2019-ben több mint 11 milliárd készpénzfelvételi tranzakció történt európai ATM-eken. A Personal Identification Number-ek (PIN-ek) még mindig a leggyakoribb hitelesítési módszer ezeken az eszközökön. A PIN mechanizmus sebezhetőséget mutat a shoulder-surfing támadásokkal szemben, amelyeket az ATM közelében elhelyezett rejtett kamerák segítségével hajtanak végre. E probléma leküzdésére az emberek megszokták, hogy a gépelő kezüket a másik kezükkel fedik el. Ebben a labor projektben a hallgatónak egy újszerű támadást kell kidolgoznia, amely képes rekonstruálni a PIN-eket olyan áldozatok esetében, akik a gépelő kezüket fedik el. A támadás akkor zajlik, amikor az áldozat egy általános ATM billentyűzettel lép interakcióba és beírja a PIN-jét. A hallgatónak fel kell tételeznie, hogy hozzáféréssel rendelkezik egy ugyanolyan márkájú/típusú ATM PIN padhoz, mint a célpont. Ezt a modellt kell használnia az áldozat által megnyomott számjegyek következtetésére. A támadás sikere egy gondosan kiválasztott deep learning architektúrának köszönhető, amely képes következtetni a PIN-re a gépelő kéz pozíciója és mozgása alapján. A hallgatónak részletes kísérleti elemzést kell végeznie más felhasználók bevonásával. A módszerrel képesnek kell lennie az 5-jegyű PIN-ek kitalálására három kísérleten belül. Felmérést kell készítenie emberek részvételével az emberi pontosság értékelésére, valamint különféle árnyékolási mechanizmusokat kell értékelnie. A projekt során elemezni kell a támadás teljesítményét és javaslatot kell tennie hatékony védekezésekre. |
| TMIT2025-173 | |
| YouTube Kizsákmányoló Monetizációs Módszerek Elemzése | |
| Kulcsszavak: YouTube monetizáció, kizsákmányoló módszerek, tartalomkészítő, fiókvásárlás, mesterséges elköteleződés, tartalom lopás, MCN, affiliate marketing, online fórumok, illegális kereskedelem, platform biztonság, digitális gazdaság, közösségi média, tartalomelemzés, kódkönyv elemzés, adatbányászat, cyberbűnözés, monetizációs visszaélés, csatorna manipuláció, online piactér | |
Témavezető / oktatók: Ladóczki Bence
| A YouTube videómegosztó platform különféle műfajú tartalmakat szolgáltat. Ahogy a platform nézettségi száma és felhasználóbázisa növekszik, mind az egyéni felhasználók, mind a nagyobb cégek felismerték a tartalommonetizáció lehetőségeit. A tartalommonetizáció a YouTube egyik hatalmas pénzkereseti forrása, de léteznek módszerek ezek megkerülésére, amelyek potenciálisan károsak. Ebben a labor projektben a hallgatónak átfogó tanulmányt kell elkészítenie a YouTube kizsákmányoló tartalommonetizációjáról. Először két adathalmazt kell létrehoznia: egyet felhasználói bejegyzésekből fórumokról, amelyek a YouTube monetizációról szólnak, és egyet hirdetési adatokból, amelyek YouTube fiókok vásárlását és eladását vezénylik. A hallgatónak manuális és automatizált elemzést kell végeznie, hogy képet alakítson ki a YouTube-on használt illegális monetizációs kizsákmányolásokról. Azonosítania kell exploitációs technikákat a YouTube-al kapcsolatos fórumokon. Ezek lehetnek: (1) YouTube fiókok illegális kereskedelme, (2) mesterséges csatorna-elköteleződés, (3) tartalmon belüli megtévesztés, (4) tartalom lopás, (5) affiliate fizetések visszatartása, és (6) MCN tartalom lopás. Elemzést kell végeznie a fórum kommentek adathalmazán, meg kell vizsgálnia online fiókvásárlási piactereket, és elemeznie kell az aktív hirdetések attribútumait. Átfogó áttekintést kell nyújtania a különböző kizsákmányoló módszerekről. |
| TMIT2025-174 | |
| Reguláris Kifejezések Denial-of-Service (ReDoS) Sebezhetőségi Elemzése | |
| Kulcsszavak: dinamikus elemzés, algoritmus komplexitás, biztonsági sebezhetőség, string illesztés, exponenciális komplexitás, JavaScript, Python, instrumentáció, performance elemzés, rosszindulatú bemenet, web alkalmazás biztonság | |
Témavezető / oktatók: Ladóczki Bence
| A reguláris kifejezések kényelmes módot nyújtanak összetett string keresési logika implementására. Számos programozási nyelv biztosít interfészt regexp illesztésre. Az implementációk nagyban különböznek képességeikben és futásidő-jellemzőikben. A backtracking illesztők legrosszabb esetben lineáris, polinomiális vagy exponenciális futásidőt mutathatnak a string hosszának függvényében. Az ilyen szuper-lineáris worst-case regexpek Regular Expression Denial-of-Service (ReDoS) támadásnak teszik ki az alkalmazásokat, amikor rosszindulatú támadó kontrollálhatja a bemeneteket. Ebben a labor projektben a hallgatónak meg kell vizsgálnia a ReDoS hatását backtracking motorokban (Java, Python, Perl, Ruby, JavaScript). Értékelnie kell meglévő eszközöket regexp adathalmazon. A hallgatónak fejlesztenie kell egy dinamikus, fuzzer-alapú elemzési rendszert a ReDoS regexpek azonosítására. Különböző adathalmazokon kell értékelnie a rendszert. A JavaScript csomagokban használt reguláris kifejezésekre kell koncentrálni. Az exponenciális komplexitás elemzésére különös figyelmet kell fordítania. |
| TMIT2025-175 | |
| Titkosítási Módok Sebezhetőségei: Malleability Támadások | |
| Kulcsszavak: CBC malleability, kulcs-elkötelezettség hiány, titkosítási sebezhetőségek, bináris futtatható fájlok, authenticated encryption, AES-CBC, AES-GCM, arbitrális kódvégrehajtás, OpenSSL, Linux, Windows, PDF biztonság, DICOM sebezhetőség, kriptográfiai támadások, védelmi mechanizmusok, gyakorlati kriptográfia | |
Témavezető / oktatók: Ladóczki Bence
| A modern kriptográfiai rendszerek biztonságát nemcsak az alkalmazott algoritmusok erőssége határozza meg, hanem azok helyes implementációja és használata is. Ez a laborfeladat két kritikus sebezhetőséget vizsgál: a CBC titkosítási mód manipulálhatóságát és az Authenticated Encryption sémák key commitment hiányát. A CBC malleability támadások lehetővé teszik, hogy a támadó a titkosított bináris futtatható fájlokat úgy módosítsa, hogy a visszafejtés után tetszőleges kód futtatása váljon lehetővé. A kutatások kimutatták, hogy Linux és Windows rendszereken 32-bites és 64-bites végrehajtható fájlok esetében ez a támadás megvalósítható, ha a támadó képes 13-25 bit címet megadni. Az OpenSSL AES-256-CBC implementációk is érintettek. Az Authenticated Encryption sémák key commitment hiánya azt jelenti, hogy ugyanaz a titkosított szöveg több különböző kulcs alatt is helyesen visszafejthető. Ez különösen veszélyes PDF dokumentumok, Windows futtatható fájlok és DICOM orvosi képalkotó fájlok esetében, ahol egy titkosított fájl két teljesen különböző tartalmat rejthet. A feladat célja ezen sebezhetőségek gyakorlati demonstrálása és hatékony védelmi mechanizmusok kidolgozása. A hallgatónak implementálni kell CBC malleability támadást bináris fájlok ellen. Létre kell hozni AES-GCM titkosított tartalmat, amely két különböző kulcs alatt két eltérő érvényes fájlt eredményez, valamint ki kell dolgozni és tesztelni kell megfelelő ellenintézkedéseket. A munka során különös figyelmet kell fordítani a valós alkalmazásokban fellelhető biztonsági kockázatok értékelésére és a gyakorlati megvalósíthatóság vizsgálatára. |
| TMIT2025-176 | |
| RDMA Biztonsági Sebezhetőségek Felhőkörnyezetben | |
| Kulcsszavak: RDMA biztonság, felhő adatközpontok, hardveres sebezhetőségek, fenyegetési modellek, hálózati hitelesítés | |
Témavezető / oktatók: Ladóczki Bence
| A Remote Direct Memory Access (RDMA) technológia népszerűségének növekedése a felhő adatközpontokban új biztonsági kihívásokat vet fel. Az RDMA eredetileg nagy teljesítményű számítástechnikai környezetekhez készült, ahol az alacsony késleltetés és magas átviteli sebesség kritikus. A technológia fő előnye, hogy megkerüli a CPU-alapú szoftver feldolgozást, azonban ez egyben azt is jelenti, hogy a hagyományos védelmi mechanizmusok nem alkalmazhatók teljesítményveszteség nélkül. Az RDMA rendszerek biztonsági problémái gyakran a hardver tervezési hiányosságaiban gyökereznek. Az RNIC három alapvető hitelesítési ellenőrzést végez: a kérésnek létező szerver oldali queue pair számot kell hivatkoznia, érvényes memóriaterületet kell elérnie helyes rkey-jel, és a virtuális memória címnek a célterületen belül kell lennie. A követelmények megsértése esetén a hálózati komponens eldobja a kérést anélkül, hogy továbbadná az alkalmazásnak. A laborfeladat négy támadási modellt vizsgál. Az első modellben a támadó különböző végponton található virtuális gépben vagy konténerben, root jogosultságok nélkül képes rosszindulatú RDMA alkalmazásokat indítani. A második modell kibővíti ezt root jogosultsággal és tetszőleges RDMA csomagok injektálásának képességével. A harmadik esetben támadó és áldozat ugyanazon gépen futnak, ami releváns a hálózati védelmi mechanizmusok szempontjából. A negyedik modell kompromittált RDMA klienst feltételez más gépeken. A feladat célja ezen fenyegetési modellek gyakorlati megértése, a biztonsági sebezhetőségek demonstrálása és hatékony védelmi mechanizmusok kidolgozása RDMA környezetekben. A hallgatónak elemeznie kell a hitelesítési mechanizmusokat, implementálnia kell támadási szcenáriókat különböző fenyegetési modellekben, valamint javasolnia kell olyan védelmi megoldásokat, amelyek minimális teljesítményhatással járnak. |
| TMIT2025-177 | |
| Perceptuális Hash Algoritmusok Adversariális Támadásai | |
| Kulcsszavak: perceptuális hash, adversariális támadások, végponttól végpontig titkosítás, észlelés elkerülése, képmódosítás | |
Témavezető / oktatók: Ladóczki Bence
| A végpont-végpont titkosítás (E2EE) biztosítja a felhasználók számára hogy egy közbeékelődő támadó ne tudja kinyerni az átküldöt adatot. Ez azonban probléma is, hiszen az E2EE megakadályozza az illegális tartalmak észlelését. A tech-cégek, kutatók és kormányok a perceptuális hash-elésen alapuló kliens-oldali szkennelést javasolták alternatívaként. A kliens-oldali szkennelés során a vizuális média aláírása a felhasználó eszközén kerül kiszámításra, majd összehasonlításra az ismert illegális képek adatbázisával. Találat esetén a felhasználó megjelölésre kerül vagy a titkosítatlan tartalom automatikusan megosztásra kerül további felülvizsgálatra. A kis változásokra és transzformációkra robusztus perceptuális hash algoritmusok generálják az aláírásokat. A kutatások azonban kimutatták, hogy ezek a rendszerek rendkívül sebezhetőek bizonyos támadásokkal szemben. Három különböző támadási módszer került azonosításra: egy általános fekete-doboz támadás és két fehér-doboz támadás diszkrét koszinusz transzformáció alapú algoritmusok ellen. A támadások változatos perturbációkat generálnak, ami arra utal, hogy az egyszerű védelmi stratégiák nem hatékonyak. A nagyobb küszöbértékek, amelyek megnehezítenék a támadásokat, valószínűleg naponta több mint egymilliárd kép megjelölését és visszafejtését igényelnék, ami súlyos magánélet-védelmi aggályokat vet fel. A feladat célja a perceptuális hash-elésen alapuló kliens-oldali szkennelési mechanizmusok robusztusságának értékelése kerülő támadásokkal szemben. A hallgatónak implementálnia kell adversariális támadásokat, amelyek minimálisan módosítják a képeket az észlelés elkerülése érdekében, értékelnie kell a jelenlegi rendszerek sebezhetőségeit, és elemezni kell a védelmi mechanizmusok gyakorlati korlátait és magánélet-védelmi implikációit. |
| TMIT2025-178 | |
| Post-kvantum Kriptográfia Implementálása IoT Eszközökön | |
| Kulcsszavak: post-kvantum kriptográfia, IoT eszközök, kriptográfiai társprocesszorok, Kronecker algoritmus, erőforrás-korlátozott rendszerek | |
Témavezető / oktatók: Ladóczki Bence
| Jelenleg több mint 30 milliárd IoT eszköz üzemel világszerte. Ezen eszközök védelme érdekében gyakran publikus kulcsú kriptográfiai primitívekre támaszkodunk, amelyek működése költséges lehet erőforrás-korlátozott IoT eszközökön. Az ilyen műveletek végre hajtására ezek az eszközök gyakran dedikált kriptográfiai coprocesszort tartalmaznak. A kvantumszámítógépek előrehaladásával a publikus kulcsú infrastruktúránk biztonsága veszélybe került. Shor algoritmusa képes lesz az ECC/RSA-ban használt privát kulcsok polinomiális időben történő visszafejtésére. E fenyegetésre való felkészülés érdekében alternatív kriptográfiai algoritmusokra van szükség, ezeket post-kvantum kriptográfiai algoritmusoknak nevezik. Az ilyen algoritmusok szabványosítása érdekében az amerikai NIST 2016-ban pályázatot hirdetett. A beágyazott eszközök esetében a teljesen új publikus kulcsú kriptográfiai algoritmusokra való áttérés több gyakorlati kihívást eredményez. A coprocesszorok tervezése, tesztelése és átállási ideje várhatóan sok évet, ha nem évtizedeket fog átölelni. A feladat célja a Kronecker+ algoritmus részletes teljesítményelemzésének elvégzése, a Kronecker helyettesítés hatékonyságának vizsgálata, valamint a Kronecker+ integrálása a NIST döntős Saber sémába a vezető post-kvantum kriptográfiai sémákban való alkalmazhatóság demonstrálása érdekében. A hallgatónak elemezni kell a jelenlegi kriptográfiai coprocesszorok korlátait, implementálni kell poszt-kvantum algoritmusokat erőforrás-korlátozott környezetben, és értékelni kell az átállás gyakorlati kihívásait. |
| TMIT2025-179 | |
| A Web Cache Deception támadások felderítése és elemzése | |
| Kulcsszavak: Web Cache Deception, WCD, webbiztonság, gyorsítótárazás, sebezhetőség, HTTP fejlécek, tartalom elemzés, automatizálás, felderítés, eszközfejlesztés | |
Témavezető / oktatók: Ladóczki Bence
| A Web Cache Deception (WCD) támadások egyre növekvő biztonsági kockázatot jelentenek a webes alkalmazások számára. A támadások lényege, hogy a támadó ráveszi a webszervert és a gyorsítótárat (cache), hogy egy felhasználói adatokat tartalmazó dinamikus oldalt statikus fájlként, például képként vagy CSS-fájlként gyorsítótárazzon. Ezt követően a támadó egyszerűen hozzáférhet a gyorsítótárazott, bizalmas információkat tartalmazó oldalhoz. A feladat célja egy olyan módszertan és eszköz kidolgozása, amely képes hatékonyan felderíteni a WCD sebezhetőségeket, különösen figyelembe véve a korábbi, markerekre épülő megközelítések korlátait. A projekt során egy új, marker-mentes módszertant kell implementálni, amely a tartalom azonosságának ellenőrzésén és a HTTP válaszfejlécek elemzésén alapul. A megoldásnak képesnek kell lennie a sebezhetőségek felderítésére anélkül, hogy felhasználói fiókot kellene létrehozni a tesztelt weboldalakon, így biztosítva a skálázhatóságot. A projekt főbb lépései a következők lennének: először is irodalomkutatást kellene végezni a WCD támadások elméletéről, a korábbi felderítési módszerekről és azok korlátairól. Másodszor, meg kellene tervezni egy új, marker-mentes felderítési módszertant, amely a HTTP válaszok tartalmát és fejléceit elemzi. Harmadsorban, egy szkriptet vagy alkalmazást kellene kifejleszteni, amely képes automatizáltan végrehajtani a teszteket egy adott weboldalon, HTTP kéréseket küldeni, a válaszokat elemezni és a lehetséges sebezhetőségeket azonosítani. Negyedszer, egy kisebb skálájú vizsgálatot kellene elvégezni a kifejlesztett eszközzel, például az Alexa Top 100 weboldalon. Végül pedig, a talált sebezhetőségek elemzése és az eredmények dokumentálása mellett, részletes technikai dokumentációt kellene készíteni a kidolgozott módszertanról és az implementációról, valamint egy beszámolót a projekt során szerzett tapasztalatokról és eredményekről. |
| TMIT2025-180 | |
| Valós támadások vizsgálata Tor hálózaton | |
| Kulcsszavak: Tor, anonimitás, website fingerprinting, gépi tanulás, hálózatbiztonság | |
Témavezető / oktatók: Ladóczki Bence
| A Tor egy népszerű anonimizáló hálózat, amely napi több millió felhasználó adatvédelmét szolgálja több ezer, önkéntesek által üzemeltetett proxy segítségével. A hálózat célja, hogy elrejtse a kommunikáció forrását és célját, így védve a felhasználókat a megfigyeléstől, nyomkövetéstől és cenzúrától. Azonban a Tor hálózat sincs teljes biztonságban: az egyik legjelentősebb fenyegetés az ún. Website Fingerprinting (WF) támadás, amely során a támadó - csupán a belépési pont forgalmának megfigyelésével - képes lehet következtetni a meglátogatott weboldalakra, ezáltal megtörve az anonimitást. A labor során a hallgató célja annak vizsgálata, hogy a WF támadások mennyire jelentenek valós fenyegetést a Tor hálózat felhasználói számára. A feladat magában foglalja a valódi forgalmi minták gyűjtését (szimulált környezetben, etikus keretek között), különböző támadási modellek implementálását, valamint azok összehasonlítását szintetikus és valós adatok alapján. A hallgató feladata annak eldöntése, hogy a korábban laboratóriumi környezetben tesztelt módszerek mennyire alkalmazhatók a valós világban. A projekt során a hallgató megismeri a Tor működését, a gépi tanulás alapú WF támadásokat, valamint adatgyűjtési és -elemzési módszereket. A feladat kiváló lehetőséget nyújt a hálózatbiztonság, az etikus hackelés és az adatelemzés területén való elmélyülésre. |
| TMIT2025-181 | |
| Kvantumbiztos digitális aláírás és kulcscsere algoritmusok elemzése | |
| Kulcsszavak: posztkvantum kriptográfia, kvantumbiztonság, NIST, szabványosítás, kulcsméret | |
Témavezető / oktatók: Ladóczki Bence
| Az EU egyre aktívabban támogatja a posztkvantum titkosítási algoritmusok kifejlesztését megcélzó projekteket. Sokan attól tartanak, hogy a kvantumszámítógép hamarosan valósággá válik és a hagyományos, például RSA valamint DLP-n alapuló titkosítási eljárások nem lesznek többé biztonságosak. A gyakorlatban azonban még nem igazán alkalmazzák a kvantumbiztos eljárásokat. A labor feladat megvalósítása során a hallgatónak meg kell ismerni a legaktívabban kutatott posztkvantum eljárásokat és fel kell térképezni hogy mely rendszerek és milyen módon kezdték el bevezetni az ilyen jellegű algoritmusokat. Ki kell továbbá arra is térni hogy milyen új problémákat vetnek fel ezek az új algoritmusok. Jól ismert tény, hogy a kvantumbiztos algoritmusok általában vagy lassúak vagy nagy kulcsmérettel dolgoznak. A hallgatónak analízist kell végeznie azzal kapcsolatban, hogy ezek a problémák mely valós környezetekben jelentkezhetnek valódi akadályként és javaslatot kell adni arra hogy a vizsgált rendszerekben hogyan és milyen alternatív megoldásokat lehetne alkalmazni. Figyelemmel kell kísérni a NIST szabványosítási folyamatát is és tárgyalni kell hogy jelenleg az EU-ban milyen jellegű szabványosítási irányok vannak a posztkvantum kriptográfia terén. |
| TMIT2025-182 | |
| Multiplicity Kódok Implementációja Data Availability Sampling Rendszerekben | |
| Kulcsszavak: erasure kódok, polinom elköteleződés, adatelérhetőség mintavételezés, lokális javítás, blockchain skálázhatóság | |
Témavezető / oktatók: Ladóczki Bence
| A Data Availability Sampling (DAS) technológia forradalmi megközelítést kínál a blokkláncok skálázhatóságának javítására. A hagyományos Reed-Solomon kódok helyett a multiplicity kódok használata jelentős előnyöket nyújt a tárolási hatékonyság és hálózati kommunikáció terén. Ezek a polinomok deriváltjait is tárolják, lehetővé téve a lokális javítást kevesebb csomópont lekérdezésével. A projekt célja egy működő multiplicity kód alapú DAS rendszer implementálása Python vagy C++ nyelven. A hallgató feladata a systematic encoding algoritmus megvalósítása bivariáns polinomok és FFT-alapú számítások használatával, valamint a dekódolás és lokális javítás implementálása interpoláció-alapú módszerekkel. Az alapkövetelmények között szerepel egy egyszerű polinom commitment scheme megvalósítása opening proof generálással, míg a haladó szint magában foglalja a teljesítmény optimalizációt, véletlenszerű sampling protokollt és adaptive stratégiákat. A kiváló teljesítményhez elvárható a Reed-Solomon baseline-nal való összehasonlítás és Byzantine fault tolerance tesztelés.Demonstrálja a multiplicity kódok előnyeit a hagyományos megoldásokkal szemben! |
| TMIT2025-160 | |
| Felhőalapú videójátékok | |
| Kulcsszavak: video games, cloud gaming, edge computing, accessibility | |
Témavezető / oktatók: Babarczi Péter
| Az elmúlt években a cloud gaming és az on-line multiplayer videójátékok elterjedése új kihívások elé állítja a kommunikációs hálózatokat. A játék típusától függően a néhány tíz ms alatti válaszidő alapvető követelmény, mely gyakran már a szerverek és a felhőben elérhető GPU-k fizika távolsága miatt is nehezen megvalósítható. További kihívás a felhasználók mobilitása, melyre a hálózatnak dinamikus erőforrás-foglalással kell válaszolnia az 5G edge hálózatban. A hallgató feladata a fenti cloud és az on-line videójátékok hálózati kommunikációja során jelentkező mérnöki problémák közül egy kiválasztása, megismerése és kidolgozása, mely kiterjedhet hálózati forgalom mérésére, dinamikus erőforrás foglaló módszerek kidolgozására, vagy felhőben jelentkező ütemezési feladatokra. Ezen kívül lehetőség van mikrontranzakcióinak gazdasági elemzésére, vagy a videójátékok hozzáférhetőségével (accessiblity) és alternatív irányításával kapcsolatos kutatás végzésére. |
| Ipari partner: Magyar Telekom TMIT2025-166 | |
| Intelligens asszisztensek és komponenseik összehasonlító elemzése és tesztelése | |
| Kulcsszavak: Artificial intelligence, Mesterséges intelligencia, Intelligens asszisztens, Intelligent Assistant, Large Language Models, Speech recognition, speech synthesis, ügyfélszolgálat automatizálás, ChatGPT | |
Témavezető / oktatók: Németh Géza
/ Al-Radhi Mohammed
, Bartalis István Mátyás
, Fegyó Tibor
, Mihajlik Péter
, Zainkó Csaba
| Szinte minden kisebb és nagyobb cég fejleszt vagy kínál intelligens asszisztenst (Apple. Google, Microsoft, Amazon, Meta, ....) . Ezek jellemzően ma már szöveg és beszéd ki- és bemenetet is kezelnek. Főbb elemeik a beszédfelismerő, a nyelvi elemző és generáló (jellemzően ma már nagy nyelvi modell alapú) valamint a gépi szövegfelolvasó komponensek. Ezek van ahol csak integráltan használhatóak, de gyakran elérhetők komponensenként is. Ekkor lehetőség van ezekből építőkocka-szerűen felépíteni egy saját megoldást. Széles körben ismert és elismert, a gyakorlatban is használt tesztelési és értékelési módszerek ma még hiányoznak. A projekt keretében a nemzetközi szereplők rendszerei mellett a hazai megoldások vizsgálatára is sor kerül, mintarendszerek kialakításán keresztül. A résztvevők betekinthetnek a valós felhasználást meghatározó paraméterekbe (felhő - lokális, nyelvek száma, akusztikus környezet, erőforrás igény, stb.). |
| Ipari partner: HungaroControl Zrt. TMIT2025-169 | |
| Légiforgalmi irányítást támogató rendszerelemek fejlesztése | |
| Kulcsszavak: artificial intelligence in air traffic control, speech recognition, speech analysis, nonverbal features of speech, fatigue detection, speech synthesis, automatic alarm systems | |
Témavezető / oktatók: Németh Géza
/ Bartalis István Mátyás
, Fegyó Tibor
, Mihajlik Péter
, Sztahó Dávid
, Zainkó Csaba
| A légiforgalmi irányítás kritikus biztonsági követelményeknek kell megfeleljen. A tevékenységnek sokféle részeleme van Budapesten is. Pl: Telefonos és rádiós beszélgetés magyar és angol nyelven. Kritikus információk azonosítása és azok alapján szükség szerint riasztás(ok) indítása. A feladat keretében a tevékenységhez kapcsolódó (elsősorban beszédtechnológiai) elemek kutatására kerül sor ill. kapcsolódó alkalmazások kidolgozására. Néhány példa: telefonos és rádiós beszélgetések leiratozása, ehhez kapcsolódó adatbázisok létrehozása, beszéd alapján fáradtság érzékelés, információ szolgáltatás gépi felolvasással és/vagy szöveges megjelenítéssel, automatikus munkatárs behívó rendszervészhelyzetekben... A feladat BSc, MSc képzésben is folytatható, TDK dolgozat irányában is folytatható, PhD képzéshez is vezethet. |
| Ipari partner: SpeechTex Kft. TMIT2025-168 | |
| Mennyivel több a beszéd a szövegnél? | |
| Kulcsszavak: NLP, mesterséges intellingecia, Artificial intelligence, beszéd, szöveg, természetes nyelvfeldolgozás | |
Témavezető / oktatók: Németh Géza
/ Al-Radhi Mohammed
, Mihajlik Péter
, Zainkó Csaba
| Az emberi kommunikáció és a nyelvi kifejezés alapja a beszéd, Írni és olvasni jellemzően hat éves kora után tanul meg az ember. Mégis a számítógépes világban a természetes nyelvfeldolgozás fogalma tipikusan szöveg elemzést takar. A projekt keretében megvizsgáljuk, hogy milyen elméleti és objektív paraméterekkel írható le a hangzó beszéd és annak szöveges megfelelője közti különbség. Elemezzük, hogyan lehet ezt a gépi beszédfelismerés és a gépi beszédkeltés színvonalának javítására felhasználni. Az eredményeket demonstrációs alkalmazásokban mutatjuk be. |
| TMIT2025-167 | |
| Hangbank | |
| Kulcsszavak: TTS, gépi szövegfelolvasás, adatgyűjtés és elemzés, beszédtechnológia, UX, HCI, hangbank | |
Témavezető / oktatók: Németh Géza
/ Bartalis István Mátyás
| Sok gyártó esetében gépi szövegfelolvasó (Text-To-Speech, TTS)rendszerek egy-egy (pl. magyar) nyelven csak egyetlen vagy legfeljebb két (egy férfi és egy női) hangon érhetők el. A gyakorlati alkalmazásokat hátráltatja, ha az adott nyelven számos alkalmazás ugyanazt a hangot alkalmazza. Példa erre a beszédsérült emberek esete: furcsa, ha egy kórházban minden beteg ugyanazon a hangon szólalna meg. A projekt keretében egy összetett szerver-alapú alkalmazás valósítandó meg, mely minőségbiztosított módon teszi lehetővé elsősorban magyar nyelven személyre szabott hangfelvételek készítését, ami később (akár automatikusan) lehetővé teszi az adott hangon megszólaló TTS motor generálását. Mind szerver, mind kliens oldali munkára szükség van. A feladat szakdolgozat/diplomaterv/TDK szintig folytatható, jó előkészület PhD tanulmányokra is. |
| TMIT2025-187 | |
| Deep learning alapú voice chatbot | |
| Kulcsszavak: Deep learning, TTS, ASR, NLP, robot | |
Témavezető / oktatók: Zainkó Csaba
| A beszédkommunikáció egyre szélesebb körben elterjed, amelyhez az egyre jobb minőségű deep learninges modellek adják a hátteret. A hallgató feladata, hogy összeállítson egy olyan kommunikációs chatbot-ot, amely az aktuális modelleket felhasználva képes kommunikálni az emberekkel. A munka során lehetőség van megismerni a mély gépi tanulást vagy elmélyíteni az ilyen irányú tudást. A cél, hogy egy működő demonstrációs környezet készüljön el. |
| TMIT2025-188 | |
| Sportmászás elemzés | |
| Kulcsszavak: deeplearning, képelemzés, videóelemzése | |
Témavezető / oktatók: Zainkó Csaba
| A sportmászás egyre népszerűbb tevékenység, különböző mért adatok alapján a sportoló mozgásáról különböző értékeléseket lehet készíteni. A hallgató feladata különböző deeplearninges módszerek/modellek használatával az adatok elemzése, értékelése, tanítások, finomhangolások végzése. Az adatok lehetnek videófelvételekből származtatottak vagy közvetlenül mértek (pl. pulzus). |
| TMIT2025-209 | |
| Biztonsági riasztások videóelemzés alapján | |
| Kulcsszavak: TTS, Videó, DL, LLM | |
Témavezető / oktatók: Zainkó Csaba
| A hallgató feladata, hogy a videó elemezés alapján megállapítsa, hogy az adott egyén veszélyes, vagy nem megengedett helyre kerül, vagy olyan tevékenységet folytat, amely ott abban a formában nem elfogadható. Vegye számításba, hogy a különböző szcenáriókban (pl. sportmászás, otthoni tevékenység, torna, közlekedés) milyen szempontok szerint kell a riasztásokat elvégezni. Riasztás esetén LLM által generált riasztó hangüzenetet készítsen, ezt egy offline rendszer keretében demonstrálja. |
| TMIT2025-224 | |
| Deep learning beszédleiratozás K2/Icefall alapon | |
| Kulcsszavak: deep learning, beszédfelismerés, ASR, gépi tanulás, Python, PyTorch | |
Témavezető / oktatók: Mihajlik Péter
| A történelem legsikeresebb beszédfelismerési keretrendszere (software toolkit-je) alighanem a Kaldi volt, melyre többek között az Apple, Intel, Xiaomi diktálója is épült. A siker jelentős részben a Weighted Finite State Transducer (WFST ~ véges állapotú gépek általánosítása) technológia hatékony integrálásának volt köszönhető - ezzel indult a Google is annak idején. Időközben a mélytanulási keretrendszerek - különösen a PyTorch - rendkívül közkedveltté váltak és a korábbi WFST alapú megoldások háttérbe szorultak. Azonban a Kaldi fejlesztőcsapata nemrégiben előrukkolt a k2 rendszerrel (https://github.com/k2-fsa/k2), mely a PyTorch-ra épül és a mély neuronhálókat a WFST-kel "varratmentesen" integrálja. Az Icefall kész, "state of the art" receptúrákat kínál a k2-höz, így az eredmények reprodukálása könnyű. A feladat a k2/Icefall segítségével hatékony magyar és idegennyelvű beszéd-szöveg átalakítás megvalósítása. A téma TDK-ra, diplomára is továbbvihető. A Python ismerete előny, az angol minimum olvasási szinten szükséges. |
| Ipari partner: SpeechTex Kft. TMIT2025-225 | |
| Többnyelvű beszédfelismerés end-to-end deep learning modellekkel | |
| Kulcsszavak: multilingual, speech recognition, deep learning, NLP | |
Témavezető / oktatók: Mihajlik Péter
| A klasszikus beszédfelismerő rendszerek egy megadott nyelven működnek jól, ahol akár az emberivel összevethető pontosságot is elérhetnek. Azonban a gyakorlati problémáknál elkerülhetetlen másik nyelvű szavak elhangzása, mely számos problémát felvet. Egyrészt, ha az adott (pl. magyar) nyelv hangjaival nagyjából le is fedhető az adott (pl. angol) szó, nem magától értetődő, hogy származtassuk a kiejtését - különösen, ha több ezer ilyen szó rövid idő alatt történő szótárba illesztése a feladat. Azonban natív ejtésmód esetén már a hangképzés is jelentősen különbözik, ami külön akusztikai modellezért tesz szükségessé. A ma nagyon népszerű end-to-end deep learning alapú megközelítést javasoljuk megvizsgálni, ehhez számos szoftver és hardver eszköz és tapasztalat áll rendelkezésre. Gyűjtőtéma révén számos területen (pl. természetes nyelvű szövegfeldolgozás/NLP/, deep learning, Python alapú fejlesztés, kutatás) lehet bekapcsolódni, a téma továbbvihető TDK, szakdolgozat/diplomamunka, PhD irányába. |
| TMIT2025-226 | |
| Low-latency speech-to-text alkalmazás/kutatás | |
| Kulcsszavak: deep learning, low-latency, real-time systems, ASR, speech, Python | |
Témavezető / oktatók: Mihajlik Péter
| A deep learning alapú ún. end-to-end beszédleiratozó rendszerek könnyen alkalmazhatók ma már szinte bármilyen nyelve, rögzített hanganyagokra. Azonban a valós idejű és egyben kis késleltetésű megoldások a legutóbbi időkig várattak magukra. A korszerű attention alapú megközelítések most jutottak el arra a szintre, hogy a nagy (többé-kevésbé) pontosságot megőrizve minimális, élő feliratozást is lehetővé tévő késletetéssel használhatók legyenek. A hallgató feladata a legkorszerűbb, gyakorlatban is alkalmazható megoldások megismerése, alkalmazása és kiértékelése magyar (vagy egyéb megbeszélt) nyelvre. Ajánlott deep learning ASR (Automatic Speech Recognition) toolkitek: WeNet, NVIDIA-NeMo, K2. A feladat folyamatos munkavégzést kíván, a Python és PyTorch ismerete jelentős előnyt jelent. Diplomatervig (sőt akár tovább) is vihető a téma. Angol olvasási készség, linux alapismeretek nehezen nélkülözhetőek. |
| TMIT2025-227 | |
| Conversational AI alkalmazások | |
| Kulcsszavak: conversational AI, speech processing, NVIDIA, python | |
Témavezető / oktatók: Mihajlik Péter
| Magyar hallgatókat is várunk. |
| TMIT2025-228 | |
| Nagy nyelvi modellek és beszédfelismerési modellek integrálása | |
| Kulcsszavak: LLM, deep learning, beszéd-szöveg átalakítás | |
Témavezető / oktatók: Mihajlik Péter
| A természetes beszéd automatikus szöveggé konvertálása még mindig jelentős kihívás, ha a beszélők szétválasztása, az írásjelezés, névelemek tag-elése, az idegen nyelvű kifejezések felismerés és a zajban is nagy pontosság a követelmények között van. Noha a klasszikus/neurális nyelvmodellek alkalmazása alapvetőnek számít ezen a területen, a (nagyon) nagy nyelvi modellek (LLM-ek, pl. GPT-4, ChatGPT, LLAMA, Qwen, stb.) felhasználása egyáltalán nem magától értetődő. A hallgató feladat feltárni a közvetlen, beszéd-szöveg konverziót segítő és az utólagos (pl. korrekciós) LLM alkalmazásokat. A téma diplomatervig - és azon túl is - továbbvihető. |
| Ipari partner: SpeechTex Kft. TMIT2025-229 | |
| Korszerű orvosi diktálórendszer fejlesztése | |
| Kulcsszavak: MR, orvosi diktálás, Automatic Speech Recognition, beszédfelismerés, Natural Language Processing | |
Témavezető / oktatók: Mihajlik Péter
| A beszédfelismerési technológia hatalmasat fejlődött az elmúlt években, azonban ezt nem minden alkalmazás tudta követni. Talán ahol a legnagyobb szükség van a hatékony és pontos diktálásra, az az orvosi terület és ezen belül is kiemelt a nagy szaktudást igénylő, drága diagnosztikai gépekkel dolgozó orvosok munkájának segítése. Az érdeklődő hallgatók számára lehetőség van bekapcsolódni egy, a SOTÉ-n már alkalmazásban lévő orvosi diktálórendszer fejlesztésébe. |
| TMIT2025-230 | |
| Using Multi-speaker TTS for ASR Adaptation | |
| Kulcsszavak: Multi-speaker TTS, ASR, domain adaptation, data augmentation, deep learning, transformer | |
Témavezető / oktatók: Mihajlik Péter
| [EN] Adapting Automatic Speech Recognition (ASR) systems to diverse speakers, accents, and environments is a persistent challenge, particularly when data from underrepresented speaker groups is scarce. Multi-speaker Text-to-Speech (TTS) technology offers a promising solution by synthesizing diverse and controllable speech samples to augment training data and improve ASR performance. The goal of this project is to explore how multi-speaker TTS models can be effectively utilized for ASR adaptation. The student will: * Investigate state-of-the-art TTS models capable of generating speech with varied speaker characteristics (e.g., Tacotron, FastSpeech, VITS, XTTS). *Generate synthetic speech datasets mimicking specific speaker groups, accents, or environments. *Evaluate the impact of these datasets on ASR system performance, focusing on recognition accuracy and robustness to variability. Key tasks include: * Experimenting with TTS models for speaker-specific and multi-speaker dataset generation. * Integrating synthetic datasets into the ASR training pipeline. * Evaluating the adapted ASR system on standard benchmarks and custom test cases. Recommended toolkits: NVIDIA-NeMo, ESPnet, K2, Hugging Face TTS/ASR libraries. Python proficiency and familiarity with deep learning frameworks (PyTorch or TensorFlow) are advantageous. This project is suitable for students interested in speech synthesis, ASR, and the interplay between these fields. It offers opportunities to contribute to cutting-edge research, with potential extensions toward a thesis, conference publication, or advanced applications in multilingual and low-resource ASR systems. |
| TMIT2025-184 | |
| Demencia automatikus felismerése beszéd és szöveg alapon | |
| Kulcsszavak: demencia, dementia, nlp, text, szövegfelismerés, transformer, nyelvfeldolgozása, beszéd | |
Témavezető / oktatók: Sztahó Dávid
/ Jenei Attila Zoltán
, Kiss Gábor
| A demencia napjaink egyik leggyakoribb időskori betegsége. Időbeli, korai felismerése rendkívül fontos az életminőség megtartása miatt. Minél korábban ismerjük fel, annál jobban lehet kezelni. A tünetei megjelennek a heszéd által hordozott nyelvi tartalomban is, amelyek automatikus módszerekkel kinyerhetőek. A hallgató feladata demens betegek által közölt beszéd akusztikai és szöveges tartalmának vizsgálata, és gépi tanulás (mélytanulás) alkalmazása a betegség automatikus felismerésére. Jelentkezés (email, Teams): Sztahó Dávid, sztaho.david@vik.bme.hu |
| Ipari partner: Ericsson Magyarország TMIT2025-185 | |
| Determinisztikus hálózatok integrálása felhő környezetbe | |
| Kulcsszavak: valós idejű alkalmazások, Deterministic Networking, felhő számítástechnika, cloud, Kubernetes | |
Témavezető / oktatók: Maliosz Markosz
/ Máté Miklós
, Moldován István
| Számos területen (pl. az ipar, a gépjármű kommunikáció, az audio/video átvitel) a valós idejű alkalmazások megkövetelik a hálózattól a korlátos késleltetést, kis késleltetés ingadozást és a nagy megbízhatóságot. Az IETF-ben létrejött Deterministic Networking (DetNet) munkacsoport vizsgálja ennek megvalósítási lehetőségeit az IP hálózati rétegben. Ezek a valós idejű alkalmazások a felhő számítástechnika előnyeit (rugalmasság, skálázhatóság és gyors alkalmazás létesítés) kihasználva egy felhő platform infrastruktúráján is futhatnak, ezért a felhő platform hálózatára is ki kell terjeszteni a determinisztikus működést. A megoldandó feladatok kiterjednek a felhőben futó virtualizált alkalmazások számára nagy megbízhatóságú és korlátos késleltetésű determinisztikus IP hálózati megoldás kialakítására, valamit felhő infrastruktúraként a Kubernetes konténer menedzsment platform hálózati megoldásával történő integrációra. Ehhez egy teszt környezetet építünk, amelyben kivitelezhető a technológiák integrációja, és vizsgáljuk, hogy miként lehet a determinisztikus hálózati működést egy konténerekben futó alkalmazás számára elérhetővé tenni, és mindezt a konténer menedzsment rendszer által irányítani. |
| Ipari partner: Ericsson Magyarország TMIT2025-186 | |
| Felhőszolgáltatások kialakítása konténeralapú környezetben | |
| Kulcsszavak: felhő, konténer, Docker, Kubernetes, mikroszolgáltatás architektúra | |
Témavezető / oktatók: Maliosz Markosz
/ Simon Csaba
| A felhő szolgáltatások gyors piacra kerülést, rugalmas kapacitásbővítést és kedvező költségeket nyújtanak. Manapság minden nagyobb alkalmazás rendszer (pl. vállalati alkalmazások, multimédia, távközlés, játék, stb.) fejlesztése és használata gyakorlatilag valamelyik felhő szolgáltatási modellben történik. A számítási és tárolási funkciók működésképtelenek a felhő hálózata nélkül. Felhő alapú infrastruktúrákban manapság a virtuális gépek mellett és azokkal együtt is előszeretettel alkalmaznak konténer technológiákat (pl. Docker, containerd, Kubernetes). A konténerek hordozható környezetet biztosítanak szoftver komponensek, alkalmazások számára. Egy konténerben jellemzően egy-egy komponense fut egy nagyobb rendszernek, minden rész-alkalmazásnak konténert hozunk létre, amelyeket aztán összeszervezünk (pl. adatbázis + alkalmazás + webszerver konténerek). Ennek az elvnek a továbbvitele vezet el a mikroszolgáltatás architektúrához, ahol sok kis szolgáltatás működik együtt. Míg a felhőben virtuálizálva fut a szolgáltatás logikája, vezérlő komponense, sok esetben a fizikai világban vannak a vezérelt az eszközök, ilyen alkalmazási területeink pl.: IoT rendszerek; robotkar, ipari berendezés; önjáró szállítóeszköz vezérlés. A hallgató feladatai: egy adott konténer technológiát és konténer menedzsment rendszert kiválasztva sajátítsa el azok alkalmazását, fejlesszen szolgáltatást a konténer menedzsment rendszer képességeit kihasználva (pl. terheléselosztás, skálázás, automatizálás), vizsgálja meg az alkalmazás komponensek közötti kommunikációs lehetőségeket, optimalizálási lehetőségeket egy adott szolgáltatás megbízható és rugalmas működtetéséhez. A kiírt téma gyűjtőtéma, a konkrét szolgáltatás, alkalmazás egyeztetésére az első oktatási hetekben kerülhet sor. A téma folytatható több féléven keresztül, BSc szakdolgozat, MSc diplomamunka, illetve TDK témaként is tovább vihető. |
| Ipari partner: Ericsson Magyarország TMIT2025-210 | |
| Ipari robotok építése és programozása | |
| Kulcsszavak: robot, 5G, szenzor | |
Témavezető / oktatók: Vidács Attila
/ Fehér Gábor
| A feladat: ipari környezetben bevethető, autonóm, mozgó roboteszköz (AGV) tervezése, megépítése és vezérlése. Az eszköz képes kell legyen egy számára ismeretlen hely feltérképezésére, a térkép segítségével saját helyzetének meghatározására, majd pedig az önálló navigációra (SLAM). A térképezés és navigáció segítésére az eszköz különféle érzékelőket (lidar, kamera, stb.) használ. A cél, hogy az eszköz vezérlését távolról, (a felhőből) oldjuk meg, beleértve a szenzoradatok átvitelét és feldolgozását is. A mozgó eszköz következtében hangsúlyos a nagy megbízhatóságú és kis késleltetésű vezetéknélküli rádiós kommunikációs megoldások (pl. 5G) vizsgálata is. |
| Ipari partner: Ericsson Magyarország TMIT2025-211 | |
| Kooperatív felhő robotika | |
| Kulcsszavak: robot, cloud robotics, ROS. Gazebo | |
Témavezető / oktatók: Vidács Attila
/ Fehér Gábor
| A hallgató feladata együttműködő, intelligens robotok hálózati vezérlési megoldásainak vizsgálata, implementálása, tesztelése mind valós roboton, mind pedig annak virtuális (szimulált) "ikertestvérén". |
| Ipari partner: Ericsson Magyarország TMIT2025-200 | |
| Robotkutya idomítás | |
| Kulcsszavak: Robotkutya, 5G hálózat, Felhőalapú vezérlés, IoT, Mesterséges intelligencia, Gépi tanulás, Robotika, Szenzorvezérlés, Interaktív robotok, AI alapú mozgásvezérlés, Robot tanítás, Programozás, Felhőtechnológia, Okos eszközök, Valós idejű irányítás | |
Témavezető / oktatók: Fehér Gábor
| A hallgató feladata egy létező, 5G hálózaton keresztül felhőből vezérelt robotkutya képességeinek bővítése és új funkciók fejlesztése. A projekt során a robot mozgásmintáinak és érzékelőinek programozása, valamint mesterséges intelligencián alapuló tanulási algoritmusok integrálása történik, amelyek révén a robotkutyának új feladatokat lehet tanítani (pl. tárgyak felismerése, követése, vagy interaktív viselkedés). A projekt kiváló lehetőséget nyújt az IoT, robotika és AI technológiák gyakorlati alkalmazására. Elvárások: Programozási alapismeretek, valamint a felhőtechnológia és hálózati rendszerek alapjainak ismerete. |
| Ipari partner: Ericsson Magyarország TMIT2025-201 | |
| IoT drón építése és vezérlése | |
| Kulcsszavak: IoT, drón, 5G, AI, mesterséges intelligencia, Internet, felhő | |
Témavezető / oktatók: Fehér Gábor
| Az IoT drón esetáben az IoT alapok erős befolyással vannak a drón felépítésére. A hagyományosnak mondható megközelítés szerint, miszerint a drón reülés vezérlője a drónon található és mindent az irányít, az IoT megközelítésben a vezérlő már a drónon kívül kap helyet, mint egy felhő szolgáltatás. Az így kialakított vezérlő a drón összes szenzorának jelét fogadja és valós időben feldolgozza, amihez nagyon gyors hálózati kapcsolat szükséges. Az építés bekapcsolódik egy korábban elkezdett nagyobb ipari projekt munkájba. A konkrét munka a jelenleg építés alatt álló drón képességeinek bővítése, illetve a meglévő drón flotta szoftveres programozása. |
| Ipari partner: Ericsson Magyarország TMIT2025-212 | |
| Robotkar vezérlés ROS2 környezetben | |
| Kulcsszavak: | |
Témavezető / oktatók: Vidács Attila
/ Balogh Marcell
| A hallgató feladata megismerkedni a ROS2 környezettel és a laborban található robot eszközzel. Az alapvető cél a robot mozgatása egy demonstrációs feladat során, ami közös megbeszélés tárgya. |
| Ipari partner: Ericsson Magyarország TMIT2025-213 | |
| ROS2 és Gazebo alapú mobil robot szimuláció | |
| Kulcsszavak: robot, szimuláció, ROS2 | |
Témavezető / oktatók: Vidács Attila
| A feladat célja, hogy a hallgató megismerkedjen a ROS2 és a Gazebo szimulációs környezettel, és egy egyszerű mobil robotot irányítva képes legyen térképet készíteni, útvonalat tervezni és navigációt megvalósítani ütközéselkerüléssel. Részfeladatok: Gazebo és ROS2 környezet telepítése; SLAM algoritmus megismerése; Nav2 csomag telepítése és használata; teszt szimuláció készítése. |
| TMIT2025-202 | |
| Mesterséges intelligencia alapú rendszerek tesztelése | |
| Kulcsszavak: AI, tesztelés, YOLO | |
Témavezető / oktatók: Kovács Gábor
| Az elérhető számítási kapacitás felfutása lehetővé tette mesterséges intelligencia (AI) alapú komponensek használatát (szoftver)rendszerekben. Az ilyen komponensek ember számára megfoghatatlan működése komoly kihívást jelent a befoglaló rendszerek tesztelése szempontjából. A hallgató feladata a témavezető által javasolt szakirodalom tanulmányozása, és az abban javasolt tesztmódszerek alkalmazhatóságának vizsgálata AI komponenst tartalmazó szoftverek esetén. A tesztelendő rendszerbe csomagolt AI komponens lehet például egy képfeldolgozó modellt, amely a népszerű YOLO által készült. |
| TMIT2025-207 | |
| Többségi döntés és ensemble modell készítése LLM kimenetek alapján | |
| Kulcsszavak: nagy nyelvi modellek, LLM, többségi döntés, ensemble modell | |
Témavezető / oktatók: Papp Dávid
| Több modellt kiválasztunk, Mistral, Phi, GLM, Qwen, Llama, stb. Mindegyik modellel megoldunk egy adott feladatot, ami reasoning feladat, azonban az indoklás végén egy jól kategorizálható eredményt ad/kapunk. A cél az egyes modellek eredményeinek javítása: - egyrészt az azonos modell újrafuttatásával, különböző paraméterekkel (https://www.nature.com/articles/s41586-024-07421-0.pdf) - másrészt a különböző modellek eredményein futtatott majority vote-al - harmadrészt a modell outputokat egy összesítő modellnek átadva még a kategória döntéshozás előtt egyesítjük a kimeneteket - negyerészt a kimeneteket beágyazva megnézzük a modellek közti válasz-variancát és ezt beépítjük a döntésbe Hogyan kombináljuk a különböző modellek kimeneteit? - Gu et al 2025(https://arxiv.org/abs/2411.15594): A többségi szavazás teljesít a legjobban az összefoglalás kimenetek értékelésekor - Suzuoki and Hatano 2024 (https://www.techrxiv.org/doi/full/10.36227/techrxiv.171925057.75949684): Többségi szavazás → azt állítják, hogy a többségi szavazás csökkentette a hallucinációkat is - Yang et al. 2025 (https://www.jmir.org/2025/1/e70080): Többségi szavazással kezd (egyenlően súlyozott a modellek között). Leír egy enyhe javulást egy másik megközelítéssel, amely iteratívan frissíti a különböző modell-előrejelzések súlyait az alapján, hogy a modell helyes választ adott-e egy validációs (orvosbiológiai benchmark) adathalmazon. |
| Ipari partner: AITIA International Zrt. TMIT2025-208 | |
| DDoS támadások azonosítása gépi tanulással | |
| Kulcsszavak: DDoS, ML, gépi tanulás, adatközpont, felhőszolgáltatás | |
Témavezető / oktatók: Orosz Péter
/ Skopkó Tamás
| Néhány éve a globális világjárvány miatti lezárások világszerte felgyorsították a vállalatok és intézmények digitális átállását, mivel alkalmazottaik többsége otthonról dolgozott nyilvános vagy privát felhőszolgáltatások segítségével. Ennek megfelelően ezek a szolgáltatások lettek a legújabb generációs DDoS fenyegetések kiemelt célpontjai. Míg a jelenlegi DDoS támadási profilok egyes jellemzői a világjárvány időszaka előtt megjelentek, az elmúlt időszakban érték el jelenlegi összetettségüket. Az újszerű módszerek és eszközök alkalmazása mellett a támadások gyakorisága, mértéke és változékonysága is jelentősen megnövekedett. Az önálló munka során a hallgató egy valós adatközpontból származó DDoS adatbázis felhasználásával kísérletezhet és megvizsgálhatja különböző gépi tanuló algoritmusok hatékonyságát. |
| Ipari partner: AITIA International Zrt. TMIT2025-219 | |
| Felhasználói aktivitás monitorozása 5G hálózatokon eBPF keretrendszerrel | |
| Kulcsszavak: 5G, eBPF, network monitoring, QoS, QoE | |
Témavezető / oktatók: Orosz Péter
| A laboratóriumi projekt célja a felhasználói aktívitás monitorozása 4G és 5G hálózatokon az eBPF (Extended Berkeley Packet Filter) keretrendszer alkalmazásával. A téma során különböző algoritmusokat és módszereket kutatunk és implementálunk a felhasználói forgalom valós idejű elemzésére, így lehetővé téve a felhasználói tevékenységek részletes nyomonkövetését és QoS-QoE metrikák számolását. A projekt során a control plane forgalom segítségével azonosítjuk a potenciális anomáliákat, amelyek segíthetnek a hálózat optimális működésének biztosításában. Végső célunk egy olyan rugalmas és skálázható monitorozási rendszer kifejlesztése, amely hozzájárul a modern mobilhálózatok biztonságának és megbízhatóságának növeléséhez. |
| TMIT2025-215 | |
| Nagy felbontású, több oldalas képek oldalakra vágása | |
| Kulcsszavak: képfeldolgozás, metaadat, metaadatok kinyerése, metaadatok generálása | |
Témavezető / oktatók: Marton József Ernő
| A tudományos szakirodalom és más dokumentumok nagysűrűségű rögzítésére a 20. század derekán elterjedt módszer volt azok Mikrofiche lapokon rögzítése és terjesztése. Ez egy kb. levelezőlap méretű negatív film, amire változó méretű rácsba rendezve egy film-lapon akár 100 vagy még több oldal képe került rögzítésre. Ezek megfelelő felbontású digitalizálásával több száz megapixeles képek keletkeznek. A feladat ennek a képnek a feldolgozása és oldalakra vágása, majd a mai eszközökön jól használható formájú pl. pdf dokumentumra konvertálása és a kapcsolódó metaadat-állományok elkészítése. A feladat része a lehetséges módszerek felderítése, kipróbálása és megoldási javaslat készítése. A munka több féléven keresztül folytatható és akár diplomaterv is készíthető belőle. |
| TMIT2025-221 | |
| Digitalizált dokumentumok automatikus metaadatolása | |
| Kulcsszavak: Digitalizált dokumentum, metaadat, automatikus metaadatolás, dokuemntum-adatbázis | |
Témavezető / oktatók: Marton József Ernő
| Az utóbbi évtizedekben felgyorsult a dokumentumok digitalizálása. Ezen dokumentumok automatikus metaadatolása igen nagy segítség a dokumentumok visszakereésse, adatbázisba töltése során. A feladat különböző digitalizált dokumentumok metaadatainak kinyerése és gépi olvashatóvá tétele, valamint dokumentum-adatbázisba rendezése. |
| Ipari partner: Magyar Államkincstár TMIT2025-216 | |
| Adatok a pályán - sportanalitika új dimenziói | |
| Kulcsszavak: | |
Témavezető / oktatók: Adamis Gusztáv
| A sport a legfontosabb a lényegtelen dolgok között" - ez a mondás napjainkban különösen érvényes. Az élsport hatása messze túlmutat a pályán: gazdasági, technológiai és kulturális szinten is egyre nagyobb szerepet játszik. Jó példája ennek a sportanalitika rohamos fejlődése. A globális piac értéke 2024-ben közel 4,5-4,8 milliárd USD volt, és előrejelzések szerint 2030-ra a többszörösére nőhet, évi 20-22%-os bővüléssel elérve akár 14-24 milliárd USD-t. A sport iránti érdeklődés is növekszik: míg a 2014-es labdarúgó-világbajnoki döntőt körülbelül 1 milliárd ember követte, a 2022-es döntőt már 1,5 milliárd néző látta. Az adatelemzés és a mesterséges intelligencia ma már szerves része a sport világának: valós idejű döntéstámogatás mérkőzések alatt, játékosok mozgásának és teljesítményének nyomon követése szenzorokkal és kamerákkal, valamint prediktív modellek építése statisztikai és gépi tanulási módszerekkel. Ugyanakkor számos nyitott kérdés van: mely bevett edzői megérzések igazolhatók objektív adatokkal? Milyen forrásokból és minőségben érhetőek el a releváns adatok? Hogyan lehet új, eddig rejtett mintázatokat feltárni? A hallgató feladata: - Ismerkedjenek meg a sportban alkalmazott adatformátumokkal (pl. tracking, eseménynaplók, biometrikus adatok, videófelvételek). - Vizsgálják meg a jelenlegi analitikai módszereket, összevetve a hagyományos statisztikai megközelítéseket a gépi tanulás és deep learning technikáival. - Térképezzék fel az adatforrások hozzáférhetőségét és korlátait. - Keressenek olyan újszerű összefüggéseket, amelyek korábban inkább intuícióra épültek, de most adatokkal is alátámaszthatók. |
| TMIT2025-217 | |
| Játék az adatokkal - Sportanalitika a gyakorlatban | |
| Kulcsszavak: | |
Témavezető / oktatók: Pašić Alija
/ Dobreff Gergely
| A sport a legfontosabb a lényegtelen dolgok között" - ez a mondás napjainkban különösen érvényes. Az élsport hatása messze túlmutat a pályán: gazdasági, technológiai és kulturális szinten is egyre nagyobb szerepet játszik. Jó példája ennek a sportanalitika rohamos fejlődése. A globális piac értéke 2024-ben közel 4,5-4,8 milliárd USD volt, és előrejelzések szerint 2030-ra a többszörösére nőhet, évi 20-22%-os bővüléssel elérve akár 14-24 milliárd USD-t. A sport iránti érdeklődés is növekszik: míg a 2014-es labdarúgó-világbajnoki döntőt körülbelül 1 milliárd ember követte, a 2022-es döntőt már 1,5 milliárd néző látta. Az adatelemzés és a mesterséges intelligencia ma már szerves része a sport világának: valós idejű döntéstámogatás mérkőzések alatt, játékosok mozgásának és teljesítményének nyomon követése szenzorokkal és kamerákkal, valamint prediktív modellek építése statisztikai és gépi tanulási módszerekkel. Ugyanakkor számos nyitott kérdés van: mely bevett edzői megérzések igazolhatók objektív adatokkal? Milyen forrásokból és minőségben érhetőek el a releváns adatok? Hogyan lehet új, eddig rejtett mintázatokat feltárni? Hallgató feladata: - Ismerkedjenek meg a sportban alkalmazott adatformátumokkal (pl. tracking, eseménynaplók, biometrikus adatok, videófelvételek). - Vizsgálják meg a jelenlegi analitikai módszereket, összevetve a hagyományos statisztikai megközelítéseket a gépi tanulás és deep learning technikáival. - Térképezzék fel az adatforrások hozzáférhetőségét és korlátait. - Keressenek olyan újszerű összefüggéseket, amelyek korábban inkább intuícióra épültek, de most adatokkal is alátámaszthatók. |
| TMIT2025-218 | |
| GenAI multi-agent rendszerek | |
| Kulcsszavak: | |
Témavezető / oktatók: Pašić Alija
/ Dobreff Gergely
| A generatív mesterséges intelligencia fejlődésének egyik legizgalmasabb területe az autonóm ügynökök világa. Ezek a rendszerek nemcsak önállóan képesek feladatokat megtervezni és végrehajtani, hanem egymással együttműködve is komplex problémák megoldására vállalkoznak. Az utóbbi évek kutatásai rávilágítottak a multi-agent architektúrák előnyeire, ahol specializált ügynökök egy közös célt szolgálnak. A fejlődéshez hozzájárulnak a kialakulóban lévő kommunikációs protokollok és ipari szabványok, amelyek biztosítják az interoperabilitást ügynökök és adatforrások között. Emellett új értékelési keretrendszerek is megjelentek, amelyek már nem pusztán a teljesítményt vagy a pontosságot mérik, hanem a megbízhatóságot, a költséghatékonyságot, a biztonságot és a gyakorlati alkalmazhatóságot is vizsgálják. További kihívást jelent az edge környezetek és elosztott rendszerek használata, ahol egyszerre kell figyelembe venni az energiahatékonyságot, a hálózati környezet sajátosságait és a kontextus-érzékenységet. Hallgató feladata: - Tekintsék át a generatív AI-alapú ügynökök felépítését és a több-ügynökös rendszerek működési modelljeit. - Ismerjék meg a legfrissebb kommunikációs protokollokat, szabványosítási törekvéseket és értékelési módszertanokat. - Elemezzék az edge és elosztott végrehajtás előnyeit és technikai korlátait. - Készítsenek egy működő prototípust, ahol legalább három specializált ügynök közösen old meg egy feladatot (pl. adatok kinyerése, előfeldolgozása és elemzés készítése). |
| Ipari partner: AITIA International Zrt. TMIT2025-222 | |
| Nyelvi modellek képességeinek összehasonlítása | |
| Kulcsszavak: Nagy nyelvi modellek, Kis nyelvi modellek, LLM, SLM, benchmark | |
Témavezető / oktatók: Varga Pál
| Az önálló laboratóriumi feladat célja különféle nyelvi modellek (language models, LMs) képességeinek és teljesítményének vizsgálata. A hallgatónak át kell tekintenie a kis és nagy méretű nyelvi modellek felépítését, jellemzőit és tipikus felhasználási területeit. A munka során benchmark feladatokat kell kiválasztani, amelyek alkalmasak a modellek összehasonlítására (pl. szövegértési tesztek, kódgenerálási feladatok, érvelési képességek vizsgálata). A kiválasztott feladatokat egy erre kialakított kísérleti keretben kell lefuttatni több különböző modellen - és összehasonlítani az eredményeket. Az összehasonlításnak ki kell térnie a teljesítményre, a válaszok minőségére, az erőforrásigényre és a futási sebességre egyaránt. A hallgatónak részletesen dokumentálnia kell a kísérletek menetét és eredményeit, valamint statisztikai módszerekkel is alátámasztani a következtetéseket. A munka során külön figyelmet kell fordítani a kis modellek előnyeire és korlátaira a nagy modellekkel szemben. Emellett értékelni kell, hogy mely feladatokban teljesítenek jól a kisebb modellek, és mely területeken szükséges a nagyobbak használata. A beszámolóban mutassa be a kapcsolódó szakirodalmat és a nyelvi modellek fejlődésének fő irányait. A feladat várható eredménye egy átfogó, összehasonlító elemzés, amely gyakorlati iránymutatást ad a nyelvi modellek kiválasztásához és alkalmazásához különböző feladatokban. |
| TMIT2025-223 | |
| Egyensúlyozó jármű vezérlés pöffös szélben | |
| Kulcsszavak: jármű, vezérlés, egyensúly, segway, önegyensúlyozó, egykerekű, kétkerekű, gépi tanulás, AI, AI generálta AI | |
Témavezető / oktatók: Cinkler Tibor
| Mind több egyensúlyozó jármű illetve egyensúly alapján irányított jármű látható utcáinkon. Célunk egy kocsin egy, kettő és három dimenzióban egyensúlyozni egy speciális fordított ingát, kettős ingát, hármas ingát. A feladat quadcopter drónra is általánosítható. Egyrészt differenciagyenletekkel másrészt gépi tanulással közelítjük a feladatot. Python programozási tapasztalat előnyt jelent. Érdeklődés egyensúlyozó járművek iránt szintén előny, akárcsak bármilyen tapasztalat e terén. A hallgató feladata a nagy nyelvi modellek (pl ChatGPT és Gemini) által generált vezérlők összehasonlítása stabilitás és energiafelhasználás szempontjából. |