BME logo Távközlési és Mesterséges Intelligencia Tanszék
Budapesti Műszaki és Gazdaságtudományi Egyetem -
Villamosmérnöki és Informatikai Kar
TMIT logo

Aktuális Önálló laboratórium, Szakdolgozat, Diplomatervezés témák

Az Önálló laboratórium, Szakdolgozat, Diplomatervezés tárgyakról

Tanszékünkön alapvetően közösen készítjük a kiírásokat az Önálló laboratórium, Szakdolgozat, Diplomatervezés tárgyakra. Ez azt jelenti, hogy a legtöbb témát felvehetik BSc-s és MSc-s hallgatók is, tantárgytól (önlab/szakdolgozat/diplomatervezés), szaktól, szakiránytól/ágazattól függetlenül. Ez úgy lehetséges, hogy sokszor egy téma kellően általános ahhoz, hogy a különböző tárgyat felvevő hallgatók különböző konkrét feladatot végezhessenek az adott témán belül. Néha azonban ez nem lehetséges: ez esetben a konkrét témakiírás egyértelműen rendelkezik, hogy ki választhatja, avagy ki nem választhatja az adott témát.

További információ itt található.

Ez egy kisérleti oldal a témakiírások böngészésének megkönnyítésére. A hivatalos oldal itt található.

Szűrési feltételek
+ A téma tartalmazza
- A téma ne tartalmazza
Oktatók:
- +Adamis Gusztáv
- +Al-Radhi Mohammed
- +Babarczi Péter
- +Balogh Marcell
- +Bartalis István Mátyás
- +Cinkler Tibor
- +Dobreff Gergely
- +Dóka János
- +Fegyó Tibor
- +Fehér Gábor
- +Gulyás András
- +Gyires-Tóth Bálint
- +Heszberger Zalán
- +Jenei Attila Zoltán
- +Kalapos András
- +Kiss Gábor
- +Kiss Richárd
- +Kovács Gábor
- +Ladóczki Bence
- +Lévai Tamás
- +Maliosz Markosz
- +Marton József Ernő
- +Mihajlik Péter
- +Mihályi Balázs
- +Moldován István
- +Máté Miklós
- +Nagy Bálint György
- +Németh Felicián
- +Németh Géza
- +Németh Marcell
- +Orosz Péter
- +Papp Dávid
- +Pašić Alija
- +Pelle István
- +Rétvári Gábor
- +Simon Csaba
- +Skopkó Tamás
- +Sonkoly Balázs
- +Szmida Patrik
- +Sztahó Dávid
- +Szűcs Gábor
- +Tapolcai János
- +Toka László
- +Unyi Dániel
- +Varga Pál
- +Vidács Attila
- +Zainkó Csaba
Ipari Partnerek:
- +AITIA International Zrt.
- +Continental Automotive Hungary Kft.
- +Ericsson Magyarország
- +HUN-REN SZTAKI
- +HungaroControl Zrt.
- +Idomsoft Zrt
- +Magyar Államkincstár
- +Magyar Telekom
- +Nemzeti Adó- és Vámhivatal
- +nincs
- +SpeechTex Kft.
Kulcsszavak: érdekesek / összes
- +5G: 4
- +5G hálózat: 1
- +accessibility: 1
- +adas: 2
- +adat: 2
- +adatbányászat: 2
- +adatelérhetőség mintavételezés: 1
- +adatfeldolgozás: 1
- +adatgyűjtés és elemzés: 1
- +adatközpont: 1
- +adversariális támadások: 1
- +adózás: 1
- +AES-CBC: 1
- +AES-GCM: 1
- +affiliate marketing: 1
- +ai: 13
- +AI alapú mozgásvezérlés: 1
- +AI generálta AI: 1
- +ajánlórendszerek: 1
- +algoritmus komplexitás: 1
- +analitika: 2
- +analytics: 2
- +anomáliadetekció: 1
- +anonimitás: 1
- +AR: 1
- +arbitrális kódvégrehajtás: 1
- +Artificial intelligence: 2
- +artificial intelligence in air traffic control: 1
- +ASR: 4
- +ATM biztonság: 1
- +authenticated encryption: 1
- +automatic alarm systems: 1
- +Automatic Speech Recognition: 1
- +automatikus metaadatolás: 1
- +automatizált pénzkiadó: 1
- +automatizálás: 1
- +autonomous vehicles: 1
- +AWS: 1
- +banki biztonság: 1
- +basketball: 1
- +benchmark: 1
- +beszéd: 2
- +beszéd-szöveg átalakítás: 1
- +beszédfelismerés: 2
- +beszédtechnológia: 1
- +beágyazás: 1
- +big data: 1
- +bináris futtatható fájlok: 1
- +biometriai elemzés: 1
- +biztonsági sebezhetőség: 2
- +blockchain skálázhatóság: 1
- +blokklánc: 2
- +bűnügyi adatok: 1
- +cache időzítés: 1
- +CBC malleability: 1
- +ChatGPT: 1
- +cloud: 1
- +cloud gaming: 2
- +cloud robotics: 1
- +code comprehension: 1
- +computer vision: 1
- +conversational AI: 1
- +Counter Strike: 1
- +CS2: 1
- +csatorna manipuláció: 1
- +cyberbűnözés: 1
- +DANE protokoll: 1
- +data: 1
- +data augmentation: 1
- +data mining: 3
- +DDoS: 1
- +deep learning: 17
- +deeplearning: 1
- +deep neural network: 4
- +demencia: 1
- +dementia: 1
- +Deterministic Networking: 1
- +DICOM sebezhetőség: 1
- +Diffie-Hellman: 1
- +Digitalizált dokumentum: 1
- +digitális gazdaság: 1
- +dinamikus elemzés: 1
- +DL: 1
- +DNS alapú hitelesítés: 1
- +DNSSEC: 1
- +Docker: 1
- +dokuemntum-adatbázis: 1
- +domain adaptation: 1
- +drón: 1
- +Duckietown: 1
- +eBPF: 1
- +edge computing: 1
- +egyensúly: 1
- +egykerekű: 1
- +elemzés: 1
- +ellenlépések értékelése: 1
- +ensemble modell: 1
- +erasure kódok: 1
- +erőforrás-korlátozott rendszerek: 1
- +esport: 2
- +esport analitika: 2
- +esports analytics: 2
- +eszközfejlesztés: 1
- +ethereum: 2
- +exponenciális komplexitás: 1
- +FaaS: 1
- +face attribute recognition: 1
- +fatigue detection: 1
- +federated learning: 1
- +fedett billentyűzet: 1
- +felderítés: 1
- +felhő: 3
- +felhő adatközpontok: 1
- +Felhőalapú vezérlés: 1
- +felhőszolgáltatás: 1
- +felhő számítástechnika: 1
- +Felhőtechnológia: 1
- +fenyegetési modellek: 1
- +FinTech: 1
- +fizikai biztonság: 1
- +fiókvásárlás: 1
- +FLUSH+RELOAD technika: 1
- +football: 1
- +generatív MI: 1
- +GNN: 2
- +gondolkodás: 1
- +Google TensorFlow: 1
- +gráfelmélet: 1
- +gráf neurális hálók: 1
- +gráf neurális hálózat: 1
- +gráf neurális hálózatok: 1
- +gráfok: 1
- +gyakorlati kriptográfia: 1
- +gyorsítótárazás: 1
- +gépi látás: 2
- +gépi szövegfelolvasás: 1
- +gépi tanulás: 10
- +hangbank: 1
- +hardveres sebezhetőségek: 1
- +HCI: 1
- +hitelesítési mechanizmus: 1
- +honeypot: 1
- +HTTP fejlécek: 1
- +hálózatbiztonság: 2
- +hálózati hitelesítés: 1
- +hálózatok: 1
- +hálózattudomány: 1
- +IaC: 1
- +idősorok: 1
- +illegális kereskedelem: 1
- +iMSc: 1
- +instrumentáció: 1
- +intelligencia: 1
- +Intelligens asszisztens: 1
- +Intelligent Assistant: 1
- +Interaktív robotok: 1
- +Internet: 1
- +IoT: 3
- +IoT eszközök: 1
- +JavaScript: 1
- +jármű: 1
- +Kis nyelvi modellek: 1
- +kizsákmányoló módszerek: 1
- +konfigurációs hibaelemzés: 1
- +konténer: 1
- +konvolúciós hálók: 1
- +kosárlabda: 1
- +kreativitás: 1
- +kriptográfiai támadások: 1
- +kriptográfiai társprocesszorok: 1
- +kriptográfiai védelem: 1
- +Kronecker algoritmus: 1
- +Kubernetes: 2
- +kulcs-elkötelezettség hiány: 1
- +kulcsméret: 1
- +kutatás: 1
- +kvantumbiztonság: 1
- +képelemzés: 1
- +képfeldolgozás: 1
- +képmódosítás: 1
- +kétkerekű: 1
- +kézilabda: 1
- +kézmozgás elemzés: 1
- +kódkönyv elemzés: 1
- +közigazgatás: 1
- +közösségi média: 1
- +labdarúgás: 1
- +Large Language Models: 1
- +Linux: 1
- +LLM: 6
- +lokális javítás: 1
- +low-latency: 1
- +machine learning: 3
- +matematikai reprezentáció: 1
- +MCN: 1
- +mesterséges: 1
- +mesterséges elköteleződés: 1
- +mesterséges intelligencia: 4
- +mesterséges intellingecia: 1
- +metaadat: 2
- +metaadatok generálása: 1
- +metaadatok kinyerése: 1
- +MI: 2
- +mikroarchitektúrális támadás: 1
- +mikroszolgáltatás: 1
- +mikroszolgáltatás architektúra: 1
- +ML: 2
- +monetizációs visszaélés: 1
- +MoQ: 1
- +MR: 1
- +Multi-speaker TTS: 1
- +multilingual: 1
- +média: 1
- +médiaátvitel: 1
- +mély neurális háló: 2
- +mély tanulás: 1
- +mélytanulás: 2
- +mély tanulás elmélete: 1
- +nagy nyelvi modellek: 2
- +Natural Language Processing: 1
- +nem-paraméteres gépi tanulás: 1
- +network monitoring: 1
- +neurális hálók: 1
- +neurális hálózat: 2
- +NIST: 1
- +NLP: 4
- +nonverbal features of speech: 1
- +NVIDIA: 1
- +nyelvfeldolgozása: 1
- +Okos eszközök: 1
- +oldalsáv-csatorna: 1
- +online fórumok: 1
- +online gaming: 1
- +online piactér: 1
- +OpenSSL: 1
- +orvosi diktálás: 1
- +PDF biztonság: 1
- +perceptuális hash: 1
- +performance elemzés: 1
- +PIA: 2
- +PIN felismerés: 1
- +PKI alternatíva: 1
- +platform biztonság: 1
- +polinom elköteleződés: 1
- +pontfelhő: 1
- +post-kvantum kriptográfia: 1
- +posztkvantum kriptográfia: 1
- +Programozás: 1
- +pszichológia: 1
- +Python: 4
- +PyTorch: 1
- +QoE: 1
- +QoS: 1
- +QUIC: 1
- +Raccoon támadás: 1
- +RAG: 1
- +RDMA biztonság: 1
- +real-time systems: 1
- +rejtett szám probléma: 1
- +reprezentáció tanulás: 1
- +robot: 4
- +Robotika: 1
- +Robotkutya: 1
- +Robot tanítás: 1
- +ROS. Gazebo: 1
- +ROS2: 1
- +rosszindulatú bemenet: 1
- +rácsalapú támadás: 1
- +sebezhetőség: 1
- +segway: 1
- +self-driving cars: 2
- +serverless: 2
- +shoulder-surfing támadás: 1
- +SLM: 1
- +SMTP biztonság: 1
- +software: 1
- +speech: 1
- +speech analysis: 1
- +speech processing: 1
- +Speech recognition: 3
- +speech synthesis: 2
- +sport: 2
- +STARTTLS downgrade: 1
- +string illesztés: 1
- +szabványosítás: 1
- +szegmentáció: 1
- +szegmentálás: 1
- +szekvenciális adatok modellezése: 1
- +személyes azonosítószám: 1
- +szenzor: 1
- +Szenzorvezérlés: 1
- +szimuláció: 1
- +szociális hálózatok: 1
- +szoftver: 1
- +számítógépes látás: 1
- +szöveg: 1
- +szövegfelismerés: 1
- +tanúsítványkezelés: 1
- +tartalomelemzés: 1
- +tartalom elemzés: 1
- +tartalomkészítő: 1
- +tartalom lopás: 1
- +TDK: 1
- +természetes: 1
- +természetes nyelvfeldolgozás: 1
- +tesztelés: 1
- +text: 1
- +titkosítási sebezhetőségek: 1
- +TLS: 1
- +TLS 1.2: 1
- +TLSA rekord: 1
- +Tor: 1
- +transformer: 2
- +TTS: 3
- +többségi döntés: 1
- +UX: 1
- +valós idejű alkalmazások: 1
- +Valós idejű irányítás: 1
- +vezérlés: 1
- +video analysis: 1
- +video analízis: 1
- +video games: 1
- +Videó: 1
- +videóelemzése: 1
- +viselkedéselemzés: 1
- +VR: 1
- +védelmi mechanizmusok: 1
- +végponttól végpontig titkosítás: 1
- +WCD: 1
- +web alkalmazás biztonság: 1
- +webbiztonság: 1
- +Web Cache Deception: 1
- +website fingerprinting: 1
- +Windows: 1
- +XAI: 1
- +YOLO: 1
- +YouTube monetizáció: 1
- +észlelés elkerülése: 1
- +önegyensúlyozó: 1
- +ügyfélszolgálat automatizálás: 1
Ajánlott tárgyak:
- +vieum821 (Önálló munka 1)
- +vieum871 (Önálló munka 2)
- +vieum921 (Diplomatervezés 1 (Egészségügyi mérnök))
- +vitma345 (Vill., BSc. Önálló laboratórium)
- +vitma387 (Önlab, IVIR szakirány)
- +vitma414 (Szakdolgozat)
- +vitma415 (Szakdolgozat)
- +vitma416 (Szakdolgozat)
- +vitma417 (Szakdolgozat, IVIR szakirány)
- +vitmal01 (Info, BSc, Önálló laboratórium)
- +vitmal03 (Vill.mérn. BSc Önálló laboratórium)
- +vitmal04 (Info, BSc, Önálló laboratórium)
- +vitmm376 (Projekt labor 1)
- +vitmm377 (Diplomatervezés 1 [analytics])
- +vitmm379 (Önálló laboratórium 1)
- +vitmm380 (Önálló laboratórium 2)
- +vitmm381 (Diplomatervezés 1)
- +vitmm382 (Diplomatervezés 2)
- +vitmm388 (Projekt labor 2)
- +vitmm807 (Vill., MSc, Önálló laboratórium 1, Infokommunikációs rendszerek)
- +vitmm855 (Info, MSc, Önálló laboratórium 2, Hálózatok és szolgáltatások)
- +vitmm857 (Vill., MSc, Önálló laboratórium 2, Infokommunikációs rendszerek)
- +vitmm861 (Info, MSc, Önálló laboratórium 2, Médiainformatika)
- +vitmm905 (Diplomatervezés 1. (Info, Hálózatok és szolgáltatások szakirány))
- +vitmm907 (Diplomatervezés 1. (Vill. Infokommunikációs rendszerek szakirány))
- +vitmm911 (Diplomatervezés 1. (Info, Médiainformatika szakirány))
- +vitmml02 (Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
- +vitmml03 (Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
- +vitmml10 (Info, MSc, Önálló laboratórium 1)
- +vitmml11 (Info, MSc, Önálló laboratórium 2)
TMIT2023-245
Idősorok szegmentációja gépi tanuló módszerrel path signature alapú idősor reprezentáció
Kulcsszavak: idősorok, nem-paraméteres gépi tanulás, szegmentáció, matematikai reprezentáció
Témavezető / oktatók: Szűcs Gábor + - / Németh Marcell + -

Az idősoros adatok szegmentációja kiemelkedő fontossággal bír a különböző területeken, mint például a pénzügyi elemzés, egészségügyi monitorozás, vagy az iparban történő folyamatoptimalizáció. A projektmunka célja a felügyelt és nem-paraméteres gépi tanulási módszerek alkalmazásával a komplex idősoros adatok részletekre bontása és szegmentálása meghatározott statisztikai tulajdonság és/vagy nem ismert mögöttes dinamika alapján. Szegmentáció során a cél az adathalmazokat kisebb, jelentős részekre vagy szegmensekre bontani az idősorok struktúrájának és változásainak jobb megértésének érdekében. Szegmentációt alkalmazhatunk például pénzügyi idősorokon az érdekes események vagy trendváltozások azonosítására. A path signature egy olyan matematikai eszköz, amely az idősoros adatokat a mintasorozatok időbeli változásainak struktúráján keresztül írja le. Az signature-ök hierarchikus struktúrával rendelkeznek, ahol az egyes szintek az idősorok egyre magasabb rendű struktúráit írják le. Ezek felhasználásával teszik lehetővé az idősorok bonyolultságának és mintázatainak rugalmas és hatékony kezelését. A hallgató feladata a félév(ek) során a nem felügyelt, path signature alapú idősor szegmentáció irodalmának feldolgozása és state-of-the-art módszereinek megismerése után választott adathalmazokon kutatást végezni a megismert technikák alkalmazhatóságának lehetőségeiről, továbbá feltárni a lehetséges továbbfejlesztési lehetőségeiket. A kutatás fő irányvonala a path signature alapú szegmentációs módszerek továbbfejlesztése, illetve újabb alacsony- és magas-dimenziós mintabeágyazások kutatása, amelyek segítségével hatékonyan csoportosíthatóak az idősoros adatok összetartozó részletei. Tudományos érdeklődés esetén lehetőség van kutatási munkára is, a téma mély, elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel.
TMIT2023-244
Tudományos kutatás mesterséges intelligencia területén
Kulcsszavak: mesterséges intelligencia, mély tanulás elmélete, gépi látás, Google TensorFlow, neurális hálók, konvolúciós hálók, TDK, iMSc
Témavezető / oktatók: Szűcs Gábor + -

Ezt a témát elsősorban olyan tudományos érdeklődésű hallgatóknak ajánljuk, akik szívesen elmélyülnek az elméleti területekbe is, szívesen írnának TDK-t vagy akár nemzetközi publikációt is, illetve azoknak, akik gondolkodnak doktoranduszi pálya lehetőségen. Különböző izgalmas tanszéki tudományos kutatásokba lehet bekapcsolódni a mesterséges intelligencia (MI) területén, mint pl. gépi tanulás, mély neurális hálók, információ visszakeresés, gépi felismerés képeken, mintafelismerés, multimédia tartalmak elemzése, ahol például az egyik nagy kihívás a tartalmakban összefüggések keresése. A hallgató feladata az angol nyelvű szakirodalom megismerése és elméleti részekbe való elmélyülés után új algoritmusok kidolgozásában való részvétel jól elkülöníthető részfeladattal. Választható alkalmazási területek: adat-, szöveg- és multimédiabányászat, mély tanuló rendszerek. A kutatás iMSc és doktorandusz hallgatókkal együtt csoportosan történik egyénre szabott részfeladatokkal. Néhány részfeladat: 1) Aktív tanulás lehetőségeinek matematikai vizsgálata 2) Mély tanuló algoritmusok (főként mély neurális hálók) tudományos kutatása képfeldolgozási feladatoknál 3) Elméleti modellek kidolgozása osztályozásra zajos környezetben 4) Nagy adathalmazokon alapuló előrejelzések. Várjuk az elméleti érdeklődésű hallgatókat, akik szívesen vesznek részt a közös gondolkodásban és TDK munkában.
TMIT2023-246
Gráf beágyazások elavulásának vizsgálata
Kulcsszavak: gráfok, gépi tanulás, neurális hálózat, gráf neurális hálózat, mély tanulás, beágyazás, reprezentáció tanulás, ajánlórendszerek, szociális hálózatok, hálózatok, hálózattudomány
Témavezető / oktatók: Szűcs Gábor + -

A gráf beágyazási algoritmusok rendkívül hasznos eszközt jelentenek több különböző domainben, pl. ajánlórendszerekben, szociális hálóknál, in-silico gyógyszerkutatásban, stb. A projekt célja különböző gráf beágyazási algoritmusok vizsgálata, azok időbeli elavulásának mérése downstream feladatokon.
TMIT2025-206
Tudományos kutatás Gráf Neurális Háló és általános AI témakörökben
Kulcsszavak: AI, kutatás, gráf neurális hálók, mélytanulás
Témavezető / oktatók: Szűcs Gábor + - / Kiss Richárd + -

Gráf Neurális Háló témakör --- A feladat során egy gráf neurális háló alapú ajánlórendszert kell megvalósítani, melyben mesterséges zajt szúrunk be a gráf éleibe, majd zajszűrő módszereket alkalmazunk annak csökkentésére. Fontos vizsgálni, hogy a háló milyen hatékonysággal képes kiszűrni a zajos éleket, és hogyan változik a modell teljesítménye a zaj előtti és utáni állapotban. Az gráfos adathalmazt két részre osztva elemezni kell a 2 rész eloszlását is. Emellett az él mintavételezési stratégiák szerepét is tanulmányozni kell, különös tekintettel arra, hogy a friss élek előnyben részesítése javítja-e az ajánlórendszer tanulási és predikciós képességét a véletlenszerű mintavételezéshez képest. Végül az attention súlyokat is meg kell vizsgálni annak érdekében, hogy feltérképezzük, képesek-e a releváns, zajmentes vagy friss élek erősebb kiemelésére, ami további betekintést nyújt a modell zajkezelő képességébe és működésébe.
Ipari partner: Idomsoft Zrt TMIT2025-154
Bűnügyi adatok elemzése és modellezése
Kulcsszavak: deep neural network, mély neurális háló, gépi tanulás, deep learning, bűnügyi adatok
Témavezető / oktatók: Gyires-Tóth Bálint + - / Unyi Dániel + -

Az MI fejlődése új perspektívát nyit a bűnügyi adatok elemzésére és bűnügyi nyomozások hatékonyságának növelésében. Ennek a projektnek a fókusza az ismeretlen elkövetők keresésére és a sorozat jellegű bűnesetek azonosítására irányul, kiemelve a mélytanulás különböző technikáinak alkalmazását. A modellezés során kiemelt módszerek között szerepelnek az autoenkóder hálózatok, melyek képesek az adatok reprezentációját saját maguk által megtanulni, ezzel segítve a nem triviális mintázatok és kapcsolatok feltárását. Emellett mélytanulás alapú ajánló rendszereket alkalmazunk, amelyek segíthetnek az elkövetői profilképek és az elkövetett bűncselekmények közötti összefüggések feltárásában. A gráf neurális hálózatok használata a bűnesetek közötti összetett kapcsolatokat vizsgálja, különös tekintettel a sorozat jellegű bűnesetek azonosítására. A hallgató feladata a félév során a kapcsolódó irodalmak és eszközök megismerése és feldolgozása, illetve mélytanulás alapú bűnügyi modellek tervezése, kialakítása és tesztelése. A feladat során megfelelő előrehaladás esetén lehetőség van piaci fejlesztéshez való kapcsolódáshoz. A munka a legelterjedtebb, magas szintű deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka előrehaladtával nagyteljesítményű GPU erőforrást biztosítunk. A feladatok megoldása jelentős mennyiségű programozást kíván (Python nyelven). Tudományos érdeklődés esetén lehetőség van kutatási munkára is, a téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintű angoltudás.
TMIT2025-183
Gráf Neurális Hálózatok és alkalmazásaik
Kulcsszavak: gráf neurális hálózatok, deep learning, mélytanulás
Témavezető / oktatók: Gyires-Tóth Bálint + - / Unyi Dániel + -

A mesterséges intelligencia egyik legizgalmasabb területe a Gráf Neurális Hálók (GNN-ek) kutatása és alkalmazása. A gráfokkal bonyolult kapcsolatrendszereket (pl. közösségi hálók, molekulák, térképek/közlekedés) írhatunk le, a GNN-ek pedig képesek ezekből új tudást kinyerni. Elképzelhető feladatok: 1. Magyarázhatóság: miért dönt a neurális háló úgy, ahogy? 2. Skálázhatóság: komplex hálózatok kezelése és hatékony tanítása. 3. Vizualizáció: interaktív eszközök fejlesztése gráfok és reprezentációik bemutatására. 4. GraphRAG: nyelvi modellek és gráf alapú keresés ötvözése. 5. Bioinformatikai alkalmazások: alkalmazás a génszerkesztés területén. A konkrét témát a hallgató saját érdeklődésének megfelelően, közösen határozzuk meg. Elvárások: szorgalmas munkavégzés, angol nyelvtudás, programozási ismeretek. Python és Deep Learning keretrendszerek (PyTorch/TensorFlow) ismerete, TDK és tudományos érdeklődés előnyt jelent.
TMIT2025-153
Deep learning alapú idősor és szekvenciális adat modellezés
Kulcsszavak: deep neural network, mély neurális háló, gépi tanulás, deep learning, szekvenciális adatok modellezése
Témavezető / oktatók: Gyires-Tóth Bálint + -

Számos adat (beszéd; videó; szövegek; emberek, objektumok mozgása; tőzsde hírek és árfolyammozgás; interakciók, stb.) szekvenciális adatstruktúrát követ. Szekvenciális adatok modellezése során három fő kihívással állunk szemben: (1) a figyelembe vett korábbi elemek (receptív mező) méretének a növelése, (2) többskálás modellezés, (3) sokdimenziós adatok modellezése. Szekvenciális adatok modellezésének jelenleg az egyik leghatékonyabb módszere mély tanulás alapon történik. A hallgató feladatat a fenti három tématerület egyikét közösen kiválasztva új típusú megoldások kidolgozása, és ezek alkalmazása adott tématerületen. Feltételek: A munka a legelterjedtebb, magas szintű deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka előrehaladtával nagyteljesítményű GPU erőforrást biztosítunk. A feladatok megoldása jelentős mennyiségű programozást kíván (elsősorban Python-ban). Megfelelő előrehaladás esetén lehetőség van hazai és nemzetközi projektekbe való becsatlakozásra. A téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Legalább fél év deep learning tapasztalat. Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintű angoltudás. Előny: kapcsolódó tárgyban szerzett 4-es vagy 5-ös osztályzat. Tudományos (TDK, cikkek, PhD) érdeklődés.
Ipari partner: Nemzeti Adó- és Vámhivatal TMIT2025-155
Közigazgatási és adózási mintázatok elemzése és modellezése
Kulcsszavak: deep learning, MI, közigazgatás, adózás
Témavezető / oktatók: Gyires-Tóth Bálint + -

A hallgató munkájának célja olyan módszerek és eljárások kidolgozása, melyek segítenek a közigazgatási és adózási adatvagyonban rejlő mintázatok feltárásában és modellezésében fejlett gépi tanulási módszerek segítségével. A fókusz olyan problémák megoldásán van, mint például a csalárd számlázási hálózatok azonosítása, vagy az online pénztárgépek tranzakciós adatainak elemzése, amelyek segítik az adatvezérelt döntéshozatalt. A hallgató először szimulált, mesterségesen generált tesztadatokon dolgozik. Ezen adatok célja a módszerek kipróbálása, kalibrálása, a megközelítések értékelése. Megfelelő előrehaladás, precíz munkavégzés és adatetikai irányelvek betartása esetén lehetőség nyílik anonimizált, valós adatokon való munkára is, szintén ellenőrzött környezetben, az adatkörök szakértőinek támogatásával. A feladat során használt módszerek közé tartoznak többek között: - felügyelt és felügyelet nélküli tanulási technikák (pl. random forest, boosting, autoenkóderek), - anomália detekciós algoritmusok, - idősoros elemzés és előrejelzés, - értelmezhető gépi tanulási módszerek (explainable AI). A hallgató feladata: - kapcsolódó szakirodalom és módszertanok megismerése, - adatfeldolgozás, vizualizáció és előkészítés, - modellek tervezése, fejlesztése és kiértékelése, - eredmények dokumentálása és prezentálása. Elvárások: - középhaladó Python programozási ismeretek, - érdeklődés a gépi tanulás és adatelemzés iránt, - precíz dokumentáció és etikus adatkezelés, - olvasási szintű angol nyelvtudás, - heti rendszerességű munka. A munka szoros együttműködésben zajlik a Nemzeti Adó- és Vámhivatal (NAV) Mesterséges Intelligencia Munkacsoportjával, valós problémák mentén. A téma folytatható TDK dolgozatként, szakdolgozatként vagy MSc diplomamunkaként is, és kutatási irányban akár PhD-témaként is lehet folytatni.
Ipari partner: Continental Automotive Hungary Kft. TMIT2025-157
['PIA'] Mély tanulás önvezető környezetben
Kulcsszavak: deep learning, self-driving cars, Duckietown, adas, PIA
Témavezető / oktatók: Gyires-Tóth Bálint + -

[EN] Developing self-driving vehicles is one of the most challenging tasks in machine learning nowadays. Current supervised learning approaches can achieve state-of-the-art results with an adequate dataset. However, collecting a representative dataset for a self-driving solution is a challenging task. Therefore, the possibility of training the self-driving models in a simulator and applying the trained model in the real-world is a promising approach. The task is to train a deep reinforcement learning or a deep imitation learning agent in the simulator of the Duckietown self-driving environment (https://github.com/duckietown/gym-duckietown), and evaluate its behaviour in both the simulator and the real world.
Ipari partner: Continental Automotive Hungary Kft. TMIT2025-158
[PIA] Magyarázható MI autóipari feladatokra
Kulcsszavak: deep learning, XAI, self-driving cars, ADAS, PIA
Témavezető / oktatók: Gyires-Tóth Bálint + -

A téma a BME VIK és Continental Deep Learning Competence Center együttműködésében létrejött PIA (Professional Intelligence for Automotive) részeként kerül meghirdetésre. A témára magyar és külföldi hallgatókat egyaránt várunk. A téma részletes kiírása angol nyelven érhető el.
Ipari partner: Idomsoft Zrt TMIT2025-159
Arcjellemzők automatikus felismerése arcképfotókon mélytanulással
Kulcsszavak: deep neural network, deep learning, face attribute recognition
Témavezető / oktatók: Gyires-Tóth Bálint + - / Kalapos András + -

A mesterésges intelligencia korszakában az arcfelismerés és az arcjellemzők automatikus azonosítása kulcsfontosságúvá vált számos alkalmazási területen. A feladat elsődleges élja az arcképfotókon található fontos arcjellemzők, például a szem színe, haj színe és típusa, orr típusa, automatikus felismerése mélytanulási technikák segítségével (beleértve konvolúciós és transzformer architektúrák). A feladatban hangsúlyos elem a hierarchikus osztályozás, lesz, amely lehetővé teszi az alacsony szintű jellemzők, például a szemszín vagy hajszín, kategorizálását, majd ezek kombinálását magasabb szintű csoportokba. A mélytanulásnak ezen hierarchikus megközelítése javíthatja a rendszer pontosságát és skálázhatóságát, különösen, ha számos változatos arcjellemzőt kell azonosítani. A feladat során megfelelő előrehaladás esetén lehetőség van piaci fejlesztéshez való kapcsolódáshoz. A munka a legelterjedtebb, magas szintű deep learning keretrendszerek segítségével folyik (pl. TensorFlow, PyTorch, Keras). A hallgatónak a munka előrehaladtával nagyteljesítményű GPU erőforrást biztosítunk. A feladatok megoldása jelentős mennyiségű programozást kíván (Python nyelven). Tudományos érdeklődés esetén lehetőség van kutatási munkára is, a téma elméleti kihívásokat tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Korrekt, egyenletes munkavégzés, proaktívitás, olvasás szintű angoltudás. Előny: "Deep Learning a gyakorlatban Python és LUA alapon" (VITMAV45) tárgyban szerzett 4-es vagy 5-ös osztályzat.
TMIT2025-214
Önvezető járművek környezeti modellezése mélytanulással
Kulcsszavak: deep neural network, deep learning, autonomous vehicles
Témavezető / oktatók: Gyires-Tóth Bálint + - / Kalapos András + -

Az önvezető járművek fejlődésében kulcsfontosságú a környezet pontos és időben történő modellezése. A feladat célja a Waymo nyers szenzoradataiból kiindulva a közlekedési környezet okupanciájának (azaz a különböző térbeli cellák foglaltsági állapotának) és a járművek áramlásának (mozgásirány és sebesség) előrejelzése mélytanulási módszerekkel. A probléma összetett, mivel nemcsak az egyes közlekedési szereplők (autók, gyalogosok, kerékpárosok) aktuális helyzetét kell modellezni, hanem azok jövőbeli mozgását és a teljes tér foglaltsági dinamikáját is. A feladat során a hallgatók különböző, összetett (konvolúciós, transformer, rekurrens) neurális hálózatokkal kísérletezhetnek a probléma tér- és időbeli kihívásának kezelésére. https://waymo.com/open/challenges/2024/occupancy-flow-prediction/
Ipari partner: Ericsson Magyarország TMIT2025-162
Médiaátvitel QUIC felett
Kulcsszavak: média, médiaátvitel, QUIC, MoQ
Témavezető / oktatók: Lévai Tamás + - / Németh Felicián + - , Pelle István + - , Rétvári Gábor + -

A Media over QUIC (MoQ) média tartalmak alacsony késleltetésű továbbítására szolgáló új szabvány. Felhasználási köre kiterjed többek között a live streamingre, játékokra, konferenciahívásokra. Ennek megvalósítására a MoQ publisher-subscriber modellt követ, és tartalomelosztó rendszerekhez (CDN) hasonló architektúrát használ WebTransport vagy pusztán QUIC protokoll felett. A QUIC-nek köszönhetően gyorsabb kapcsolatfelépítést (lásd 0RTT), adaptív torlódáskezelési algoritmusokat, NAT átjárhatóságot, és több kapcsolat összenyalábolásának támogatását nyújtja. A hallgató feladata csatlakozni a tanszéken az Ericsson magyarországi kutatóközpontjával szoros együttműködésben zajló kutatási és fejlesztési projekthez, melynek célja a Media over QUIC megismerése, kapcsolódó prototípusok fejlesztése, teljesítménymérése és kiértékelése.
TMIT2025-192
Emberi alakzatokat tartalmazó pontfelhők szegmentálása
Kulcsszavak: pontfelhő, szegmentálás, mikroszolgáltatás
Témavezető / oktatók: Németh Felicián + - / Lévai Tamás + - , Pelle István + -

Egy nagyobb videokonferencia rendszer részeként egy olyan mikroszolgáltatást készítettünk, mely a bemeneti pontfelhőkön képes kijelölni emberi alakok arcát illetve kezeit. A kialakított szolgáltatás erős korlátokkal rendelkezik mind a teljesítmény (leginkább a futási idő és a detekció pontossága), mind a skálázódás terén. A feladat célja ezen szolgáltatás továbbfejlesztése, problémáinak kezelése. A feladat során lehetőség nyílhat akár a használt detekciós modell cseréjére is megvizsgálva más, nyilvánosan elérhető modelleket, azok teljesítményének elemzésével együtt. A téma kapcsán kérjük, Pelle Istvánt keressék.
Ipari partner: Ericsson Magyarország TMIT2025-161
Forráskód értelmezés AI/ML segítségével
Kulcsszavak: AI, code comprehension, RAG, LLM
Témavezető / oktatók: Rétvári Gábor + - / Lévai Tamás + -

A fejlesztési projekthez csatlakozó programozók számára az egyik legnehezebb feladat az ismeretlen örökölt kódbázis megismerése. Ez jellemzően számos információforrás áttekintését jelenti, mint például a forráskód, a soron belüli megjegyzések, az egység/integrációs tesztek, a dokumentáció, a hibajegyek, a Git repo előzmények, stb. A visszakereséssel kiegészített generálás (Retrieval augmented generation, RAG) egy AI/ML-asszisztens módszertan, amely segítheti ezt a folyamatot: a programozó természetes nyelven tehet fel kérdéseket a kódbázissal kapcsolatban, és egy kódasszisztens természetes nyelven válaszol. A RAG alapja egy beágyazási modell, amely nagydimenziós vektorok segítségével képes reprezentálni a különböző adatdarabokat (kód, dokumentáció stb.), egy vektoradatbázis, amely a vektorok alapján karbantartja és keresi az adatokkal kapcsolatos tartalmakat, valamint egy nagy nyelvi modell (LLM), amely a végső választ generálja. A feladat a RAG megértése, a kapcsolódó szoftvereszközök tanulmányozása (beágyazási modellek, mint például a CodeBERT vagy a code2vec, vektoradatbázisok, mint a Weaviate, és LLM-ek, mint a llama), és egy egyszerű kódasszisztens létrehozása, amely képes megválaszolni egy kódprojekthez kapcsolódó alapvető kérdéseket. A kiemelkedő teljesítményt nyújtó hallgatókat felkérjük, hogy csatlakozzanak a BME-Ericsson kódmegértéssel kapcsolatos kutatási együttműködéséhez.
TMIT2025-189
Generatív MI-vel támogatott IaC
Kulcsszavak: IaC, generatív MI
Témavezető / oktatók: Sonkoly Balázs + - / Pelle István + -

Infrastructure as code (IaC) megoldások használatával felhőalapú alkalmazások kitelepítését, azok infrastruktúrájának létrehozását végezhetjük automatizáltan. A téma célja annak feltérképezése, hogy mely IaC eszközökhöz érhetők el generatív mesterséges intelligenciával támogatott megoldások, melyek lehetővé teszik az IaC fejlesztési lépések bizonyos elemeinek kiváltását emberi nyelven írt promptok segítségével. A téma további célja ezen megoldások képességeinek felderítése, adott esetben azok bővítése. A téma kapcsán kérjük Pelle Istvánnál érdeklődjenek.
TMIT2025-190
Serverless federated learning keretrendszer
Kulcsszavak: serverless, federated learning
Témavezető / oktatók: Sonkoly Balázs + - / Pelle István + -

A federated learning egy olyan gépi tanulási technika, amely lehetővé teszi több eszköz vagy szervezet számára, hogy közösen képezzenek egy megosztott modellt anélkül, hogy megosztanák nyers adataikat. Ez a megközelítés fokozza az adatvédelmet, mivel a bizalmas információk helyben maradnak, miközben továbbra is kihasználható a résztvevő entitások kollektív tudása. A serverless compute szolgáltatások lehetővé teszi a fejlesztők számára, hogy alkalmazásokat építsenek és futtassanak szerverek kezelése nélkül, átadva ezt a felelősséget a felhőszolgáltatónak. Ez a modell az eseményvezérelt végrehajtásra összpontosít, ahol a kód adott események által aktiválódik és automatikusan méreteződik a kereslet függvényében, így téve (költség)hatékonyabbá az alkalmazásokat. Ezen feladat célja a fenti két koncepció kombinálása egy serverless federated learning keretrendszerben. A téma kapcsán kérjük Pelle Istvánnál érdeklődjenek. A témával kapcsolatos kérdésekkel kérjük, hogy Pelle Istvánt keressék.
TMIT2025-191
Késleltetésérzékeny/MI alkalmazások kitelepítése nyílt forráskódú FaaS segítségével
Kulcsszavak: FaaS, serverless
Témavezető / oktatók: Sonkoly Balázs + - / Pelle István + -

A Function as a Service (FaaS) megoldások úgy teszik lehetővé alkalmazáskomponensek kitelepítését, hogy a fejlesztőktől átvállalják a futtatáshoz szükséges infrastruktúra elemek kezelésének feladatait. A legtöbb ilyen megoldás azonban nem kifejezettem késleltetésérzékeny vagy mesterséges intelligencia alkalmazások futtatását célozza. A téma célja nyílt forráskódú FaaS megoldások képességeinek megismerése ilyen alkalmazások futtatására, illetve egy választott FaaS megoldás képességeinek kiterjesztése az adott alkalmazási terültnek megfelelő elemekkel. A témával kapcsolatban kérjük, Pelle Istvánt keressék.
TMIT2025-193
Gyakorlati feladatok készítése Amazon Web Services platformon
Kulcsszavak: AWS
Témavezető / oktatók: Sonkoly Balázs + - / Pelle István + -

A Cloud Native hálózati funkciók fejlesztése (VITMCA12) c. tárgy keretében a hallgatók részben az Amazon Web Services eszközeinek használatával ismerkedhetnek meg. A tárgy gyakorlatai során a hallgatók hozzáférést kapnak az AWS Academy e-learning platformjához is, melyben olyan gyakórlófeladatokat végezhetnek el, melyeket a platform automatikusan képes értékelni. A tárgy oktatói saját feladatokat is kidolgoztak, ezekhez azonban vagy nem érhető el egyáltalán automata kiértékelő rendszer, vagy annak használata kissé körülményes. A témát választó hallgató feladata a következők közül egy vagy több területet érinthet: a már létező kiértékelési automatizmusok felhasználóbarátabbá tétele, az automatikus kiértékeléssel még nem rendelkező feladatokhoz kiértékelő módszer fejlesztése, illetve új feladatok kidolgozása. A témával kapcsolatos kérdésekkel kérjük, hogy Pelle Istvánt keressék.
Ipari partner: Ericsson Magyarország TMIT2025-196
Gráf Neurális Hálók (GNN) Alkalmazása Különböző Területeken
Kulcsszavak: ML, AI, GNN
Témavezető / oktatók: Toka László + - / Rétvári Gábor + - , Sonkoly Balázs + -

A gráf neurális hálók (GNN-ek) napjainkban egyre népszerűbbé válnak különféle területeken, ahol a problémák gráfstruktúrával leírhatók. A projekt célja, hogy a hallgatók megismerkedjenek a GNN-ek alapjaival, majd alkalmazzák ezeket a technikákat különböző területeken, például kódmegértésben, tudásgráfok elemzésében vagy sportanalitikában. A résztvevők választott alkalmazási területen egy konkrét problémát oldanak meg, például a kódfüggőségek modellezését, entitások és relációk feltárását tudásgráfokon, vagy sportteljesítmény előrejelzését gráf alapú csapatkapcsolatok modellezésével. Fő célkitűzések: A GNN-ek elméleti alapjainak megértése és azok implementálása. Egy adott területen alkalmazható GNN-modell tervezése és fejlesztése. Az alkalmazott modell hatékonyságának és eredményeinek kiértékelése valós adatok felhasználásával.
Ipari partner: Ericsson Magyarország TMIT2025-197
MI szoftverfejlesztéshez
Kulcsszavak: MI, AI, szoftver, software, LLM, GNN
Témavezető / oktatók: Toka László + - / Rétvári Gábor + - , Sonkoly Balázs + -

A projekt célja, hogy bemutassa, hogyan segítheti a mesterséges intelligencia a kódmegértést, amely a szoftverfejlesztés egyik alapvető aspektusa. A hallgatók MI-alapú eszközöket és technikákat vizsgálnak meg, amelyek támogatják a meglévő kódbázisok elemzését, hibák azonosítását, dokumentáció készítését és a szoftver karbantarthatóságának javítását. A projekt során fejleszteni fognak egy olyan prototípust, amely megkönnyíti a fejlesztők számára a komplex kódok megértését és elemzését, különös tekintettel a kódszemantika, függőségek és potenciális hibák feltárására. Fő célkitűzések: A mesterséges intelligencia szerepének feltárása a kódmegértés támogatásában. Egy olyan MI-alapú eszköz tervezése és fejlesztése, amely segíti a fejlesztőket a kód megértésében és karbantartásában. Az eszköz hatékonyságának értékelése komplex kódbázisok egyszerűsítésében és hibák feltárásában.
TMIT2025-156
Vizsgálatok a természetes és mesterséges intelligencia peremvidékén
Kulcsszavak: ai, intelligencia, mesterséges, természetes, pszichológia, gondolkodás, kreativitás
Témavezető / oktatók: Gulyás András + - / Heszberger Zalán + -

A mesterséges intelligencia rendre megveri az embert a domain specifikus feladatokban, melyekre pozícionált AI alapú megoldások skálája egyre bővül. Ésszerű feltenni a kérdést, hogy milyen típusú feladatok azok (illetve maradtak-e még ilyenek), amelyekben az emberi intelligencia rövid, illetve középtávon nem látszik helyettesíthetőnek mesterséges megoldással. A félév során átbeszéljük az emberi és mesterséges gondolkodás mechanizmusait és teszteket készítünk olyan esetekre, ahol nem egyértelmű mesterséges intelligencia fölénye. A témára mélyebb érdeklődésű hallgató jelentkezését várjuk, akinek szokása kérdéseken merengeni.
TMIT2025-194
Sportanalitika
Kulcsszavak: labdarúgás, kosárlabda, sport, analitika, adat, adatbányászat, football, basketball, analytics, big data, data mining
Témavezető / oktatók: Toka László + -

Van egy mondás, mely szerint "a sport a legfontosabb a lényegtelen dolgok között". Ezt igazolja az élsport növekvő szerepe, nem csupán szurkolói szemszögből, de a gazdasági megfontolásokat tekintve is. A 2012-es londoni olimpia megnyitóját kb. 900 millió néző követte, míg a 2014-es labdarúgó világbajnokság döntőjét már egymilliárdan látták. A fokozódó érdeklődés egy részről a sport analitika előtérbe kerülésével is együtt jár, kiváltképp a labdarúgás és kosárlabda tekintetében. Jelenleg, még sok a nyitott kérdés, amelyet az emberi intuíció segítségével válaszolunk meg, annak ellenére, hogy rendelkezésre áll a konkrét adathalmaz, amiből az igazság leszűrhető lenne. A hallgató feladata lesz a sportelemzések alapjául szolgáló rögzített adatok formátumainak megismerése, a jelenleg alkalmazott analitikai módszerek felkutatása, illetve újszerű összefüggések keresése.
Ipari partner: Ericsson Magyarország TMIT2025-195
Adatelemzés az okos világban
Kulcsszavak: adat, elemzés, data, analytics, IoT, 5G, FinTech
Témavezető / oktatók: Toka László + - / Gulyás András + -

A jelentkezők - megismerkednek az adatelemzés alapjaival, - felhasználási területek széles skáláján (IoT, 5G, FinTech) kipróbálva azokat. Az adatelemző fogások elsajátítása alapvető szükséggé válik bármilyen területen is helyezkedik el egy mérnök.
TMIT2025-198
Felhő alapú mesterséges intelligencia használata VR játékokban
Kulcsszavak: AI, VR, cloud gaming
Témavezető / oktatók: Sonkoly Balázs + - / Dóka János + - , Nagy Bálint György + -

A virtuális valóság és a mesterséges intelligencia képességei és felhasználási területei robbanásszerűen fejlődnek az elmúlt években. A virtuális valóság egyre népszerűbbé válik a játékiparban és az oktatásban, míg a mesterséges intelligencia használata számos területen elterjedt, mint például az autonóm járművek, az egészségügy, a pénzügyi elemzések és az értékesítési felügyelet. A virtuális valóság és a mesterséges intelligencia összekapcsolása új lehetőségeket teremthet a felhasználók számára. A hallgató feladata létrehozni egy olyan rendszert, amely felhasználja a felhőben futó mai legmodernebb mesterséges intelligenciák tudását, és azokat integrálja egy VR játékba.
Ipari partner: Ericsson Magyarország TMIT2025-199
Felhő alapú AR (Augmented Reality) játékok fejlesztése
Kulcsszavak: AR, felhő, online gaming
Témavezető / oktatók: Sonkoly Balázs + - / Nagy Bálint György + -

A modern felhő platformok és új típusú hálózatok (pl. 5G) szorosan integrált rendszerében számos új, extrém alkalmazás válik megvalósíthatóvá. Ilyenek például az AR/VR alkalmazások, amik a felhő platformok számítási kapacitásával kombinálva sok "elborult" ötlet megvalósítására adnak lehetőséget. A hallgató feladata új AR játék alkalmazások kidolgozásában és implementálásában való aktív részvétel.
TMIT2025-203
Esport analitika
Kulcsszavak: esport, esport analitika, esports analytics, AI, machine learning, deep learning, data mining
Témavezető / oktatók: Toka László + - / Szmida Patrik + -

Az esport az elmúlt években robbanásszerű növekedésen ment keresztül, mára már világszerte több tízmilliós nézőközönséget vonz. Míg a hagyományos sportokban az adatelemzés és a mesterséges intelligencia módszerei játékosok és csapatok fejlesztésére már bevett gyakorlatnak számítanak, az esportban ezek alkalmazása napjainkban kezd kibontakozni. A hallgató feladata lesz, hogy megismerje az esport mérkőzések során keletkező adatok gyűjtésének és feldolgozásának módszertanát, valamint gépi tanulási technikák segítségével elemezze profi játékosok és csapatok teljesítményét. A hangsúly egy teljes AI-alapú elemzési folyamat felépítésén van, az adat-előkészítéstől a prediktív modellezésig.
TMIT2025-204
Kézilabda videóelemzés Gépi Tanulási módszerekkel
Kulcsszavak: sport, kézilabda, analitika, video analysis, machine learning, AI, gépi tanulás, computer vision, gépi látás
Témavezető / oktatók: Toka László + - / Mihályi Balázs + -

A kézilabda az egyik legdinamikusabb csapatsport, mégis jóval kevesebb figyelmet kapott a sportanalitikában, mint a labdarúgás vagy a kosárlabda, ahol az adatvezérelt módszerek és a gépi tanulás már széles körben alkalmazottak. Mivel a videóadatok központi szerepet töltenek be a modern sportanalitikában, a gépi tanulási módszerek kiegészíthetik a hagyományos videóelemzést, olyan összefüggések feltárásával, amelyek meghaladják a pusztán emberi szemmel láthatót. A hallgató megismerkedik a kézilabdához kapcsolódó videóalapú sportanalitikával, a tipikus adatformátumokkal, a bevett megközelítésekkel, és új megoldásokat kereshet ebben a folyamatosan fejlődő területen.
TMIT2025-205
Esport analitika a Counter-Strike 2-ben
Kulcsszavak: esport, esport analitika, esports analytics, AI, machine learning, deep learning, data mining, Counter Strike, CS2
Témavezető / oktatók: Toka László + - / Szmida Patrik + -

Az esport az elmúlt években robbanásszerű növekedésen ment keresztül, mára már világszerte több tízmilliós nézőközönséget vonz. Míg a hagyományos sportokban az adatelemzés és a mesterséges intelligencia módszerei játékosok és csapatok fejlesztésére már bevett gyakorlatnak számítanak, az esportban ezek alkalmazása napjainkban kezd kibontakozni. Különösen igaz ez a Counter-Strike 2-re, amely napjaink egyik legnépszerűbb e-sport címe. A hallgató feladata lesz, hogy megismerje a mérkőzések során keletkező adatok gyűjtésének és feldolgozásának módszertanát, valamint gépi tanulási technikák segítségével elemezze profi játékosok és csapatok teljesítményét. A hangsúly egy teljes AI-alapú elemzési folyamat felépítésén van, az adat-előkészítéstől a prediktív modellezésig, különös tekintettel a játékosok mozgásmintáinak és szokásainak vizsgálatára.
Ipari partner: HUN-REN SZTAKI TMIT2025-220
Elosztott hálózatbiztonsági csapdarendszer és elemzési funkciók fejlesztése
Kulcsszavak: hálózatbiztonság, honeypot, AI, anomáliadetekció
Témavezető / oktatók: Sonkoly Balázs + -

A feladat a HunCERT Probe projekt keretében elkészült és folyamatosan fenntartott komplex elosztott hálózatbiztonsági csapdarendszer bővítése, új, elsődlegesen ipari célú képességekkel történő kiegészítése. A feladatnak ki kell terjednie a csapdarendszer dinamikusabb, adaptív működési képességének fejlesztésére, aminek része a dinamikus orkesztrációs lehetőségek vizsgálata is. Ezenkívül további cél a csapdarendszerből érkező eseményadatok fejlett, akár AI eszközökkel támogatott elemzése, trendelemzés, anomáliadetekció, támadói profilok építése és az ehhez szükséges funkciók kidolgozása.
TMIT2025-163
CEX-DEX arbitrázs vizsgálata: tranzakciós adatok elemzése
Kulcsszavak: ethereum, blokklánc, adatfeldolgozás
Témavezető / oktatók: Tapolcai János + - / Ladóczki Bence + -

A közelmúltban készült egy tanulmány, amely rámutatott arra, hogy az Ethereum kriptovalutában a tranzakciók körülbelül 15%-a arbitrázstevékenységhez köthető. Az arbitrázsrésztvevők gyakran igyekeznek leplezni tevékenységüket, ezért komoly kihívást jelent annak meghatározása, hogy egy adott tranzakció valóban arbitrázshoz kapcsolódik-e. Az új eredmény (15%) meglepően magas, mivel korábban mind a matematikai modellek, mind az empirikus mérések ennél lényegesen alacsonyabb arányt jeleztek. Amennyiben a matematikai (sztochasztikus) modellek jól tükrözik a valóságot, eredményüknek összhangban kell lennie az empirikus mérésekkel. A közelmúltban kidolgoztunk egy új matematikai modellt az arbitrázshaszon becslésére, amely ugyancsak jelentősen magasabb arányt adott, mint a korábbi megközelítések. A hallgató feladata e két megközelítés - az empirikus mérés és az elméleti modell - összehasonlítása lenne. Ehhez részben a mérések reprodukálására, részben azok kiegészítésére van szükség. A mérésekhez használt forráskód nyilvánosan elérhető, ahogyan a tranzakciós adatbázis is. A feladat tehát ezek működésének megértéséből, kisebb módosításából, majd a vizsgálatok újrafuttatásából állna. Elsősorban olyan hallgatók jelentkezését várom, akiket érdekel a kutatás világa, és szívesen szánnak időt elmélyültebb tudományos munkára. A téma kiváló kiindulópont lehet egy izgalmas TDK-dolgozat elkészítéséhez. Az lenne a kérésem, hogy mielőtt jelentkezel olvass bele ebbe a cikkbe: https://arxiv.org/pdf/2507.13023
TMIT2025-165
Figyeld a blokkláncot - és tweetelj, ha baj van!
Kulcsszavak: ethereum, blokklánc
Témavezető / oktatók: Tapolcai János + - / Ladóczki Bence + -

A közelmúltban felfedeztünk az ethereum lánc egy sebezhetőségét: https://telex.hu/techtud/2025/07/31/bme-elte-kutatas-ethereum-blokklanc-sebezhetoseg A szabadon hozzáférhető historikus adatok vizsgálata során nem találtunk szisztematikus csalásra utaló nyomokat. Feltételezzük, hogy ha történt is ilyen támadás, az valószínűleg egy konkrét slot megszerzésére irányult, és időben korlátozott volt. Vannak elképzeléseink a lehetséges motivációkról, de ezek tisztázásához praktikus lenne a közösség segítségét kérni. Valós időben sokkal több minden megfigyelhető lenne - izgalmas eredménye lenne az önlabnak egy ilyen támadást "fülön csípni". A hallgató feladata egy olyan webalkalmazás fejlesztése, amely kapcsolódik egy Ethereum blokkláncot szinkronizáló csomóponthoz, lekéri annak metrikáit, és ha RANDAO-manipulációra utaló gyanús eseményt észlel - akár véletlen egybeesés, akár tudatos támadás eredményeként -, automatikusan egy rövid, közérthető tweet formájában közzéteszi, hogy mi történhetett. A cél, hogy az üzenetekre érkező reakciók alapján jobban megértsük az esetleges motivációkat. A projekt során fel kell telepíteni és szinkronizálni egy Ethereum klienst, az eseményeket ki kell nyerni, továbbítani kell egy webszerver felé, tárolni egy adatbázisban, és megjeleníteni egy webes felületen. Emellett automatikusan generált Twitter-üzeneteket is ki kell küldeni. Elsősorban olyan hallgatók jelentkezését várom, akiket érdekel a kutatás világa, és szívesen szánnak időt elmélyültebb tudományos munkára. Előnyt jelent, ha érdeklődsz a webfejlesztés iránt, és van tapasztalatod PHP, MySQL vagy hasonló technológiák használatában. A téma remek kiindulópont lehet egy izgalmas TDK-dolgozathoz, de akár egy későbbi kutatási projekt / doktori alapját is képezheti. Az lenne a kérésem, hogy mielőtt jelentkezel olvass bele ebbe a cikkbe: https://eprint.iacr.org/2025/037.pdf
Ipari partner: Ericsson Magyarország TMIT2025-164
3- illetve 4-összefüggő gráfok konstrukciója
Kulcsszavak: gráfelmélet
Témavezető / oktatók: Tapolcai János + - / Babarczi Péter + -

Az elmúlt években több új eredmény született 3- és 4-összefüggő gráfok felépítéséről. Ilyenkor a gráfok olyan G_0,...,G_N sorozatát állítják elő, hogy G_0 egy nevezetes gráf, G_k = G, és minden G_{i+1} úgy keletkezik G_i-ből, hogy a gráfon picit lokálisan változatnak (mint például fülfelbontásnál 2-összfüggő gráfok esetén). A módszer hatékony lehet távközlési hálózatok konfigurálására, amikor a hálózati topológia gráfra számolnák ilyen gráf sorozatot, majd a lokáli változtatásokkal összhangban a hálózat konfigurációját is módosítanánk. A hallgató feladata lenne ezeket az eredményeket megismerni és megvizsgálni hogyan alkalmazhatóak távközlési hálózatok konfigurálására. A téma Lendület pályázatomhoz kapcsolódik.
TMIT2025-170
Mikroarchitektúra alapú Side Channel Analysis - Cache Timing Támadások Implementálása
Kulcsszavak: Raccoon támadás, oldalsáv-csatorna, cache időzítés, TLS 1.2, Diffie-Hellman, rejtett szám probléma, rácsalapú támadás, FLUSH+RELOAD technika, mikroarchitektúrális támadás
Témavezető / oktatók: Ladóczki Bence + -

A Side Channel Analysis (SCA) egy kriptoanalitikai technika, amely a kriptográfiai algoritmusok implementációjában lévő fizikai tulajdonságokat (időzítés, energiafogyasztás, elektromágneses sugárzás) használja fel titkos információk megszerzésére. A mikroarchitektúra támadások az SCA egy speciális alcsoportja, amely a processzor belső működésének sebezhetőségeit használja ki. Ebben a labor projektben a hallgató a cache memória alapú timing támadásokat fogja megismerni és implementálni, különös figyelmet fordítva a Raccoon támadásra. A Raccoon egy nemrégiben publikált sebezhetőség (CVE-2020-1968), amely a TLS 1.2 protokoll Diffie-Hellman kulcscsere implementációjában lévő sebezhetőséget használja ki session kulcsok megszerzésére. A projekt során a hallgató először megismeri a cache memória működését (L1, L2, L3 szintek), a cache hit/miss mechanizmusokat, valamint azt, hogy ezek időzítési különbségei hogyan használhatók fel kriptoanalitikai célokra, majd elsajátítja a FLUSH+RELOAD technikát, amely lehetővé teszi a cache állapotának megfigyelését és manipulálását. A gyakorlati rész során implementálni kell egy működő Raccoon támadást, amely valós TLS kapcsolatokon keresztül gyűjt időzítés információkat. A támadás során a hallgató chosen ciphertext támadást hajt végre, vizsgálni kell az ASN.1 struktúrákat, és oracle query mechanizmust kell kifejleszteni. Az összegyűjtött side channel adatokat felhasználva Hidden Number Problem (HNP) instance-okat kell készíteni, majd lattice algoritmusokat (BKZ redukció) kell alkalmazni a titkos kulcsok helyreállítására.
TMIT2025-171
DANE Protokoll Megismerése És A Konfigurációs Hibák Elemzése
Kulcsszavak: DANE protokoll, TLS, TLSA rekord, DNSSEC, tanúsítványkezelés, SMTP biztonság, STARTTLS downgrade, DNS alapú hitelesítés, PKI alternatíva, konfigurációs hibaelemzés
Témavezető / oktatók: Ladóczki Bence + -

A DNS-based Authentication of Named Entities (DANE) egy 2012-ben javasolt internetes biztonsági protokoll, amely a Transport Layer Security (TLS) kapcsolatok biztonságát hivatott növelni azáltal, hogy alternatívát nyújt a hagyományos Certificate Authority (CA) alapú Public Key Infrastructure (PKI) modell helyett vagy mellett. A hagyományos CA-alapú PKI modell nem túl biztonságos: bármely CA tud bármely domain-re tanúsítványt kibocsátani. Számos CA létezik és muszáj megbízni bennük. Ez azonban nem túl jó, számos CA-t feltörtek és hamis tanúsítványokat bocsátottak ki, sőt néhány CA direkt hamis tanúsítványokat bocsát ki. A DANE protokoll kulcsötlete a Domain Name System (DNS) felhasználása. A DANE használatához a domain tulajdonos publikálhatja TLS szerverének tanúsítványát (vagy nyilvános kulcsát) DNS rekordként, úgynevezett TLSA rekordként a DNS szerverére. Ez a TLSA rekord DNS Security Extensions (DNSSEC) aláírással kell, hogy rendelkezzen integritásának garantálása érdekében. A DANE különösen fontos szerepet játszik az SMTP biztonságában, ahol megoldást nyújthat olyan kihívásokra, mint a STARTTLS downgrade támadások és a fogadó hitelesítése. Egy közelmúltbeli tanulmány szerint a DANE deployment jelentősen megnövekedett, több mint 1 millió domain rendelkezik TLSA rekordokkal rendelkező SMTP szerverekkel. Ebben a labor projektben a hallgatónak a DANE protokoll deployment kihívásait és konfigurációs problémáit kell vizsgálnia. A projekt célja megérteni, hogy miért nehéz helyesen telepíteni és menedzselni a DANE-t, különös figyelmet fordítva a TLSA rekordok és a megfelelő tanúsítványok közötti szinkronizálási problémákra. A hallgatónak pillanatképeket kell készítenie DNS rekordokról a .com, .net, .org és .se második szintű domainekről, elemeznie kell a TLSA rekordok és a megfelelő tanúsítványok közötti eltéréseket, és meg kell vizsgálnia, hogy ezek a problémák mennyire elterjedtek.
TMIT2025-172
Deep Learning Alapú PIN Felismerés Rejtett Kézmozgásból - ATM Biztonsági Elemzés
Kulcsszavak: ATM biztonság, PIN felismerés, deep learning, kézmozgás elemzés, shoulder-surfing támadás, gépi tanulás, biometriai elemzés, video analízis, banki biztonság, ellenlépések értékelése, kriptográfiai védelem, személyes azonosítószám, automatizált pénzkiadó, fedett billentyűzet, neurális hálózat, számítógépes látás, biztonsági sebezhetőség, viselkedéselemzés, fizikai biztonság, hitelesítési mechanizmus
Témavezető / oktatók: Ladóczki Bence + -

Az Automated Teller Machine-ek (ATM-ek) a legszélesebb körben használt rendszerek készpénzfelvételhez. Az Európai Központi Bank jelentése szerint 2019-ben több mint 11 milliárd készpénzfelvételi tranzakció történt európai ATM-eken. A Personal Identification Number-ek (PIN-ek) még mindig a leggyakoribb hitelesítési módszer ezeken az eszközökön. A PIN mechanizmus sebezhetőséget mutat a shoulder-surfing támadásokkal szemben, amelyeket az ATM közelében elhelyezett rejtett kamerák segítségével hajtanak végre. E probléma leküzdésére az emberek megszokták, hogy a gépelő kezüket a másik kezükkel fedik el. Ebben a labor projektben a hallgatónak egy újszerű támadást kell kidolgoznia, amely képes rekonstruálni a PIN-eket olyan áldozatok esetében, akik a gépelő kezüket fedik el. A támadás akkor zajlik, amikor az áldozat egy általános ATM billentyűzettel lép interakcióba és beírja a PIN-jét. A hallgatónak fel kell tételeznie, hogy hozzáféréssel rendelkezik egy ugyanolyan márkájú/típusú ATM PIN padhoz, mint a célpont. Ezt a modellt kell használnia az áldozat által megnyomott számjegyek következtetésére. A támadás sikere egy gondosan kiválasztott deep learning architektúrának köszönhető, amely képes következtetni a PIN-re a gépelő kéz pozíciója és mozgása alapján. A hallgatónak részletes kísérleti elemzést kell végeznie más felhasználók bevonásával. A módszerrel képesnek kell lennie az 5-jegyű PIN-ek kitalálására három kísérleten belül. Felmérést kell készítenie emberek részvételével az emberi pontosság értékelésére, valamint különféle árnyékolási mechanizmusokat kell értékelnie. A projekt során elemezni kell a támadás teljesítményét és javaslatot kell tennie hatékony védekezésekre.
TMIT2025-173
YouTube Kizsákmányoló Monetizációs Módszerek Elemzése
Kulcsszavak: YouTube monetizáció, kizsákmányoló módszerek, tartalomkészítő, fiókvásárlás, mesterséges elköteleződés, tartalom lopás, MCN, affiliate marketing, online fórumok, illegális kereskedelem, platform biztonság, digitális gazdaság, közösségi média, tartalomelemzés, kódkönyv elemzés, adatbányászat, cyberbűnözés, monetizációs visszaélés, csatorna manipuláció, online piactér
Témavezető / oktatók: Ladóczki Bence + -

A YouTube videómegosztó platform különféle műfajú tartalmakat szolgáltat. Ahogy a platform nézettségi száma és felhasználóbázisa növekszik, mind az egyéni felhasználók, mind a nagyobb cégek felismerték a tartalommonetizáció lehetőségeit. A tartalommonetizáció a YouTube egyik hatalmas pénzkereseti forrása, de léteznek módszerek ezek megkerülésére, amelyek potenciálisan károsak. Ebben a labor projektben a hallgatónak átfogó tanulmányt kell elkészítenie a YouTube kizsákmányoló tartalommonetizációjáról. Először két adathalmazt kell létrehoznia: egyet felhasználói bejegyzésekből fórumokról, amelyek a YouTube monetizációról szólnak, és egyet hirdetési adatokból, amelyek YouTube fiókok vásárlását és eladását vezénylik. A hallgatónak manuális és automatizált elemzést kell végeznie, hogy képet alakítson ki a YouTube-on használt illegális monetizációs kizsákmányolásokról. Azonosítania kell exploitációs technikákat a YouTube-al kapcsolatos fórumokon. Ezek lehetnek: (1) YouTube fiókok illegális kereskedelme, (2) mesterséges csatorna-elköteleződés, (3) tartalmon belüli megtévesztés, (4) tartalom lopás, (5) affiliate fizetések visszatartása, és (6) MCN tartalom lopás. Elemzést kell végeznie a fórum kommentek adathalmazán, meg kell vizsgálnia online fiókvásárlási piactereket, és elemeznie kell az aktív hirdetések attribútumait. Átfogó áttekintést kell nyújtania a különböző kizsákmányoló módszerekről.
TMIT2025-174
Reguláris Kifejezések Denial-of-Service (ReDoS) Sebezhetőségi Elemzése
Kulcsszavak: dinamikus elemzés, algoritmus komplexitás, biztonsági sebezhetőség, string illesztés, exponenciális komplexitás, JavaScript, Python, instrumentáció, performance elemzés, rosszindulatú bemenet, web alkalmazás biztonság
Témavezető / oktatók: Ladóczki Bence + -

A reguláris kifejezések kényelmes módot nyújtanak összetett string keresési logika implementására. Számos programozási nyelv biztosít interfészt regexp illesztésre. Az implementációk nagyban különböznek képességeikben és futásidő-jellemzőikben. A backtracking illesztők legrosszabb esetben lineáris, polinomiális vagy exponenciális futásidőt mutathatnak a string hosszának függvényében. Az ilyen szuper-lineáris worst-case regexpek Regular Expression Denial-of-Service (ReDoS) támadásnak teszik ki az alkalmazásokat, amikor rosszindulatú támadó kontrollálhatja a bemeneteket. Ebben a labor projektben a hallgatónak meg kell vizsgálnia a ReDoS hatását backtracking motorokban (Java, Python, Perl, Ruby, JavaScript). Értékelnie kell meglévő eszközöket regexp adathalmazon. A hallgatónak fejlesztenie kell egy dinamikus, fuzzer-alapú elemzési rendszert a ReDoS regexpek azonosítására. Különböző adathalmazokon kell értékelnie a rendszert. A JavaScript csomagokban használt reguláris kifejezésekre kell koncentrálni. Az exponenciális komplexitás elemzésére különös figyelmet kell fordítania.
TMIT2025-175
Titkosítási Módok Sebezhetőségei: Malleability Támadások
Kulcsszavak: CBC malleability, kulcs-elkötelezettség hiány, titkosítási sebezhetőségek, bináris futtatható fájlok, authenticated encryption, AES-CBC, AES-GCM, arbitrális kódvégrehajtás, OpenSSL, Linux, Windows, PDF biztonság, DICOM sebezhetőség, kriptográfiai támadások, védelmi mechanizmusok, gyakorlati kriptográfia
Témavezető / oktatók: Ladóczki Bence + -

A modern kriptográfiai rendszerek biztonságát nemcsak az alkalmazott algoritmusok erőssége határozza meg, hanem azok helyes implementációja és használata is. Ez a laborfeladat két kritikus sebezhetőséget vizsgál: a CBC titkosítási mód manipulálhatóságát és az Authenticated Encryption sémák key commitment hiányát. A CBC malleability támadások lehetővé teszik, hogy a támadó a titkosított bináris futtatható fájlokat úgy módosítsa, hogy a visszafejtés után tetszőleges kód futtatása váljon lehetővé. A kutatások kimutatták, hogy Linux és Windows rendszereken 32-bites és 64-bites végrehajtható fájlok esetében ez a támadás megvalósítható, ha a támadó képes 13-25 bit címet megadni. Az OpenSSL AES-256-CBC implementációk is érintettek. Az Authenticated Encryption sémák key commitment hiánya azt jelenti, hogy ugyanaz a titkosított szöveg több különböző kulcs alatt is helyesen visszafejthető. Ez különösen veszélyes PDF dokumentumok, Windows futtatható fájlok és DICOM orvosi képalkotó fájlok esetében, ahol egy titkosított fájl két teljesen különböző tartalmat rejthet. A feladat célja ezen sebezhetőségek gyakorlati demonstrálása és hatékony védelmi mechanizmusok kidolgozása. A hallgatónak implementálni kell CBC malleability támadást bináris fájlok ellen. Létre kell hozni AES-GCM titkosított tartalmat, amely két különböző kulcs alatt két eltérő érvényes fájlt eredményez, valamint ki kell dolgozni és tesztelni kell megfelelő ellenintézkedéseket. A munka során különös figyelmet kell fordítani a valós alkalmazásokban fellelhető biztonsági kockázatok értékelésére és a gyakorlati megvalósíthatóság vizsgálatára.
TMIT2025-176
RDMA Biztonsági Sebezhetőségek Felhőkörnyezetben
Kulcsszavak: RDMA biztonság, felhő adatközpontok, hardveres sebezhetőségek, fenyegetési modellek, hálózati hitelesítés
Témavezető / oktatók: Ladóczki Bence + -

A Remote Direct Memory Access (RDMA) technológia népszerűségének növekedése a felhő adatközpontokban új biztonsági kihívásokat vet fel. Az RDMA eredetileg nagy teljesítményű számítástechnikai környezetekhez készült, ahol az alacsony késleltetés és magas átviteli sebesség kritikus. A technológia fő előnye, hogy megkerüli a CPU-alapú szoftver feldolgozást, azonban ez egyben azt is jelenti, hogy a hagyományos védelmi mechanizmusok nem alkalmazhatók teljesítményveszteség nélkül. Az RDMA rendszerek biztonsági problémái gyakran a hardver tervezési hiányosságaiban gyökereznek. Az RNIC három alapvető hitelesítési ellenőrzést végez: a kérésnek létező szerver oldali queue pair számot kell hivatkoznia, érvényes memóriaterületet kell elérnie helyes rkey-jel, és a virtuális memória címnek a célterületen belül kell lennie. A követelmények megsértése esetén a hálózati komponens eldobja a kérést anélkül, hogy továbbadná az alkalmazásnak. A laborfeladat négy támadási modellt vizsgál. Az első modellben a támadó különböző végponton található virtuális gépben vagy konténerben, root jogosultságok nélkül képes rosszindulatú RDMA alkalmazásokat indítani. A második modell kibővíti ezt root jogosultsággal és tetszőleges RDMA csomagok injektálásának képességével. A harmadik esetben támadó és áldozat ugyanazon gépen futnak, ami releváns a hálózati védelmi mechanizmusok szempontjából. A negyedik modell kompromittált RDMA klienst feltételez más gépeken. A feladat célja ezen fenyegetési modellek gyakorlati megértése, a biztonsági sebezhetőségek demonstrálása és hatékony védelmi mechanizmusok kidolgozása RDMA környezetekben. A hallgatónak elemeznie kell a hitelesítési mechanizmusokat, implementálnia kell támadási szcenáriókat különböző fenyegetési modellekben, valamint javasolnia kell olyan védelmi megoldásokat, amelyek minimális teljesítményhatással járnak.
TMIT2025-177
Perceptuális Hash Algoritmusok Adversariális Támadásai
Kulcsszavak: perceptuális hash, adversariális támadások, végponttól végpontig titkosítás, észlelés elkerülése, képmódosítás
Témavezető / oktatók: Ladóczki Bence + -

A végpont-végpont titkosítás (E2EE) biztosítja a felhasználók számára hogy egy közbeékelődő támadó ne tudja kinyerni az átküldöt adatot. Ez azonban probléma is, hiszen az E2EE megakadályozza az illegális tartalmak észlelését. A tech-cégek, kutatók és kormányok a perceptuális hash-elésen alapuló kliens-oldali szkennelést javasolták alternatívaként. A kliens-oldali szkennelés során a vizuális média aláírása a felhasználó eszközén kerül kiszámításra, majd összehasonlításra az ismert illegális képek adatbázisával. Találat esetén a felhasználó megjelölésre kerül vagy a titkosítatlan tartalom automatikusan megosztásra kerül további felülvizsgálatra. A kis változásokra és transzformációkra robusztus perceptuális hash algoritmusok generálják az aláírásokat. A kutatások azonban kimutatták, hogy ezek a rendszerek rendkívül sebezhetőek bizonyos támadásokkal szemben. Három különböző támadási módszer került azonosításra: egy általános fekete-doboz támadás és két fehér-doboz támadás diszkrét koszinusz transzformáció alapú algoritmusok ellen. A támadások változatos perturbációkat generálnak, ami arra utal, hogy az egyszerű védelmi stratégiák nem hatékonyak. A nagyobb küszöbértékek, amelyek megnehezítenék a támadásokat, valószínűleg naponta több mint egymilliárd kép megjelölését és visszafejtését igényelnék, ami súlyos magánélet-védelmi aggályokat vet fel. A feladat célja a perceptuális hash-elésen alapuló kliens-oldali szkennelési mechanizmusok robusztusságának értékelése kerülő támadásokkal szemben. A hallgatónak implementálnia kell adversariális támadásokat, amelyek minimálisan módosítják a képeket az észlelés elkerülése érdekében, értékelnie kell a jelenlegi rendszerek sebezhetőségeit, és elemezni kell a védelmi mechanizmusok gyakorlati korlátait és magánélet-védelmi implikációit.
TMIT2025-178
Post-kvantum Kriptográfia Implementálása IoT Eszközökön
Kulcsszavak: post-kvantum kriptográfia, IoT eszközök, kriptográfiai társprocesszorok, Kronecker algoritmus, erőforrás-korlátozott rendszerek
Témavezető / oktatók: Ladóczki Bence + -

Jelenleg több mint 30 milliárd IoT eszköz üzemel világszerte. Ezen eszközök védelme érdekében gyakran publikus kulcsú kriptográfiai primitívekre támaszkodunk, amelyek működése költséges lehet erőforrás-korlátozott IoT eszközökön. Az ilyen műveletek végre hajtására ezek az eszközök gyakran dedikált kriptográfiai coprocesszort tartalmaznak. A kvantumszámítógépek előrehaladásával a publikus kulcsú infrastruktúránk biztonsága veszélybe került. Shor algoritmusa képes lesz az ECC/RSA-ban használt privát kulcsok polinomiális időben történő visszafejtésére. E fenyegetésre való felkészülés érdekében alternatív kriptográfiai algoritmusokra van szükség, ezeket post-kvantum kriptográfiai algoritmusoknak nevezik. Az ilyen algoritmusok szabványosítása érdekében az amerikai NIST 2016-ban pályázatot hirdetett. A beágyazott eszközök esetében a teljesen új publikus kulcsú kriptográfiai algoritmusokra való áttérés több gyakorlati kihívást eredményez. A coprocesszorok tervezése, tesztelése és átállási ideje várhatóan sok évet, ha nem évtizedeket fog átölelni. A feladat célja a Kronecker+ algoritmus részletes teljesítményelemzésének elvégzése, a Kronecker helyettesítés hatékonyságának vizsgálata, valamint a Kronecker+ integrálása a NIST döntős Saber sémába a vezető post-kvantum kriptográfiai sémákban való alkalmazhatóság demonstrálása érdekében. A hallgatónak elemezni kell a jelenlegi kriptográfiai coprocesszorok korlátait, implementálni kell poszt-kvantum algoritmusokat erőforrás-korlátozott környezetben, és értékelni kell az átállás gyakorlati kihívásait.
TMIT2025-179
A Web Cache Deception támadások felderítése és elemzése
Kulcsszavak: Web Cache Deception, WCD, webbiztonság, gyorsítótárazás, sebezhetőség, HTTP fejlécek, tartalom elemzés, automatizálás, felderítés, eszközfejlesztés
Témavezető / oktatók: Ladóczki Bence + -

A Web Cache Deception (WCD) támadások egyre növekvő biztonsági kockázatot jelentenek a webes alkalmazások számára. A támadások lényege, hogy a támadó ráveszi a webszervert és a gyorsítótárat (cache), hogy egy felhasználói adatokat tartalmazó dinamikus oldalt statikus fájlként, például képként vagy CSS-fájlként gyorsítótárazzon. Ezt követően a támadó egyszerűen hozzáférhet a gyorsítótárazott, bizalmas információkat tartalmazó oldalhoz. A feladat célja egy olyan módszertan és eszköz kidolgozása, amely képes hatékonyan felderíteni a WCD sebezhetőségeket, különösen figyelembe véve a korábbi, markerekre épülő megközelítések korlátait. A projekt során egy új, marker-mentes módszertant kell implementálni, amely a tartalom azonosságának ellenőrzésén és a HTTP válaszfejlécek elemzésén alapul. A megoldásnak képesnek kell lennie a sebezhetőségek felderítésére anélkül, hogy felhasználói fiókot kellene létrehozni a tesztelt weboldalakon, így biztosítva a skálázhatóságot. A projekt főbb lépései a következők lennének: először is irodalomkutatást kellene végezni a WCD támadások elméletéről, a korábbi felderítési módszerekről és azok korlátairól. Másodszor, meg kellene tervezni egy új, marker-mentes felderítési módszertant, amely a HTTP válaszok tartalmát és fejléceit elemzi. Harmadsorban, egy szkriptet vagy alkalmazást kellene kifejleszteni, amely képes automatizáltan végrehajtani a teszteket egy adott weboldalon, HTTP kéréseket küldeni, a válaszokat elemezni és a lehetséges sebezhetőségeket azonosítani. Negyedszer, egy kisebb skálájú vizsgálatot kellene elvégezni a kifejlesztett eszközzel, például az Alexa Top 100 weboldalon. Végül pedig, a talált sebezhetőségek elemzése és az eredmények dokumentálása mellett, részletes technikai dokumentációt kellene készíteni a kidolgozott módszertanról és az implementációról, valamint egy beszámolót a projekt során szerzett tapasztalatokról és eredményekről.
TMIT2025-180
Valós támadások vizsgálata Tor hálózaton
Kulcsszavak: Tor, anonimitás, website fingerprinting, gépi tanulás, hálózatbiztonság
Témavezető / oktatók: Ladóczki Bence + -

A Tor egy népszerű anonimizáló hálózat, amely napi több millió felhasználó adatvédelmét szolgálja több ezer, önkéntesek által üzemeltetett proxy segítségével. A hálózat célja, hogy elrejtse a kommunikáció forrását és célját, így védve a felhasználókat a megfigyeléstől, nyomkövetéstől és cenzúrától. Azonban a Tor hálózat sincs teljes biztonságban: az egyik legjelentősebb fenyegetés az ún. Website Fingerprinting (WF) támadás, amely során a támadó - csupán a belépési pont forgalmának megfigyelésével - képes lehet következtetni a meglátogatott weboldalakra, ezáltal megtörve az anonimitást. A labor során a hallgató célja annak vizsgálata, hogy a WF támadások mennyire jelentenek valós fenyegetést a Tor hálózat felhasználói számára. A feladat magában foglalja a valódi forgalmi minták gyűjtését (szimulált környezetben, etikus keretek között), különböző támadási modellek implementálását, valamint azok összehasonlítását szintetikus és valós adatok alapján. A hallgató feladata annak eldöntése, hogy a korábban laboratóriumi környezetben tesztelt módszerek mennyire alkalmazhatók a valós világban. A projekt során a hallgató megismeri a Tor működését, a gépi tanulás alapú WF támadásokat, valamint adatgyűjtési és -elemzési módszereket. A feladat kiváló lehetőséget nyújt a hálózatbiztonság, az etikus hackelés és az adatelemzés területén való elmélyülésre.
TMIT2025-181
Kvantumbiztos digitális aláírás és kulcscsere algoritmusok elemzése
Kulcsszavak: posztkvantum kriptográfia, kvantumbiztonság, NIST, szabványosítás, kulcsméret
Témavezető / oktatók: Ladóczki Bence + -

Az EU egyre aktívabban támogatja a posztkvantum titkosítási algoritmusok kifejlesztését megcélzó projekteket. Sokan attól tartanak, hogy a kvantumszámítógép hamarosan valósággá válik és a hagyományos, például RSA valamint DLP-n alapuló titkosítási eljárások nem lesznek többé biztonságosak. A gyakorlatban azonban még nem igazán alkalmazzák a kvantumbiztos eljárásokat. A labor feladat megvalósítása során a hallgatónak meg kell ismerni a legaktívabban kutatott posztkvantum eljárásokat és fel kell térképezni hogy mely rendszerek és milyen módon kezdték el bevezetni az ilyen jellegű algoritmusokat. Ki kell továbbá arra is térni hogy milyen új problémákat vetnek fel ezek az új algoritmusok. Jól ismert tény, hogy a kvantumbiztos algoritmusok általában vagy lassúak vagy nagy kulcsmérettel dolgoznak. A hallgatónak analízist kell végeznie azzal kapcsolatban, hogy ezek a problémák mely valós környezetekben jelentkezhetnek valódi akadályként és javaslatot kell adni arra hogy a vizsgált rendszerekben hogyan és milyen alternatív megoldásokat lehetne alkalmazni. Figyelemmel kell kísérni a NIST szabványosítási folyamatát is és tárgyalni kell hogy jelenleg az EU-ban milyen jellegű szabványosítási irányok vannak a posztkvantum kriptográfia terén.
TMIT2025-182
Multiplicity Kódok Implementációja Data Availability Sampling Rendszerekben
Kulcsszavak: erasure kódok, polinom elköteleződés, adatelérhetőség mintavételezés, lokális javítás, blockchain skálázhatóság
Témavezető / oktatók: Ladóczki Bence + -

A Data Availability Sampling (DAS) technológia forradalmi megközelítést kínál a blokkláncok skálázhatóságának javítására. A hagyományos Reed-Solomon kódok helyett a multiplicity kódok használata jelentős előnyöket nyújt a tárolási hatékonyság és hálózati kommunikáció terén. Ezek a polinomok deriváltjait is tárolják, lehetővé téve a lokális javítást kevesebb csomópont lekérdezésével. A projekt célja egy működő multiplicity kód alapú DAS rendszer implementálása Python vagy C++ nyelven. A hallgató feladata a systematic encoding algoritmus megvalósítása bivariáns polinomok és FFT-alapú számítások használatával, valamint a dekódolás és lokális javítás implementálása interpoláció-alapú módszerekkel. Az alapkövetelmények között szerepel egy egyszerű polinom commitment scheme megvalósítása opening proof generálással, míg a haladó szint magában foglalja a teljesítmény optimalizációt, véletlenszerű sampling protokollt és adaptive stratégiákat. A kiváló teljesítményhez elvárható a Reed-Solomon baseline-nal való összehasonlítás és Byzantine fault tolerance tesztelés.Demonstrálja a multiplicity kódok előnyeit a hagyományos megoldásokkal szemben!
TMIT2025-160
Felhőalapú videójátékok
Kulcsszavak: video games, cloud gaming, edge computing, accessibility
Témavezető / oktatók: Babarczi Péter + -

Az elmúlt években a cloud gaming és az on-line multiplayer videójátékok elterjedése új kihívások elé állítja a kommunikációs hálózatokat. A játék típusától függően a néhány tíz ms alatti válaszidő alapvető követelmény, mely gyakran már a szerverek és a felhőben elérhető GPU-k fizika távolsága miatt is nehezen megvalósítható. További kihívás a felhasználók mobilitása, melyre a hálózatnak dinamikus erőforrás-foglalással kell válaszolnia az 5G edge hálózatban. A hallgató feladata a fenti cloud és az on-line videójátékok hálózati kommunikációja során jelentkező mérnöki problémák közül egy kiválasztása, megismerése és kidolgozása, mely kiterjedhet hálózati forgalom mérésére, dinamikus erőforrás foglaló módszerek kidolgozására, vagy felhőben jelentkező ütemezési feladatokra. Ezen kívül lehetőség van mikrontranzakcióinak gazdasági elemzésére, vagy a videójátékok hozzáférhetőségével (accessiblity) és alternatív irányításával kapcsolatos kutatás végzésére.
Ipari partner: Magyar Telekom TMIT2025-166
Intelligens asszisztensek és komponenseik összehasonlító elemzése és tesztelése
Kulcsszavak: Artificial intelligence, Mesterséges intelligencia, Intelligens asszisztens, Intelligent Assistant, Large Language Models, Speech recognition, speech synthesis, ügyfélszolgálat automatizálás, ChatGPT
Témavezető / oktatók: Németh Géza + - / Al-Radhi Mohammed + - , Bartalis István Mátyás + - , Fegyó Tibor + - , Mihajlik Péter + - , Zainkó Csaba + -

Szinte minden kisebb és nagyobb cég fejleszt vagy kínál intelligens asszisztenst (Apple. Google, Microsoft, Amazon, Meta, ....) . Ezek jellemzően ma már szöveg és beszéd ki- és bemenetet is kezelnek. Főbb elemeik a beszédfelismerő, a nyelvi elemző és generáló (jellemzően ma már nagy nyelvi modell alapú) valamint a gépi szövegfelolvasó komponensek. Ezek van ahol csak integráltan használhatóak, de gyakran elérhetők komponensenként is. Ekkor lehetőség van ezekből építőkocka-szerűen felépíteni egy saját megoldást. Széles körben ismert és elismert, a gyakorlatban is használt tesztelési és értékelési módszerek ma még hiányoznak. A projekt keretében a nemzetközi szereplők rendszerei mellett a hazai megoldások vizsgálatára is sor kerül, mintarendszerek kialakításán keresztül. A résztvevők betekinthetnek a valós felhasználást meghatározó paraméterekbe (felhő - lokális, nyelvek száma, akusztikus környezet, erőforrás igény, stb.).
Ipari partner: HungaroControl Zrt. TMIT2025-169
Légiforgalmi irányítást támogató rendszerelemek fejlesztése
Kulcsszavak: artificial intelligence in air traffic control, speech recognition, speech analysis, nonverbal features of speech, fatigue detection, speech synthesis, automatic alarm systems
Témavezető / oktatók: Németh Géza + - / Bartalis István Mátyás + - , Fegyó Tibor + - , Mihajlik Péter + - , Sztahó Dávid + - , Zainkó Csaba + -

A légiforgalmi irányítás kritikus biztonsági követelményeknek kell megfeleljen. A tevékenységnek sokféle részeleme van Budapesten is. Pl: Telefonos és rádiós beszélgetés magyar és angol nyelven. Kritikus információk azonosítása és azok alapján szükség szerint riasztás(ok) indítása. A feladat keretében a tevékenységhez kapcsolódó (elsősorban beszédtechnológiai) elemek kutatására kerül sor ill. kapcsolódó alkalmazások kidolgozására. Néhány példa: telefonos és rádiós beszélgetések leiratozása, ehhez kapcsolódó adatbázisok létrehozása, beszéd alapján fáradtság érzékelés, információ szolgáltatás gépi felolvasással és/vagy szöveges megjelenítéssel, automatikus munkatárs behívó rendszervészhelyzetekben... A feladat BSc, MSc képzésben is folytatható, TDK dolgozat irányában is folytatható, PhD képzéshez is vezethet.
Ipari partner: SpeechTex Kft. TMIT2025-168
Mennyivel több a beszéd a szövegnél?
Kulcsszavak: NLP, mesterséges intellingecia, Artificial intelligence, beszéd, szöveg, természetes nyelvfeldolgozás
Témavezető / oktatók: Németh Géza + - / Al-Radhi Mohammed + - , Mihajlik Péter + - , Zainkó Csaba + -

Az emberi kommunikáció és a nyelvi kifejezés alapja a beszéd, Írni és olvasni jellemzően hat éves kora után tanul meg az ember. Mégis a számítógépes világban a természetes nyelvfeldolgozás fogalma tipikusan szöveg elemzést takar. A projekt keretében megvizsgáljuk, hogy milyen elméleti és objektív paraméterekkel írható le a hangzó beszéd és annak szöveges megfelelője közti különbség. Elemezzük, hogyan lehet ezt a gépi beszédfelismerés és a gépi beszédkeltés színvonalának javítására felhasználni. Az eredményeket demonstrációs alkalmazásokban mutatjuk be.
TMIT2025-167
Hangbank
Kulcsszavak: TTS, gépi szövegfelolvasás, adatgyűjtés és elemzés, beszédtechnológia, UX, HCI, hangbank
Témavezető / oktatók: Németh Géza + - / Bartalis István Mátyás + -

Sok gyártó esetében gépi szövegfelolvasó (Text-To-Speech, TTS)rendszerek egy-egy (pl. magyar) nyelven csak egyetlen vagy legfeljebb két (egy férfi és egy női) hangon érhetők el. A gyakorlati alkalmazásokat hátráltatja, ha az adott nyelven számos alkalmazás ugyanazt a hangot alkalmazza. Példa erre a beszédsérült emberek esete: furcsa, ha egy kórházban minden beteg ugyanazon a hangon szólalna meg. A projekt keretében egy összetett szerver-alapú alkalmazás valósítandó meg, mely minőségbiztosított módon teszi lehetővé elsősorban magyar nyelven személyre szabott hangfelvételek készítését, ami később (akár automatikusan) lehetővé teszi az adott hangon megszólaló TTS motor generálását. Mind szerver, mind kliens oldali munkára szükség van. A feladat szakdolgozat/diplomaterv/TDK szintig folytatható, jó előkészület PhD tanulmányokra is.
TMIT2025-187
Deep learning alapú voice chatbot
Kulcsszavak: Deep learning, TTS, ASR, NLP, robot
Témavezető / oktatók: Zainkó Csaba + -

A beszédkommunikáció egyre szélesebb körben elterjed, amelyhez az egyre jobb minőségű deep learninges modellek adják a hátteret. A hallgató feladata, hogy összeállítson egy olyan kommunikációs chatbot-ot, amely az aktuális modelleket felhasználva képes kommunikálni az emberekkel. A munka során lehetőség van megismerni a mély gépi tanulást vagy elmélyíteni az ilyen irányú tudást. A cél, hogy egy működő demonstrációs környezet készüljön el.
TMIT2025-188
Sportmászás elemzés
Kulcsszavak: deeplearning, képelemzés, videóelemzése
Témavezető / oktatók: Zainkó Csaba + -

A sportmászás egyre népszerűbb tevékenység, különböző mért adatok alapján a sportoló mozgásáról különböző értékeléseket lehet készíteni. A hallgató feladata különböző deeplearninges módszerek/modellek használatával az adatok elemzése, értékelése, tanítások, finomhangolások végzése. Az adatok lehetnek videófelvételekből származtatottak vagy közvetlenül mértek (pl. pulzus).
TMIT2025-209
Biztonsági riasztások videóelemzés alapján
Kulcsszavak: TTS, Videó, DL, LLM
Témavezető / oktatók: Zainkó Csaba + -

A hallgató feladata, hogy a videó elemezés alapján megállapítsa, hogy az adott egyén veszélyes, vagy nem megengedett helyre kerül, vagy olyan tevékenységet folytat, amely ott abban a formában nem elfogadható. Vegye számításba, hogy a különböző szcenáriókban (pl. sportmászás, otthoni tevékenység, torna, közlekedés) milyen szempontok szerint kell a riasztásokat elvégezni. Riasztás esetén LLM által generált riasztó hangüzenetet készítsen, ezt egy offline rendszer keretében demonstrálja.
TMIT2025-224
Deep learning beszédleiratozás K2/Icefall alapon
Kulcsszavak: deep learning, beszédfelismerés, ASR, gépi tanulás, Python, PyTorch
Témavezető / oktatók: Mihajlik Péter + -

A történelem legsikeresebb beszédfelismerési keretrendszere (software toolkit-je) alighanem a Kaldi volt, melyre többek között az Apple, Intel, Xiaomi diktálója is épült. A siker jelentős részben a Weighted Finite State Transducer (WFST ~ véges állapotú gépek általánosítása) technológia hatékony integrálásának volt köszönhető - ezzel indult a Google is annak idején. Időközben a mélytanulási keretrendszerek - különösen a PyTorch - rendkívül közkedveltté váltak és a korábbi WFST alapú megoldások háttérbe szorultak. Azonban a Kaldi fejlesztőcsapata nemrégiben előrukkolt a k2 rendszerrel (https://github.com/k2-fsa/k2), mely a PyTorch-ra épül és a mély neuronhálókat a WFST-kel "varratmentesen" integrálja. Az Icefall kész, "state of the art" receptúrákat kínál a k2-höz, így az eredmények reprodukálása könnyű. A feladat a k2/Icefall segítségével hatékony magyar és idegennyelvű beszéd-szöveg átalakítás megvalósítása. A téma TDK-ra, diplomára is továbbvihető. A Python ismerete előny, az angol minimum olvasási szinten szükséges.
Ipari partner: SpeechTex Kft. TMIT2025-225
Többnyelvű beszédfelismerés end-to-end deep learning modellekkel
Kulcsszavak: multilingual, speech recognition, deep learning, NLP
Témavezető / oktatók: Mihajlik Péter + -

A klasszikus beszédfelismerő rendszerek egy megadott nyelven működnek jól, ahol akár az emberivel összevethető pontosságot is elérhetnek. Azonban a gyakorlati problémáknál elkerülhetetlen másik nyelvű szavak elhangzása, mely számos problémát felvet. Egyrészt, ha az adott (pl. magyar) nyelv hangjaival nagyjából le is fedhető az adott (pl. angol) szó, nem magától értetődő, hogy származtassuk a kiejtését - különösen, ha több ezer ilyen szó rövid idő alatt történő szótárba illesztése a feladat. Azonban natív ejtésmód esetén már a hangképzés is jelentősen különbözik, ami külön akusztikai modellezért tesz szükségessé. A ma nagyon népszerű end-to-end deep learning alapú megközelítést javasoljuk megvizsgálni, ehhez számos szoftver és hardver eszköz és tapasztalat áll rendelkezésre. Gyűjtőtéma révén számos területen (pl. természetes nyelvű szövegfeldolgozás/NLP/, deep learning, Python alapú fejlesztés, kutatás) lehet bekapcsolódni, a téma továbbvihető TDK, szakdolgozat/diplomamunka, PhD irányába.
TMIT2025-226
Low-latency speech-to-text alkalmazás/kutatás
Kulcsszavak: deep learning, low-latency, real-time systems, ASR, speech, Python
Témavezető / oktatók: Mihajlik Péter + -

A deep learning alapú ún. end-to-end beszédleiratozó rendszerek könnyen alkalmazhatók ma már szinte bármilyen nyelve, rögzített hanganyagokra. Azonban a valós idejű és egyben kis késleltetésű megoldások a legutóbbi időkig várattak magukra. A korszerű attention alapú megközelítések most jutottak el arra a szintre, hogy a nagy (többé-kevésbé) pontosságot megőrizve minimális, élő feliratozást is lehetővé tévő késletetéssel használhatók legyenek. A hallgató feladata a legkorszerűbb, gyakorlatban is alkalmazható megoldások megismerése, alkalmazása és kiértékelése magyar (vagy egyéb megbeszélt) nyelvre. Ajánlott deep learning ASR (Automatic Speech Recognition) toolkitek: WeNet, NVIDIA-NeMo, K2. A feladat folyamatos munkavégzést kíván, a Python és PyTorch ismerete jelentős előnyt jelent. Diplomatervig (sőt akár tovább) is vihető a téma. Angol olvasási készség, linux alapismeretek nehezen nélkülözhetőek.
TMIT2025-227
Conversational AI alkalmazások
Kulcsszavak: conversational AI, speech processing, NVIDIA, python
Témavezető / oktatók: Mihajlik Péter + -

Magyar hallgatókat is várunk.
TMIT2025-228
Nagy nyelvi modellek és beszédfelismerési modellek integrálása
Kulcsszavak: LLM, deep learning, beszéd-szöveg átalakítás
Témavezető / oktatók: Mihajlik Péter + -

A természetes beszéd automatikus szöveggé konvertálása még mindig jelentős kihívás, ha a beszélők szétválasztása, az írásjelezés, névelemek tag-elése, az idegen nyelvű kifejezések felismerés és a zajban is nagy pontosság a követelmények között van. Noha a klasszikus/neurális nyelvmodellek alkalmazása alapvetőnek számít ezen a területen, a (nagyon) nagy nyelvi modellek (LLM-ek, pl. GPT-4, ChatGPT, LLAMA, Qwen, stb.) felhasználása egyáltalán nem magától értetődő. A hallgató feladat feltárni a közvetlen, beszéd-szöveg konverziót segítő és az utólagos (pl. korrekciós) LLM alkalmazásokat. A téma diplomatervig - és azon túl is - továbbvihető.
Ipari partner: SpeechTex Kft. TMIT2025-229
Korszerű orvosi diktálórendszer fejlesztése
Kulcsszavak: MR, orvosi diktálás, Automatic Speech Recognition, beszédfelismerés, Natural Language Processing
Témavezető / oktatók: Mihajlik Péter + -

A beszédfelismerési technológia hatalmasat fejlődött az elmúlt években, azonban ezt nem minden alkalmazás tudta követni. Talán ahol a legnagyobb szükség van a hatékony és pontos diktálásra, az az orvosi terület és ezen belül is kiemelt a nagy szaktudást igénylő, drága diagnosztikai gépekkel dolgozó orvosok munkájának segítése. Az érdeklődő hallgatók számára lehetőség van bekapcsolódni egy, a SOTÉ-n már alkalmazásban lévő orvosi diktálórendszer fejlesztésébe.
TMIT2025-230
Using Multi-speaker TTS for ASR Adaptation
Kulcsszavak: Multi-speaker TTS, ASR, domain adaptation, data augmentation, deep learning, transformer
Témavezető / oktatók: Mihajlik Péter + -

[EN] Adapting Automatic Speech Recognition (ASR) systems to diverse speakers, accents, and environments is a persistent challenge, particularly when data from underrepresented speaker groups is scarce. Multi-speaker Text-to-Speech (TTS) technology offers a promising solution by synthesizing diverse and controllable speech samples to augment training data and improve ASR performance. The goal of this project is to explore how multi-speaker TTS models can be effectively utilized for ASR adaptation. The student will: * Investigate state-of-the-art TTS models capable of generating speech with varied speaker characteristics (e.g., Tacotron, FastSpeech, VITS, XTTS). *Generate synthetic speech datasets mimicking specific speaker groups, accents, or environments. *Evaluate the impact of these datasets on ASR system performance, focusing on recognition accuracy and robustness to variability. Key tasks include: * Experimenting with TTS models for speaker-specific and multi-speaker dataset generation. * Integrating synthetic datasets into the ASR training pipeline. * Evaluating the adapted ASR system on standard benchmarks and custom test cases. Recommended toolkits: NVIDIA-NeMo, ESPnet, K2, Hugging Face TTS/ASR libraries. Python proficiency and familiarity with deep learning frameworks (PyTorch or TensorFlow) are advantageous. This project is suitable for students interested in speech synthesis, ASR, and the interplay between these fields. It offers opportunities to contribute to cutting-edge research, with potential extensions toward a thesis, conference publication, or advanced applications in multilingual and low-resource ASR systems.
TMIT2025-184
Demencia automatikus felismerése beszéd és szöveg alapon
Kulcsszavak: demencia, dementia, nlp, text, szövegfelismerés, transformer, nyelvfeldolgozása, beszéd
Témavezető / oktatók: Sztahó Dávid + - / Jenei Attila Zoltán + - , Kiss Gábor + -

A demencia napjaink egyik leggyakoribb időskori betegsége. Időbeli, korai felismerése rendkívül fontos az életminőség megtartása miatt. Minél korábban ismerjük fel, annál jobban lehet kezelni. A tünetei megjelennek a heszéd által hordozott nyelvi tartalomban is, amelyek automatikus módszerekkel kinyerhetőek. A hallgató feladata demens betegek által közölt beszéd akusztikai és szöveges tartalmának vizsgálata, és gépi tanulás (mélytanulás) alkalmazása a betegség automatikus felismerésére. Jelentkezés (email, Teams): Sztahó Dávid, sztaho.david@vik.bme.hu
Ipari partner: Ericsson Magyarország TMIT2025-185
Determinisztikus hálózatok integrálása felhő környezetbe
Kulcsszavak: valós idejű alkalmazások, Deterministic Networking, felhő számítástechnika, cloud, Kubernetes
Témavezető / oktatók: Maliosz Markosz + - / Máté Miklós + - , Moldován István + -

Számos területen (pl. az ipar, a gépjármű kommunikáció, az audio/video átvitel) a valós idejű alkalmazások megkövetelik a hálózattól a korlátos késleltetést, kis késleltetés ingadozást és a nagy megbízhatóságot. Az IETF-ben létrejött Deterministic Networking (DetNet) munkacsoport vizsgálja ennek megvalósítási lehetőségeit az IP hálózati rétegben. Ezek a valós idejű alkalmazások a felhő számítástechnika előnyeit (rugalmasság, skálázhatóság és gyors alkalmazás létesítés) kihasználva egy felhő platform infrastruktúráján is futhatnak, ezért a felhő platform hálózatára is ki kell terjeszteni a determinisztikus működést. A megoldandó feladatok kiterjednek a felhőben futó virtualizált alkalmazások számára nagy megbízhatóságú és korlátos késleltetésű determinisztikus IP hálózati megoldás kialakítására, valamit felhő infrastruktúraként a Kubernetes konténer menedzsment platform hálózati megoldásával történő integrációra. Ehhez egy teszt környezetet építünk, amelyben kivitelezhető a technológiák integrációja, és vizsgáljuk, hogy miként lehet a determinisztikus hálózati működést egy konténerekben futó alkalmazás számára elérhetővé tenni, és mindezt a konténer menedzsment rendszer által irányítani.
Ipari partner: Ericsson Magyarország TMIT2025-186
Felhőszolgáltatások kialakítása konténeralapú környezetben
Kulcsszavak: felhő, konténer, Docker, Kubernetes, mikroszolgáltatás architektúra
Témavezető / oktatók: Maliosz Markosz + - / Simon Csaba + -

A felhő szolgáltatások gyors piacra kerülést, rugalmas kapacitásbővítést és kedvező költségeket nyújtanak. Manapság minden nagyobb alkalmazás rendszer (pl. vállalati alkalmazások, multimédia, távközlés, játék, stb.) fejlesztése és használata gyakorlatilag valamelyik felhő szolgáltatási modellben történik. A számítási és tárolási funkciók működésképtelenek a felhő hálózata nélkül. Felhő alapú infrastruktúrákban manapság a virtuális gépek mellett és azokkal együtt is előszeretettel alkalmaznak konténer technológiákat (pl. Docker, containerd, Kubernetes). A konténerek hordozható környezetet biztosítanak szoftver komponensek, alkalmazások számára. Egy konténerben jellemzően egy-egy komponense fut egy nagyobb rendszernek, minden rész-alkalmazásnak konténert hozunk létre, amelyeket aztán összeszervezünk (pl. adatbázis + alkalmazás + webszerver konténerek). Ennek az elvnek a továbbvitele vezet el a mikroszolgáltatás architektúrához, ahol sok kis szolgáltatás működik együtt. Míg a felhőben virtuálizálva fut a szolgáltatás logikája, vezérlő komponense, sok esetben a fizikai világban vannak a vezérelt az eszközök, ilyen alkalmazási területeink pl.: IoT rendszerek; robotkar, ipari berendezés; önjáró szállítóeszköz vezérlés. A hallgató feladatai: egy adott konténer technológiát és konténer menedzsment rendszert kiválasztva sajátítsa el azok alkalmazását, fejlesszen szolgáltatást a konténer menedzsment rendszer képességeit kihasználva (pl. terheléselosztás, skálázás, automatizálás), vizsgálja meg az alkalmazás komponensek közötti kommunikációs lehetőségeket, optimalizálási lehetőségeket egy adott szolgáltatás megbízható és rugalmas működtetéséhez. A kiírt téma gyűjtőtéma, a konkrét szolgáltatás, alkalmazás egyeztetésére az első oktatási hetekben kerülhet sor. A téma folytatható több féléven keresztül, BSc szakdolgozat, MSc diplomamunka, illetve TDK témaként is tovább vihető.
Ipari partner: Ericsson Magyarország TMIT2025-210
Ipari robotok építése és programozása
Kulcsszavak: robot, 5G, szenzor
Témavezető / oktatók: Vidács Attila + - / Fehér Gábor + -

A feladat: ipari környezetben bevethető, autonóm, mozgó roboteszköz (AGV) tervezése, megépítése és vezérlése. Az eszköz képes kell legyen egy számára ismeretlen hely feltérképezésére, a térkép segítségével saját helyzetének meghatározására, majd pedig az önálló navigációra (SLAM). A térképezés és navigáció segítésére az eszköz különféle érzékelőket (lidar, kamera, stb.) használ. A cél, hogy az eszköz vezérlését távolról, (a felhőből) oldjuk meg, beleértve a szenzoradatok átvitelét és feldolgozását is. A mozgó eszköz következtében hangsúlyos a nagy megbízhatóságú és kis késleltetésű vezetéknélküli rádiós kommunikációs megoldások (pl. 5G) vizsgálata is.
Ipari partner: Ericsson Magyarország TMIT2025-211
Kooperatív felhő robotika
Kulcsszavak: robot, cloud robotics, ROS. Gazebo
Témavezető / oktatók: Vidács Attila + - / Fehér Gábor + -

A hallgató feladata együttműködő, intelligens robotok hálózati vezérlési megoldásainak vizsgálata, implementálása, tesztelése mind valós roboton, mind pedig annak virtuális (szimulált) "ikertestvérén".
Ipari partner: Ericsson Magyarország TMIT2025-200
Robotkutya idomítás
Kulcsszavak: Robotkutya, 5G hálózat, Felhőalapú vezérlés, IoT, Mesterséges intelligencia, Gépi tanulás, Robotika, Szenzorvezérlés, Interaktív robotok, AI alapú mozgásvezérlés, Robot tanítás, Programozás, Felhőtechnológia, Okos eszközök, Valós idejű irányítás
Témavezető / oktatók: Fehér Gábor + -

A hallgató feladata egy létező, 5G hálózaton keresztül felhőből vezérelt robotkutya képességeinek bővítése és új funkciók fejlesztése. A projekt során a robot mozgásmintáinak és érzékelőinek programozása, valamint mesterséges intelligencián alapuló tanulási algoritmusok integrálása történik, amelyek révén a robotkutyának új feladatokat lehet tanítani (pl. tárgyak felismerése, követése, vagy interaktív viselkedés). A projekt kiváló lehetőséget nyújt az IoT, robotika és AI technológiák gyakorlati alkalmazására. Elvárások: Programozási alapismeretek, valamint a felhőtechnológia és hálózati rendszerek alapjainak ismerete.
Ipari partner: Ericsson Magyarország TMIT2025-201
IoT drón építése és vezérlése
Kulcsszavak: IoT, drón, 5G, AI, mesterséges intelligencia, Internet, felhő
Témavezető / oktatók: Fehér Gábor + -

Az IoT drón esetáben az IoT alapok erős befolyással vannak a drón felépítésére. A hagyományosnak mondható megközelítés szerint, miszerint a drón reülés vezérlője a drónon található és mindent az irányít, az IoT megközelítésben a vezérlő már a drónon kívül kap helyet, mint egy felhő szolgáltatás. Az így kialakított vezérlő a drón összes szenzorának jelét fogadja és valós időben feldolgozza, amihez nagyon gyors hálózati kapcsolat szükséges. Az építés bekapcsolódik egy korábban elkezdett nagyobb ipari projekt munkájba. A konkrét munka a jelenleg építés alatt álló drón képességeinek bővítése, illetve a meglévő drón flotta szoftveres programozása.
Ipari partner: Ericsson Magyarország TMIT2025-212
Robotkar vezérlés ROS2 környezetben
Kulcsszavak:
Témavezető / oktatók: Vidács Attila + - / Balogh Marcell + -

A hallgató feladata megismerkedni a ROS2 környezettel és a laborban található robot eszközzel. Az alapvető cél a robot mozgatása egy demonstrációs feladat során, ami közös megbeszélés tárgya.
Ipari partner: Ericsson Magyarország TMIT2025-213
ROS2 és Gazebo alapú mobil robot szimuláció
Kulcsszavak: robot, szimuláció, ROS2
Témavezető / oktatók: Vidács Attila + -

A feladat célja, hogy a hallgató megismerkedjen a ROS2 és a Gazebo szimulációs környezettel, és egy egyszerű mobil robotot irányítva képes legyen térképet készíteni, útvonalat tervezni és navigációt megvalósítani ütközéselkerüléssel. Részfeladatok: Gazebo és ROS2 környezet telepítése; SLAM algoritmus megismerése; Nav2 csomag telepítése és használata; teszt szimuláció készítése.
TMIT2025-202
Mesterséges intelligencia alapú rendszerek tesztelése
Kulcsszavak: AI, tesztelés, YOLO
Témavezető / oktatók: Kovács Gábor + -

Az elérhető számítási kapacitás felfutása lehetővé tette mesterséges intelligencia (AI) alapú komponensek használatát (szoftver)rendszerekben. Az ilyen komponensek ember számára megfoghatatlan működése komoly kihívást jelent a befoglaló rendszerek tesztelése szempontjából. A hallgató feladata a témavezető által javasolt szakirodalom tanulmányozása, és az abban javasolt tesztmódszerek alkalmazhatóságának vizsgálata AI komponenst tartalmazó szoftverek esetén. A tesztelendő rendszerbe csomagolt AI komponens lehet például egy képfeldolgozó modellt, amely a népszerű YOLO által készült.
TMIT2025-207
Többségi döntés és ensemble modell készítése LLM kimenetek alapján
Kulcsszavak: nagy nyelvi modellek, LLM, többségi döntés, ensemble modell
Témavezető / oktatók: Papp Dávid + -

Több modellt kiválasztunk, Mistral, Phi, GLM, Qwen, Llama, stb. Mindegyik modellel megoldunk egy adott feladatot, ami reasoning feladat, azonban az indoklás végén egy jól kategorizálható eredményt ad/kapunk. A cél az egyes modellek eredményeinek javítása: - egyrészt az azonos modell újrafuttatásával, különböző paraméterekkel (https://www.nature.com/articles/s41586-024-07421-0.pdf) - másrészt a különböző modellek eredményein futtatott majority vote-al - harmadrészt a modell outputokat egy összesítő modellnek átadva még a kategória döntéshozás előtt egyesítjük a kimeneteket - negyerészt a kimeneteket beágyazva megnézzük a modellek közti válasz-variancát és ezt beépítjük a döntésbe Hogyan kombináljuk a különböző modellek kimeneteit? - Gu et al 2025(https://arxiv.org/abs/2411.15594): A többségi szavazás teljesít a legjobban az összefoglalás kimenetek értékelésekor - Suzuoki and Hatano 2024 (https://www.techrxiv.org/doi/full/10.36227/techrxiv.171925057.75949684): Többségi szavazás → azt állítják, hogy a többségi szavazás csökkentette a hallucinációkat is - Yang et al. 2025 (https://www.jmir.org/2025/1/e70080): Többségi szavazással kezd (egyenlően súlyozott a modellek között). Leír egy enyhe javulást egy másik megközelítéssel, amely iteratívan frissíti a különböző modell-előrejelzések súlyait az alapján, hogy a modell helyes választ adott-e egy validációs (orvosbiológiai benchmark) adathalmazon.
Ipari partner: AITIA International Zrt. TMIT2025-208
DDoS támadások azonosítása gépi tanulással
Kulcsszavak: DDoS, ML, gépi tanulás, adatközpont, felhőszolgáltatás
Témavezető / oktatók: Orosz Péter + - / Skopkó Tamás + -

Néhány éve a globális világjárvány miatti lezárások világszerte felgyorsították a vállalatok és intézmények digitális átállását, mivel alkalmazottaik többsége otthonról dolgozott nyilvános vagy privát felhőszolgáltatások segítségével. Ennek megfelelően ezek a szolgáltatások lettek a legújabb generációs DDoS fenyegetések kiemelt célpontjai. Míg a jelenlegi DDoS támadási profilok egyes jellemzői a világjárvány időszaka előtt megjelentek, az elmúlt időszakban érték el jelenlegi összetettségüket. Az újszerű módszerek és eszközök alkalmazása mellett a támadások gyakorisága, mértéke és változékonysága is jelentősen megnövekedett. Az önálló munka során a hallgató egy valós adatközpontból származó DDoS adatbázis felhasználásával kísérletezhet és megvizsgálhatja különböző gépi tanuló algoritmusok hatékonyságát.
Ipari partner: AITIA International Zrt. TMIT2025-219
Felhasználói aktivitás monitorozása 5G hálózatokon eBPF keretrendszerrel
Kulcsszavak: 5G, eBPF, network monitoring, QoS, QoE
Témavezető / oktatók: Orosz Péter + -

A laboratóriumi projekt célja a felhasználói aktívitás monitorozása 4G és 5G hálózatokon az eBPF (Extended Berkeley Packet Filter) keretrendszer alkalmazásával. A téma során különböző algoritmusokat és módszereket kutatunk és implementálunk a felhasználói forgalom valós idejű elemzésére, így lehetővé téve a felhasználói tevékenységek részletes nyomonkövetését és QoS-QoE metrikák számolását. A projekt során a control plane forgalom segítségével azonosítjuk a potenciális anomáliákat, amelyek segíthetnek a hálózat optimális működésének biztosításában. Végső célunk egy olyan rugalmas és skálázható monitorozási rendszer kifejlesztése, amely hozzájárul a modern mobilhálózatok biztonságának és megbízhatóságának növeléséhez.
TMIT2025-215
Nagy felbontású, több oldalas képek oldalakra vágása
Kulcsszavak: képfeldolgozás, metaadat, metaadatok kinyerése, metaadatok generálása
Témavezető / oktatók: Marton József Ernő + -

A tudományos szakirodalom és más dokumentumok nagysűrűségű rögzítésére a 20. század derekán elterjedt módszer volt azok Mikrofiche lapokon rögzítése és terjesztése. Ez egy kb. levelezőlap méretű negatív film, amire változó méretű rácsba rendezve egy film-lapon akár 100 vagy még több oldal képe került rögzítésre. Ezek megfelelő felbontású digitalizálásával több száz megapixeles képek keletkeznek. A feladat ennek a képnek a feldolgozása és oldalakra vágása, majd a mai eszközökön jól használható formájú pl. pdf dokumentumra konvertálása és a kapcsolódó metaadat-állományok elkészítése. A feladat része a lehetséges módszerek felderítése, kipróbálása és megoldási javaslat készítése. A munka több féléven keresztül folytatható és akár diplomaterv is készíthető belőle.
TMIT2025-221
Digitalizált dokumentumok automatikus metaadatolása
Kulcsszavak: Digitalizált dokumentum, metaadat, automatikus metaadatolás, dokuemntum-adatbázis
Témavezető / oktatók: Marton József Ernő + -

Az utóbbi évtizedekben felgyorsult a dokumentumok digitalizálása. Ezen dokumentumok automatikus metaadatolása igen nagy segítség a dokumentumok visszakereésse, adatbázisba töltése során. A feladat különböző digitalizált dokumentumok metaadatainak kinyerése és gépi olvashatóvá tétele, valamint dokumentum-adatbázisba rendezése.
Ipari partner: Magyar Államkincstár TMIT2025-216
Adatok a pályán - sportanalitika új dimenziói
Kulcsszavak:
Témavezető / oktatók: Adamis Gusztáv + -

A sport a legfontosabb a lényegtelen dolgok között" - ez a mondás napjainkban különösen érvényes. Az élsport hatása messze túlmutat a pályán: gazdasági, technológiai és kulturális szinten is egyre nagyobb szerepet játszik. Jó példája ennek a sportanalitika rohamos fejlődése. A globális piac értéke 2024-ben közel 4,5-4,8 milliárd USD volt, és előrejelzések szerint 2030-ra a többszörösére nőhet, évi 20-22%-os bővüléssel elérve akár 14-24 milliárd USD-t. A sport iránti érdeklődés is növekszik: míg a 2014-es labdarúgó-világbajnoki döntőt körülbelül 1 milliárd ember követte, a 2022-es döntőt már 1,5 milliárd néző látta. Az adatelemzés és a mesterséges intelligencia ma már szerves része a sport világának: valós idejű döntéstámogatás mérkőzések alatt, játékosok mozgásának és teljesítményének nyomon követése szenzorokkal és kamerákkal, valamint prediktív modellek építése statisztikai és gépi tanulási módszerekkel. Ugyanakkor számos nyitott kérdés van: mely bevett edzői megérzések igazolhatók objektív adatokkal? Milyen forrásokból és minőségben érhetőek el a releváns adatok? Hogyan lehet új, eddig rejtett mintázatokat feltárni? A hallgató feladata: - Ismerkedjenek meg a sportban alkalmazott adatformátumokkal (pl. tracking, eseménynaplók, biometrikus adatok, videófelvételek). - Vizsgálják meg a jelenlegi analitikai módszereket, összevetve a hagyományos statisztikai megközelítéseket a gépi tanulás és deep learning technikáival. - Térképezzék fel az adatforrások hozzáférhetőségét és korlátait. - Keressenek olyan újszerű összefüggéseket, amelyek korábban inkább intuícióra épültek, de most adatokkal is alátámaszthatók.
TMIT2025-217
Játék az adatokkal - Sportanalitika a gyakorlatban
Kulcsszavak:
Témavezető / oktatók: Pašić Alija + - / Dobreff Gergely + -

A sport a legfontosabb a lényegtelen dolgok között" - ez a mondás napjainkban különösen érvényes. Az élsport hatása messze túlmutat a pályán: gazdasági, technológiai és kulturális szinten is egyre nagyobb szerepet játszik. Jó példája ennek a sportanalitika rohamos fejlődése. A globális piac értéke 2024-ben közel 4,5-4,8 milliárd USD volt, és előrejelzések szerint 2030-ra a többszörösére nőhet, évi 20-22%-os bővüléssel elérve akár 14-24 milliárd USD-t. A sport iránti érdeklődés is növekszik: míg a 2014-es labdarúgó-világbajnoki döntőt körülbelül 1 milliárd ember követte, a 2022-es döntőt már 1,5 milliárd néző látta. Az adatelemzés és a mesterséges intelligencia ma már szerves része a sport világának: valós idejű döntéstámogatás mérkőzések alatt, játékosok mozgásának és teljesítményének nyomon követése szenzorokkal és kamerákkal, valamint prediktív modellek építése statisztikai és gépi tanulási módszerekkel. Ugyanakkor számos nyitott kérdés van: mely bevett edzői megérzések igazolhatók objektív adatokkal? Milyen forrásokból és minőségben érhetőek el a releváns adatok? Hogyan lehet új, eddig rejtett mintázatokat feltárni? Hallgató feladata: - Ismerkedjenek meg a sportban alkalmazott adatformátumokkal (pl. tracking, eseménynaplók, biometrikus adatok, videófelvételek). - Vizsgálják meg a jelenlegi analitikai módszereket, összevetve a hagyományos statisztikai megközelítéseket a gépi tanulás és deep learning technikáival. - Térképezzék fel az adatforrások hozzáférhetőségét és korlátait. - Keressenek olyan újszerű összefüggéseket, amelyek korábban inkább intuícióra épültek, de most adatokkal is alátámaszthatók.
TMIT2025-218
GenAI multi-agent rendszerek
Kulcsszavak:
Témavezető / oktatók: Pašić Alija + - / Dobreff Gergely + -

A generatív mesterséges intelligencia fejlődésének egyik legizgalmasabb területe az autonóm ügynökök világa. Ezek a rendszerek nemcsak önállóan képesek feladatokat megtervezni és végrehajtani, hanem egymással együttműködve is komplex problémák megoldására vállalkoznak. Az utóbbi évek kutatásai rávilágítottak a multi-agent architektúrák előnyeire, ahol specializált ügynökök egy közös célt szolgálnak. A fejlődéshez hozzájárulnak a kialakulóban lévő kommunikációs protokollok és ipari szabványok, amelyek biztosítják az interoperabilitást ügynökök és adatforrások között. Emellett új értékelési keretrendszerek is megjelentek, amelyek már nem pusztán a teljesítményt vagy a pontosságot mérik, hanem a megbízhatóságot, a költséghatékonyságot, a biztonságot és a gyakorlati alkalmazhatóságot is vizsgálják. További kihívást jelent az edge környezetek és elosztott rendszerek használata, ahol egyszerre kell figyelembe venni az energiahatékonyságot, a hálózati környezet sajátosságait és a kontextus-érzékenységet. Hallgató feladata: - Tekintsék át a generatív AI-alapú ügynökök felépítését és a több-ügynökös rendszerek működési modelljeit. - Ismerjék meg a legfrissebb kommunikációs protokollokat, szabványosítási törekvéseket és értékelési módszertanokat. - Elemezzék az edge és elosztott végrehajtás előnyeit és technikai korlátait. - Készítsenek egy működő prototípust, ahol legalább három specializált ügynök közösen old meg egy feladatot (pl. adatok kinyerése, előfeldolgozása és elemzés készítése).
Ipari partner: AITIA International Zrt. TMIT2025-222
Nyelvi modellek képességeinek összehasonlítása
Kulcsszavak: Nagy nyelvi modellek, Kis nyelvi modellek, LLM, SLM, benchmark
Témavezető / oktatók: Varga Pál + -

Az önálló laboratóriumi feladat célja különféle nyelvi modellek (language models, LMs) képességeinek és teljesítményének vizsgálata. A hallgatónak át kell tekintenie a kis és nagy méretű nyelvi modellek felépítését, jellemzőit és tipikus felhasználási területeit. A munka során benchmark feladatokat kell kiválasztani, amelyek alkalmasak a modellek összehasonlítására (pl. szövegértési tesztek, kódgenerálási feladatok, érvelési képességek vizsgálata). A kiválasztott feladatokat egy erre kialakított kísérleti keretben kell lefuttatni több különböző modellen - és összehasonlítani az eredményeket. Az összehasonlításnak ki kell térnie a teljesítményre, a válaszok minőségére, az erőforrásigényre és a futási sebességre egyaránt. A hallgatónak részletesen dokumentálnia kell a kísérletek menetét és eredményeit, valamint statisztikai módszerekkel is alátámasztani a következtetéseket. A munka során külön figyelmet kell fordítani a kis modellek előnyeire és korlátaira a nagy modellekkel szemben. Emellett értékelni kell, hogy mely feladatokban teljesítenek jól a kisebb modellek, és mely területeken szükséges a nagyobbak használata. A beszámolóban mutassa be a kapcsolódó szakirodalmat és a nyelvi modellek fejlődésének fő irányait. A feladat várható eredménye egy átfogó, összehasonlító elemzés, amely gyakorlati iránymutatást ad a nyelvi modellek kiválasztásához és alkalmazásához különböző feladatokban.
TMIT2025-223
Egyensúlyozó jármű vezérlés pöffös szélben
Kulcsszavak: jármű, vezérlés, egyensúly, segway, önegyensúlyozó, egykerekű, kétkerekű, gépi tanulás, AI, AI generálta AI
Témavezető / oktatók: Cinkler Tibor + -

Mind több egyensúlyozó jármű illetve egyensúly alapján irányított jármű látható utcáinkon. Célunk egy kocsin egy, kettő és három dimenzióban egyensúlyozni egy speciális fordított ingát, kettős ingát, hármas ingát. A feladat quadcopter drónra is általánosítható. Egyrészt differenciagyenletekkel másrészt gépi tanulással közelítjük a feladatot. Python programozási tapasztalat előnyt jelent. Érdeklődés egyensúlyozó járművek iránt szintén előny, akárcsak bármilyen tapasztalat e terén. A hallgató feladata a nagy nyelvi modellek (pl ChatGPT és Gemini) által generált vezérlők összehasonlítása stabilitás és energiafelhasználás szempontjából.