Kvantitatív, szemantikus adat- és tudásfúzió genetikai variánsok prioritizálására

Kvantitatív, szemantikus adat- és tudásfúzió genetikai variánsok prioritizálására

Körülmények

A genomikai elemzések (pl. teljes genomszélességű asszociációs vizsgálatok, új generációs szekvenálási elemzések) egyik legnagyobb kihívása az, hogy a kapott eredményeket értelmezzük, illetve kiválasszuk egy adott szempontból leginkább releváns genetikai markereket. Az elmúlt évtizedben számos olyan szűrési és pontozási módszer született, amely a genetikai variánsok biológiai, evolúciós, klinikai vagy populációs tulajdonságai alapján segítette a releváns variánsok kiválasztását.

Kihívás

Az elmúlt években rengeteg jó minőségű, rendkívül nagy méretű, szemantikus web-technológián alapuló adat- és tudásbázis vált elérhetővé az élettudományok területén, amelyek különféle biológiai entitásokról tartalmaznak széleskörű információkat. Ezek az egymással összekapcsolt adatbázisok felhasználhatók arra is, hogy tetszőlegesen komplex lekérdezéseket futtassunk „egymástól távoli” biológiai entitások közötti kapcsolatok felderítése céljából. Mindezidáig azonban ezt a nagy potenciált jelentő tudásmennyiséget nem tudtuk felhasználni a genetikai adatelemzésben, ugyanis a komplex, adatbázisokon átívelő lekérdezések során számos elméleti és gyakorlati nehézséggel kell szembesülnünk.

Megoldás

A BME MIT munkatársai egy olyan rendszert fejlesztettek ki, amely lehetővé teszi, hogy a genetikai variánselemzés értelmezésének támogatására fel tudjuk használni ezeket az egymással összekapcsolt, hatalmas méretű adatbázisokat is. A kifejlesztett rendszerben az integrált szemantikus adatbázisok felhasználásával nagyméretű számítási hálózatokat hozhatunk létre. A hálózatok csomópontjai a különféle biológiai entitások (pl. variánsok, gének, fehérjék, betegségek, gyógyszermolekulák stb.), az élek pedig az ezek közötti kapcsolatokat jelentik. Egy adott elemzési feladatban pedig a hálózatba különféle biológiai evidenciákat beléptetve következtetési algoritmusok segítségével kvantitatív módon tudjuk prioritizálni a genetikai variánsokat.

Hatások,eredmények

A fejlesztés eredményeképpen a genetikai variánsok elemzése során olyan adat és tudásbázisokat is fel tudunk használni, amelyekre korábban nem volt lehetőség. Ez egy rendkívül hasznos eszközt nyújt a genomikai elemzési eredmények értelmezéséhez.

Ügyfél
Szolgáltató
Budapesti Műszaki és Gazdaságtudományi Egyetem, Méréstechnika és Információs Rendszerek Tanszék
Üzleti funkció
Termékfejlesztés