Mimořádného úspěchu dosáhl student Masarykovy univerzity Filip Jozefov. Se svou diplomovou prací, kterou vypracoval pod vedením Aleše Křenka z CERIT-SC a ve spolupráci s ÚOCHB AV ČR, se v letošním ročníku prestižní Ceny Wernera von Siemense probojoval mezi TOP 10 v kategorii Nejlepší diplomová práce. V silné celorepublikové konkurenci tak potvrdil nejen špičkovou úroveň, ale i výrazný inovativní přínos svého výzkumu.
Umělá inteligence odkrývá neznámé molekuly
Oceněná práce s názvem Predicting molecular structures from multi-stage MSn fragmentation trees using graph neural networks and DreaMS foundation model se věnuje zpracování dat z hmotnostní spektrometrie s aplikací především v metabolomice. Řeší jeden z největších problémů současné analytické chemie a biologie – neschopnost identifikovat většinu malých molekul přítomných v živých organismech, které jsou kritické pro porozumění funkci biologických systémů (tzv. temný metabolom).
Primární technologií pro identifikaci struktur metabolitů ve velkém měřítku je tandemová hmotnostní spektrometrie (MS/MS). Interpretace získaných spekter je ale často nejednoznačná a neúplná. Filip Jozefov ve své práci přichází s průlomovým řešením: na rozdíl od současných modelů strojového učení, které se obvykle spoléhají jen na jedinou fázi fragmentace (MS2), zapojil vícestupňová data (MSn). Molekuly jsou v tomto procesu fragmentovány v po sobě jdoucích kolech, což umožňuje odhalit mnohem hlubší strukturální vrstvy. Zpracování dat je ale výrazně komplikovanější.
Desetinásobné zlepšení přesnosti díky pokročilým modelům
K analýze těchto komplexních dat Filip vyvinul vůbec první modely neuronových sítí trénované na spektrech MSn. Ve své práci úspěšně propojil grafové neuronové sítě s modelem DreaMS (tzv. foundation model pro vnoření hmotnostních spekter). Modely byly testovány na dvou klíčových úlohách: vyhledávání molekulárních struktur z množin kandidátů a de novo generování struktur.
Hlavní přínosy práce:
- Výrazné zvýšení přesnosti: Zapojení vícestupňové fragmentace MSn zlepšilo přesnost vyhledávání struktur až desetkrát ve srovnání s použitím samotné MS2.
- Bohatší reprezentace dat: Hlubší úrovně MSn produkují mnohem informativnější spektrální reprezentace.
- Otevřená věda a výzkumná infrastruktura: Filip v rámci práce vytvořil MassSpecGymMSn – první otevřený benchmark pro molekulární anotaci na bázi MSn. Obsahuje 16 476 fragmentačních stromů (až do úrovně MS5) včetně nástrojů pro předzpracování. Tento cenný dataset je vystaven veřejně v repozitáři pro podporu dalšího výzkumu v této oblasti.
Výsledky této práce mají obrovský aplikační potenciál napříč řadou oborů – od vývoje nových léčiv a personalizované medicíny přes přesnější diagnostiku nemocí až po zemědělství a ochranu životního prostředí. Jednou z největších výzev, na kterou tento výzkum reaguje, je generování molekulárních struktur de novo. V praxi to znamená, že umělá inteligence získává schopnost identifikovat přímo z naměřených spektrálních datmolekuly, které nejsou přítomny v existujících databázích. Ambice a složitost tohoto úkolu si v ničem nezadají s revolucí, kterou odstartoval model AlphaFold při předpovídání struktury proteinů. Pokud se tyto algoritmy podaří dále zdokonalovat, mají potenciál od základu změnit způsob, jakým lidstvo objevuje a mapuje nové chemické struktury.
O Ceně Wernera von Siemense 2025
Cena Wernera von Siemense je ocenění, které společnost Siemens uděluje studentům a mladým vědcům z technických a přírodovědných oborů. Patří svým rozsahem a historií k nejvýznamnějším nezávislým iniciativám tohoto druhu v České republice. V letošním 28. ročníku hodnotilo 56 nezávislých odborníků celkem 662 přihlášek, z nichž téměř pětina (19 %) pocházela právě z oboru chemie. Filipovo umístění v TOP 10 je tak vynikajícím úspěchem. Gratulujeme!
