Partner:
Janssen Pharmaceuticals
Odvětví: informační technologie, farmaceutický průmysl
Aplikace strojového učení nalézají uplatnění v nejrůznějších oblastech lidské činnosti počínaje energetikou přes průmyslovou automatizaci, robotiku, automobilový průmysl a biomedicínu. Na průmyslové úrovni tyto aplikace obvykle zahrnují sérii vzájemně propojených data-zpracovávajících kroků.
V rámci evropského projektu ExCAPE programu Horizont 2020 spolupracujeme s farmaceutickými firmami na vývoji nových léčiv pomocí strojového učení na superpočítačích. Možnost přesné predikce aktivity chemických sloučenin zásadně snižuje náklady a časovou náročnost celého procesu a má významný dopad na inovaci léčebných procesů a rozšíření možností medikace. Pro tento účel byla vyvinuta řada nástrojů umožňujících čelit této výzvě. Za IT4Innovations je to open source software HyperLoom umožňující efektivní rozložení souvisejících výpočetních úloh na distribuované výpočetní systémy.
Pomocí softwaru HyperLoom mohou uživatelé jednoduše definovat závislosti mezi výpočetními úlohami a vytvořit plán, který pak spustí na vysoce výkonném výpočetním systému. Software přitom umožňuje spouštění výpočetních plánů, které obsahují širokou škálu typů úloh, od nativních poskytujících základní funkcionalitu, přes úlohy definované uživatelem, až po úlohy zapouzdřující aplikace třetích stran, včetně možnosti jejich kombinace.
HyperLoom byl navržen tak, aby samotná režie plánování a spouštění úloh byla minimální a aby dokázal efektivně zpracovat různě výpočetně náročné úlohy. Výpočetní jádro softwaru je implementováno v jazyce C++ a dokáže dynamicky spouštět úlohy na dostupných výpočetních zdrojích s ohledem na uživatelem definované požadavky jednotlivých úloh. Samotné jádro HyperLoomu se skládá ze serverové komponenty a několika pracovních komponent. Serverová je zodpovědná za plánování a spouštění úloh na pracovních komponentách, které běží na výpočetních uzlech. Plány se pak definují a odesílají na server pomocí Python rozhraní.
Výkonnostní testy prokázaly, že HyperLoom umožňuje spouštění plánů obsahujících stovky tisíc úloh s dopředu neznámou délkou běhu na desítkách až stovkách výpočetních uzlů. Tento obecný nástroj navíc nachází další uplatnění i v jiných odvětvích průmyslu.
Slovo partnera
Ing. Vladimir Chupakhin, Ph.D.
“Farmaceutické společnosti shromáždily značné množství interakcí bílkovin s ligandy tvořící tzv. chemogenomickou matici: interakce mezi sloučeninami a bílkovinami. Tato matice je však velmi řídká, tzn. že méně než 1% matice je vyplněné. Díky predikčnímu modelování je možné tuto matici vyplnit pomocí klasifikačního nebo regresního modelu. Predikce se následně využívají ke zrychlení návrhu léčiv a jejich vývoje, snížení nákladů a minimalizaci testování na zvířatech. Ač se v každé fázi návrhu a vývoje léčiv využívá strojového učení, je stále obtížné jej nasadit na rozsáhlé soubory dat (big data) vzhledem ke všem nutným krokům v procesu modelování: hledání nejvhodnějšího parametru modelu (hyperparameter search), ukládání modelu a predikcí, aj. Ve spolupráci s IT4Innovations se snažíme překonat tyto překážky v rámci projektu ExCAPE.”