Segmentace a sledování buněk má zásadní význam pro využití v různých oblastech vědy i průmyslu. Vývoji a objektivnímu hodnocení algoritmů pro segmentaci a sledování buněk v časosběrných snímcích z optických mikroskopů se od roku 2013 věnuje iniciativa Cell Tracking Challenge. Do iniciativy jsou zapojeny výzkumné týmy z Ameriky, Austrálie i Evropy, mezi kterými nechybí ani IT4Innovations. Nejnovější společné výzkumné výsledky byly publikovány v prestižním časopise Nature Methods.

Organizátoři této iniciativy udržují a aktualizují kolekci různorodých souborů dat. Jedná se například o soubory dat zobrazující jak buňky hustě seskupené, tak buňky jednotlivé, ale i buňky rychle se pohybující, a dále například i obrazová data v záměrně horší kvalitě (např. rozostřené snímky). V současnosti je do soutěže Cell Tracking Challenge zapojeno více než 50 výzkumných týmů z celého světa. Počítačoví vědci se snaží konkrétní soubory dat zpracovat. Své výsledky zasílají do soutěže ke kontrole a organizátoři soutěže je pak vyhodnocují co do přesnosti a spolehlivosti. Výsledky poté zveřejňují na webových stránkách iniciativy. Budují tak žebříček nejlepších soutěžících, resp. nejlepších algoritmů.

Soutěž Cell Tracking Challenge funguje zároveň jako katalog. V případě, že vědec potřebuje svá data zpracovat, může se právě do této soutěže podívat, zjistit a vybrat si v současnosti nejlepší metodu dostupnou pro daný typ dat. Podmínkou soutěže proto je, že účastníci musí své programy veřejně zpřístupnit.

Vladimír Ulman z IT4Innovations, jeden z organizátorů soutěže Cell Tracking Challenge, vysvětluje, co je to segmentace a sledování buněk: „Segmentace buněk je úloha, ve které má počítač najít všechny buňky na zadaném obrázku – je to stejná úloha jako např. chtít obkreslit každého slona na obrázku stáda slonů (to by byla segmentace slonů). A právě schopnost obkreslit je důležitá, protože potom nám počítač dokáže spočítat velikost té buňky (nebo slona), kategorii tvaru a podobně. A pokud by to nebyl obrázek slonů, ale video stáda slonů, tedy časosběrná série obrázků, tak sledování znamená nalezení vždy toho stejného slona na každém snímku z videa. Po úspěšné segmentaci a sledování je počítač schopen identifikovat konkrétního slona či buňku a zjistit, jak se např. mění jeho či její tvar v čase, nebo vzdálenosti mezi nimi. Vědce biology často zajímá, jak buňky mění svůj objem v čase, nebo jak se mění jejich počet, zda se pohybují všechny stejným směrem, nebo chaoticky atd. Pokud to má počítač zjistit a sesumírovat autonomně, potřebuje umět dobře řešit právě segmentaci i sledování. Bez toho to totiž nejde.“

Po deseti letech existence Cell Tracking Challenge a po pěti letech od zveřejnění prvních úspěchů v prestižním vědeckém časopise Nature Methods, publikovali organizátoři soutěže nejnovější výzkumné výsledky, a to opět v časopise Nature Methods. Článek „The Cell Tracking Challenge: 10 years of objective benchmarking“ popisuje, co se v tomto oboru událo za posledních pět let, a také kam se tato soutěž posunula. Vladimír Ulman dodává: „Hlavním nosným tématem je, že právě těch pět let zažilo malou revoluci v podobě nástupu umělé inteligence (AI). V roce 2017 jsme měli jedinou AI metodu a dnes prakticky nedostáváme výsledky získané jinak než pomocí AI. Náš nejnovější článek popisuje, jaké metody se nejčastěji používají a jaké jsou vhodné pro který typ dat. Uvádíme také analýzy výkonnosti metod a jejich vztahu k povaze vstupních dat atd. Vysvětlujeme, jak jsme postupně tuto soutěž doplňovali o nové typy dat, což rozšiřuje paletu katalogu a potenciální užitečnost celého snažení.

IT4Innovations bylo spoluzodpovědné právě za rozšiřování dat. Vědci z IT4Innovations se podílí například na vývoji nástroje pro anotování dat a také nástroje pro tzv. kolaborativní sledování buněk. Vladimír Ulman potřebu anotování dat vysvětluje: „Potřeba tzv. anotování dat se objevila právě kvůli metodám AI. Anotování znamená ručně obkreslit a sledovat část dat z katalogu, a to pro trénování modelů počítačového zpracování obrazu. Anotování se tradičně dělá ručně, což je nevhodné při potřebě zpracování velkého množství dat. IT4Innovations přišlo s řešením. Umožnilo vytvořit supočítačem anotovaná data, tzv. silver standard corpus, kdy počítač dokázal anotovat 99,8 % procent všech buněk v obraze. AI tak má dost příkladů, jak se kvalitně tzv. natrénovat. Tento výsledek je volně přístupný na webových stránkách Cell Tracking Challenge. V soutěži se také začínají objevovat metody AI, které byly na těchto datech natrénovány. Věříme, že o počítačem anotovaných datech z dílny IT4Innovations ještě uslyšíme, protože tuto oblast dále aktivně rozvíjíme.“

 

Odborný článek: https://rdcu.be/dcrUp

 


Tato práce byla podpořena Evropským fondem pro regionální rozvoj (ERDF) v rámci projektu IT4Innovations národní superpočítačové centrum – cesta k exascale (CZ.02.1.01/0.0/0.0/16_013/0001791) realizovaného v rámci OP VVV.