Wyszukiwarka jak Google, ale dla DNA. Przełom w biologii

konto.spidersweb.pl 2 godzin temu

Biolodzy zyskują dostęp do wyszukiwarki, która analizuje genomy tak łatwo, jak Google przeszukuje strony. Zdaniem twórców, MetaGraph może przynieść korzyści nie tylko naukowcom zamkniętym w laboratoriach.

Naukowcy z Politechniki Federalnej w Zurychu (ETH Zurich) opracowali narzędzie, które może zmienić sposób, w jaki prowadzi się badania genetyczne. MetaGraph, ochrzczony przez swoich twórców jako „Google dla DNA”, umożliwia przeszukiwanie gigantycznych baz danych sekwencji genetycznych w ciągu kilku sekund i minimalnym kosztem – w przeciwieństwie do dotychczas używanych metod, które zajmowały czas i przepalały ogromne ilości energii.

Nowe „Google dla DNA” może przyspieszyć pracę biologów – i nie tylko

W ostatnich latach biolodzy zgromadzili w publicznych repozytoriach niewyobrażalne ilości danych z odczytów DNA i RNA. Szacuje się, iż dotychczasowe zbiory to w sumie około 100 petabajtów informacji genetycznej – mniej więcej tyle, ile tekstu znajduje się w całym internecie. Problem w tym, iż ilość informacji jest niewspółmierna do wydajności metod przeszukiwania ich. Aby znaleźć jeden fragment sekwencji, naukowcy musieli pobierać całe zbiory danych i manualnie porównywać wyniki, co zajmowało cenny dla badaczy czas, a dla ośrodków badawczych komputery i pieniądze potrzebne na zapewnienie ciągłości ich pracy.

Szwajcarscy naukowcy postanowili to zmienić, przenosząc logikę wyszukiwania znaną z Google’a do świata biologii

MetaGraph działa niemal jak klasyczna wyszukiwarka internetowa: badacz wpisuje interesującą go sekwencję genetyczną, a system błyskawicznie sprawdza, w jakich próbkach z całego świata już się ona pojawiła. Klucz tkwi w sposobie przechowywania danych. Zamiast trzymać każdy odczyt w niezmienionej postaci, naukowcy kompresują go matematycznie – choćby trzystukrotnie – zachowując przy tym wszystkie powiązania i kontekst. Jak tłumaczą autorzy, efekt przypomina streszczenie książki: skrócone, ale bez utraty treści.

Dzięki temu cały globalny zbiór publicznych sekwencji DNA można zmieścić na kilku zwykłych dyskach twardych. To, co kiedyś wymagało superkomputera, dziś można uruchomić na akademickim klastrze – zbiorze stosunkowo niedrogich komputerów podłączonych do sieci – albo choćby laptopie. Koszt przeszukania jednej megabazy DNA to zaledwie 0,74 dolara (ok. 2,71 zł), a proste zapytanie można wykonać za równowartość kilkudziesięciu złotych.

Szybkie przeszukiwanie genomów ma ogromne znaczenie praktyczne. Narzędzie może przyspieszyć badania nad antybiotykoopornością, nowymi wirusami czy terapiami genowymi. Umożliwi też lepsze reagowanie na przyszłe pandemie, gdy najważniejsze stanie się odnalezienie znanych wcześniej fragmentów kodu w nowych patogenach. ETH Zurich udostępniło MetaGraph w formie open source i planuje objąć nim wszystkie publicznie dostępne dane DNA i RNA do końca roku.

Profesor Gunnar Rätsch, współautor projektu, przyznaje, iż inspiracją była właśnie idea wyszukiwarki internetowej. „Jeszcze niedawno nikt nie wierzył, iż takie coś jest możliwe. Teraz możemy przeszukiwać cały genomiczny internet w czasie rzeczywistym” – mówi.

Choć MetaGraph powstał z myślą o naukowcach, jego twórcy przewidują, iż w przyszłości podobne narzędzia mogą trafić także do użytkowników indywidualnych – np. do rozpoznawania roślin czy bakterii z domowych testów DNA.

Nauka nie musi być nudna:

Idź do oryginalnego materiału