Opracowanie innowacyjnego testu diagnostycznego do oceny przebiegu COVID-19 oraz powikłań

Opis projektu

 

 

 

Budżet projektu 11 979 750 zł

Celem projektu jest przeprowadzenie badań i prac rozwojowych w kierunku opracowania nowego rodzaju testu umożliwiającego ocenę przebiegu choroby wywołanej koronawirusem, co następnie przyczyni się do opracowania nowych metod prewencji rozprzestrzeniania się zakażenia wirusem SARS-CoV-2 i zwalczania choroby COVID-19. Test będzie umożliwiał precyzyjne i szybkie wskazanie tych pacjentów, którzy mogą potrzebować hospitalizacji i wykorzystania sprzętu ratującego życie z uwagi na istniejące genetyczne predyspozycje do rozwinięcia ciężkiego przebiegu choroby. Projekt o charakterze niekomercyjnych badań klinicznych, z udziałem około 1000 pacjentów, głównie hospitalizowanych w CSK MSWiA w wyniku zakażenia nowym koronawirusem SARS-CoV-2. Prace rozwojowe będą polegały na sekwencjonowaniu całego genomu (WGS) pacjentów oraz zebraniu szczegółowej historii klinicznej przebiegu infekcji COVID-19. Następnie, przeprowadzona zostanie analiza zebranych informacji w celu identyfikacji markerów genetycznych, determinujących przebieg choroby COVID-19. Analiza porównawcza danych genetycznych osób (1) eksponowanych na wirus, którzy nie ulegli zakażeniu, (2) zakażonych wykazujących łagodne objawy oraz (3) zakażonych - zmarłych w wyniku ciężkiego przebiegu infekcji umożliwi rozpoznanie wariantów genomowych skorelowanych z odpowiedzią organizmu na wirusa. Planowane jest przeprowadzenie analiz całogenomowych (whole genome sequencing, WGS) DNA wyizolowanego z krwi pacjentów, z zastosowaniem algorytmów sztucznej inteligencji używanych dotąd do wyszukiwania markerów genomowych pozwalających m.in. na zastosowanie nowoczesnych terapii celowanych w onkologii. Efektem końcowym badań przeprowadzonych w CSK MSWiA będą wyniki pozwalające na opracowanie nowego testu diagnostycznego wykorzystującego analizę jedynie kilku genów lub ich fragmentów, przy wykorzystaniu standardowego sprzętu typu PCR, w celu identyfikacji osób o szczególnej predyspozycji do ciężkiego przebiegu choroby oraz testowania już zakażonych osób w celu prognozowania przebiegu choroby COVID-19. Test powstały w wyniku projektu pozwoli także na szybkie testowanie personelu medycznego w celu większej ochrony osób narażonych na ciężki przebieg choroby, jednocześnie wskazując te osoby, które są do pewnego stopnia chronione przez dane warianty genomowe, a wobec tego mogą bezpiecznie zapewnić opiekę osobom zakażonym. Warianty genetyczne chroniące pacjenta przed infekcją wirusową są znane dla wirusów HIV czy też H. Simplex. Niniejszy projekt ma na celu identyfikację wariantów chroniących przed wirusem SARS-CoV-2. Jednocześnie, w ramach realizacji projektu w CSK MSWiA stworzone zostanie nowoczesne laboratorium diagnostyki genetycznej wraz z pełną infrastrukturą informatyczną (sprzęt oraz oprogramowanie) umożliwiające prowadzenie zaawansowanej diagnostyki genetycznej.

Cel projektu

Celem projektu jest opracowanie nowego, innowacyjnego testu diagnostycznego dla zakażonych SARS-CoV- 2, w oparciu o materiał pochodzący od chorych i leczonych w Centralnym Szpitalu Klinicznym MSWiA w Warszawie, oraz wypracowanie nowych schematów diagnostycznych z wykorzystaniem rozwiązań w zakresie cyfrowych narzędzi analitycznych i zaawansowanej analizy całogenomowej (WGS, whole genome seguencing) pacjentów z COVID-19. Badanie będzie przeprowadzone w ramach laboratorium analitycznego opartego o światowe standardy z dziedziny analizy genetycznej oraz wykorzystanie innowacyjnych narzędzi analitycznych (machinę learning, Artificial Inteligence). W ramach realizacji projektu stworzone zostanie nowoczesne laboratorium diagnostyki genetycznej umożliwiające prowadzenie zaawansowanej diagnostyki genetycznej dla pacjentów COVID-19, jak również innych chorych wymagających szybkiej diagnostyki genetycznej w przyszłości.

Realizacja projektu zakończy się opracowaniem nowego szybkiego testu diagnostycznego określającego przebieg COVID-19 u badanego pacjenta. W założeniu, test ten będzie umożliwiał precyzyjne i szybkie wskazanie tych pacjentów, którzy mogą potrzebować hospitalizacji i wykorzystania sprzętu ratującego życie z uwagi na istniejące genetyczne predyspozycje do rozwinięcia ciężkiego przebiegu choroby. Jednocześnie test wskaże osoby, które mają minimalne ryzyko rozwinięcia ciężkich objawów COVID-19, co jest szczególnie istotne dla zabezpieczenia personelu medycznego. Ponadto opracowane schematy oceny
genetycznej i algorytmy analityczne będą podstawą budowania polskiego potencjału analitycznego w dziedzinie analizy całogenomowej.

Projekt zakłada wykorzystanie innowacyjnych narzędzi analitycznych (wykorzystanie algorytmów sztucznej inteligencji, machinę learning) w celu opracowania dedykowanego pipeline'u do analizy genomu w poszukiwaniu potencjalnych zmian genomowych korelujących z daną odpowiedzią kliniczną pacjenta na wirusa. Po wytypowaniu genów i rejonów teoretycznie odpowiedzialnych za poszczególny rodzaj odpowiedzi na wirusa przetestowane zostaną warianty potencjalnie ważnych genów populacji (w oparciu o genom referencyjny). Głównym etapem badań jest zatem analiza porównawcza uzyskanych danych z sekwencjonowania z danymi genomu referencyjnego oraz dogłębna i szczegółowa eksploracja danych. Ponieważ sama eksploracja danych i analiza bioinformatyczna zależy od wielkości puli analizowanych genomów, początkowo wychwycone zostaną głównie silne korelacje. Jednak wraz ze wzrostem liczby genomów zauważalne będą również bardziej subtelne warianty, a jednocześnie na tyle istotne, aby wpływać na przebieg choroby. W miarę przebiegu badania doskonalony będzie także algorytm i sama metoda analizy oparta na sztucznej inteligencji, wymagającej stałego „uczenia się". Projekt ma zatem potencjał do rozwoju i zastosowanie do wielu podobnych sytuacji w przyszłości.

Planowane badania obejmują sekwencjonowanie, a następnie przeprowadzenie zaawansowanej analizy całego genomu (WGS) grupy około 1000 pacjentów, z podziałem na:

  • osoby eksponowane na wirusa, które nie uległy zarażeniu pomimo bezpośredniego kontaktu z osobą chorą (np. personel mający kontakt z chorymi, pacjenci narażeni na wirusa, ale z wynikiem ujemnym, zostaną wybrani spośród niepowiązanych członków rodziny zakażonych osób)
  • osoby chore z łagodnym przebiegiem choroby
  • osoby, u których przebieg choroby COVID-19 jest wyjątkowo ciężki, w tym zakończony zgonem pacjenta.

Pierwszym etapem badania jest przeprowadzenie reakcji sekwencjonowania całych genomów pacjentów, z dużą dokładnością i odpowiednim dla tego typu badań pokryciem (minimum 30x), Na podstawie uzyskanych danych będzie możliwe rozpoczęcie właściwej i najbardziej istotnej części badania, czyli analizy bioinformatycznej. Wyselekcjonowane zostaną najważniejsze warianty genetyczne, pozwalające przewidzieć przebieg choroby wirusowej COVID-19. W początkowym etapie projektu planuje się opracowanie algorytmów Al w celu wyszukiwania markerów genomowych korelujących z reakcją na SARS- CoV-2, a także pozwalających przewidzieć przebieg choroby COVID-19. Prace w tym etapie będą polegały na zastosowaniu zastrzeżonych algorytmów uczenia maszynowego i analizy strumieni danych pochodzących z sekwencjonowania całych genomów. Na tym etapie opracowany zostanie zbiór danych analitycznych i algorytmy badania korelacji pomiędzy uzyskanymi wynikami badań genomu wśród osób o różnym przebiegu choroby. Zarówno algorytm jak i baza danych będą rozwijane w kierunku lepszego zrozumienia tej choroby w przyszłości.

W dalszej części projektu planowane jest zaprojektowanie prostego i szybkiego testu do analizy wariantu (lub wariantów) genetycznego u danego pacjenta: w tym celu potrzebne będzie użycie standardowego sekwencjonowania metodą Sangera lub, w wersji najbardziej prawdopodobnej, szybki test wykonywany będzie standardowym termocyklerem do PCR, co znacznie usprawni proces testowania i zmniejszy jego koszty oraz czas wykonania.

Ponadto w pierwszym etapie projektu zostanie stworzone nowoczesne laboratorium genetyczne oraz infrastruktura informatyczna na terenie szpitala CSK MSWiA. Projekt niezbędnego wyposażenia został już opracowany i znajduje odzwierciedlenie w liście sprzętu do zakupu. Po dostarczeniu sprzętu, wyłoniony wykonawca - partner technologiczny - MNM Diagnostics wdroży procedury oraz GLP (Good Laboratory Practice) niezbędne dla prowadzenia zaawansowanego laboratorium genetycznego, zgodnie z obowiązującymi wymogami polskimi oraz EU. Integralnym i niezbędnym elementem nowoczesnego laboratorium genetycznego jest zaawansowana infrastruktura obliczeniowa, pozwalająca na prowadzenie podobnych projektów genetycznych i genomowych w przyszłości. Planowane laboratorium będzie pierwszym tego typu szpitalnym laboratorium w Polsce przystosowanym do analizy danych całogenomowych, tak sprzętowo, jak i bioinformatycznie. Potencjał laboratorium będzie w niedalekiej przyszłości wykorzystywany zarówno do bieżących potrzeb badań i analiz genetycznych, jak również przyszłych badań klinicznych i naukowych, wymagających użycia najnowocześniejszego sprzętu i narzędzi II opartych na uczeniu maszynowym.

Analiza całego genomu zostanie przeprowadzona z wykorzystaniem zakupionej i zainstalowanej w tym celu w CSK MSWiA infrastruktury laboratorium genomowego oraz zaplecza bioinformatycznego Partnera (MNM Diagnostics). Po sekwencjonowaniu, odczytaniu, mapowaniu i wywołaniu wariantów, genomy będą analizowane przez zespół doświadczonych analityków genomowych w celu poszukiwania różnic między trzema grupami pacjentów (niezakażonych pomimo kontaktu, z łagodnymi objawami, z ciężkimi objawami). Uwzględnione będą zarówno najbardziej prawdopodobne warianty genów (w tym opisywane już w literaturze przedmiotu ACE2 czy geny HLA) biorących udział w determinowaniu odpowiedzi na COVID-19, jak również potencjalnie nowe i dotąd nieznane miejsca genomu, w tym również elementy regionów niekodujących genomu, wciąż słabo znane nauce, a które stanowią ponad 98% całego ludzkiego genomu. Jeśli dany wytypowany wariant będzie obecny tylko w jednej grupie pacjentów (oporni, łagodnie reagujący, silnie reagujący), wówczas będzie go można uznać za silny determinant przebiegu choroby. Dlatego planuje się użycie obiektywnych algorytmów uczenia maszynowego, aby wyłonić dowolne warianty genomu
korelujące z odpowiedzią na wirusa. Analiza ta będzie obejmować wszelkie możliwe zmiany i nieprawidłowości genomu, w tym m.in. warianty pojedynczego nukleotydu (SNPs) czy warianty strukturalne elementów regulacyjnych.

Etapy - kamienie milowe:

  • Zbieranie materiału od pacjentów i sekwencjonowanie genomów - do 6 miesięcy
  • Przygotowanie laboratorium do prowadzenia zaawansowanej diagnostyki genetycznej i uruchomienie pracowni. Wdrożenie procedur oraz praktyk GLP - 2-6 miesięcy.
  • Skonfigurowanie oraz uruchomienie infrastruktury obliczeniowej. Przygotowanie zakupionego sprzętu do prowadzenia zaplanowanych prac informatycznych. 2 miesiące
  • Stworzenie dedykowanej ścieżki analitycznej dostosowanej do analizy danych genomowych pacjentów zakażonych SARS-CoV-2 - 2 miesiące.
  • Zakończenie analizy pierwszych 100 genomów pozwalające na rozpoczęcie prac nad algorytmami sztucznej inteligencji dedykowanych do wykrywania markerów genetycznych - 2-3 miesiące
  • zakończenie sekwencjonowania kolejnych 900 genomów -6-8 miesięcy;
  • zakończenie budowy algorytmów sztucznej inteligencji- 2-6 miesięcy,
  • przedstawienie listy markerów henetycznych - 8-10 miesięcy.
  • opublikowanie pierwszych wyników prac 9-12 miesięcy;
  • zakończenie walidacji testu diagnostycznego opartego o metodę PCR, pozwalającego na szybkie i tanie testowanie dużej liczny chorych w warunkach szpitalnych - 10-12 miesięcy.

Przebieg procedur w skrócie: krew zostanie pobrana w ramach standardowej procedury, a próbka krwi zostanie przekazana do laboratorium diagnostycznego CSK MSWiA wyposażonego w dodatkowe, opisane

wyżej urządzenia na cele realizacji projektu. Sekwencjonowanie DNA będzie wykonane technologią lllumina, technika sparowanych końców - długość 150 bp, pokrycie min. 30x., a następnie dane w formacie FastQ zostaną następnie przesłane na dedykowane i dobrze zabezpieczone serwery i poddane właściwym analizom za pomocą zaawansowanych algorytmów w ramach usługi badawczej. Odnalezione warianty genetyczne zostaną skorelowane także z informacjami klinicznymi dotyczącymi przebiegu choroby.

Wykonawca posiada już zgodę Komisji Bioetycznej na prowadzenie w/w badań.

Zastosowanie wyników projektu w praktyce

W efekcie planowanego projektu powstanie po pierwsze test diagnostyczny oparty o metodę PCR, pozwalający na szybkie i tanie testowanie dużej liczby chorych w warunkach szpitalnych; po drugie zebrane dane, niezwykle wartościowe, będą podstawą tworzenia poiskiego rejestru badań genetycznych i genomowych pacjentów COVID-19; po trzecie stworzone zostanie nowoczesne laboratorium genetyczne wraz z zaawansowaną infrastrukturą obliczeniową, pozwalająca na prowadzenie podobnych projektów genetycznych i genomowych w przyszłości; po czwarte, efektem prac będzie również powstanie infrastruktury IT, tak sprzętowej, jak i złożonych algorytmów bioinformatycznych do analizy danych genomowych. Potencjał tak zbudowanego laboratorium będzie wykorzystywany zarówno do bieżących potrzeb badań i analiz genetycznych, jak również przyszłych badań klinicznych i naukowych, wymagających użycia najnowocześniejszego sprzętu i narzędzi IT opartych na uczeniu maszynowym.

Głównym celem badań przeprowadzonych w CSK MSWiA będą wyniki pozwalające na opracowanie nowego testu diagnostycznego wykorzystującego analizę jedynie kilku genów lub ich fragmentów, przy wykorzystaniu standardowego sprzętu typu termocykler PCR, w celu identyfikacji osób o szczególnej predyspozycji do ciężkiego przebiegu choroby oraz testowania już zakażonych osób w celu prognozowania przebiegu choroby COVID-19 i ewentualnego szybkiego wdrożenia procedur mogących uratować pacjentom życie. Test powstały w wyniku projektu pozwoli także na szybkie testowanie personelu medycznego w celu większej ochrony osób narażonych na ciężki przebieg choroby, jednocześnie wskazując te osoby, które są do pewnego stopnia chronione przez dane warianty genomowe, a wobec tego mogą bezpiecznie zapewnić opiekę osobom zakażonym. Warianty genetyczne związane z odpowiedzią pacjenta na infekcją wirusową, w
tym ochronę, są znane dla wirusów HIV, norowirusa czy też H. Simplex. Niniejszy projekt ma na celu identyfikację wariantów chroniących przed nowym wirusem SARS-CoV-2.

Ponadto w pierwszym etapie projektu zostanie stworzone nowoczesne laboratorium genetyczne oraz infrastruktura informatyczna na terenie szpitala CSK MSWiA. Dalej, w wyniku zebrania i analizy całych genomów pacjentów z COVID-19, która pozwoli na poznanie istoty choroby wywołanej koronawirusem, przyczyni się do stworzenia ogromnej bazy danych genomów polskich pacjentów, co w niedalekiej przyszłości pozwoli na realizację wielu prac w kierunku opracowania szybkich testów i potencjalną kopalnię wiedzy dla wielu przyszłych projektów. Omawiany projekt będzie zatem podstawą tworzenia polskiego rejestru badań genetycznych i genomowych pacjentów COVID-19.