Moćni alati otkrivaju kontrolne poluge genoma koje uključuju i isključuju gene

D. M.
Vreme čitanja: oko 6 min.

Foto: Shutterstock / FOTOGRIN

Ubrzavajući identifikaciju DNK sekvenci koje kontrolišu gensku ekspresiju, istraživanja otkrivaju skrivenu gramatiku regulatornog genoma — i daju naučnicima sredstva da je ponovo napišu.

Uprkos tome što naučnici govore o „dekodiranju genoma“, realnost je da genom nije čak ni napisan na jednom jeziku. Naučnici dobro poznaju tronukleotidne kodone koji čine gene za kodiranje proteina u DNK. Međutim, oni predstavljaju svega oko 2% genomskog teksta. Ostatak je napisan na potpuno drugačijem jeziku, koji istraživači tek treba da raspetljaju.

„Kad god sekvenciramo ljudsku individuu, dobijemo oko 3,5 miliona varijanti, a samo 0,6% njih će se nalaziti u kodirajućim regionima“, kaže Nadav Ahituv, genetičar sa Kalifornijskog univerziteta u San Francisku. Taj delić je relativno lako protumačiti, ali za ostatak „zapravo ne razumemo šta radi — nemamo regulatorni kod“.

Međutim, istraživači napreduju u dekodiranju regulatornog regiona genoma i učenju osnovne gramatike elemenata koji upravljaju time kad i gde se geni uključuju i isključuju. Da bi to postigli, okrenuli su se skupu metoda poznatom kao masovno paralelni reporterski testovi (MPRA). Ovi alati mere kako milioni izolovanih genetskih elemenata ili varijanti sekvenci utiču na ekspresiju izabranog „reporterskog“ gena.

To pomaže istraživačima da identifikuju kontrolne poluge genoma i raspetljaju njihovu funkciju bez preplavljenosti svim ostalim delovima genoma. „Radi se o redukciji na ovaj sintetički sistem. Ipak, i dalje se zadržava dovoljno složenosti za ispitivanje genomskog prostor koji ne razumemo u potpunosti“, kažu istraživači.

MPRA može pomoći u razjašnjavanju genetskih osnova bolesti, otkrivanju promena nastalih evolucijom i usmeravanju razvoja terapija sledeće generacije. Čak se može koristiti za obuku sistema veštačke inteligencije u cilju dizajniranja genetskih sklopova, sa primenama u zdravstvu i drugim sektorima. Prilagođeni regulatorni elementi bi mogli, na primer, da pojačaju kontrolu genskih terapija i osiguraju da se tretmani aktiviraju samo u specifičnim tkivima i pod određenim uslovima, minimizirajući opasnost od neželjenih efekata. „Pokušavamo da napravimo stvari koje bi se mogle uključiti vrlo lako i jednostavno, čak ne putem nekog leka“, kaže Ahituv.

Nekodirajući genom, naravno, nije potpuna misterija. Istraživači su identifikovali hiljade proteina, zvanih transkripcioni faktori, koji imaju utvrđene uloge u genskoj ekspresiji, i precizno locirali DNK sekvence za koje se vezuju.

Mapirajući ove sekvence širom genoma, naučnici mogu predvideti koje iniciraju ekspresiju gena — takozvani promoteri — a koje funkcionišu kao dugmad za jačinu zvuka, ili pojačivači, kako bi pojačali tu ekspresiju pod specifičnim uslovima. Takođe mogu tražiti potpise regulatornih elemenata ispitujući genomske regione u kojima je DNK izložena i spremna za transkripciju. Hromozomska DNK je omotana oko proteina, formirajući materijal koji se zove hromatin. Elementi u gusto upakovanom hromatinu su generalno nedostupni regulatornim proteinima i stoga neaktivni.

Međutim, potvrđivanje ovih predikcija podrazumeva mukotrpan proces testiranja kako različite mutacije u pojedinačnim pojačivačima ili promoterima utiču na obližnje gene. „Shvatio sam da, ako želimo da ikad kompjuterski analiziramo i predvidimo pojačivače, ne bi nam bio potreban mali broj pojačivača — trebale bi nam stotine hiljada“, kaže Aleksandar Štark, kompjutacioni biolog iz Instituta za molekularnu patologiju u Beču.

Postavljanje reguloma na mapu

Savremeni MPRA mogu se izvoditi u ogromnim razmerama, omogućavajući sveobuhvatna genomska ispitivanja regulatornog pejzaža. „Najveći MPRA koji smo uradili bio je ukupno blizu dve milijarde fragmenata“, kažu istraživači.

Mnogi od ovih eksperimenata fokusiraju se na mapiranje lokacija pojačivača širom genoma i učenje kako pokreću gensku ekspresiju u određenim tkivima. Ispitivanje ćelija vinskih mušica i sisara otkrilo je mnoge elemente koji bi bili nevidljivi putem drugih metoda jer su generalno neaktivni u gusto zbijenom hromatinu.

Prošle godine, istraživači su izvestili o sistematskoj analizi skoro svake poznate regulatorne sekvence u ljudskom genomu. Testirali su kako različite kombinacije promotera i pojačivača utiču na aktivnost reporterskih gena u tri linije ljudskih ćelija. Istraživana je komunikacije između genomskih regulatornih elemenata. Pojačivači i promoteri pokazuju neki stepen kompatibilnosti — da li mogu ili ne mogu da komuniciraju jedni sa drugima. U pitanju su gradirani nivoi kompatibilnosti.

Međutim, MPRA mogu da ispitaju samo određeni deo genomskog terena. Sintetičke DNK biblioteke postaju teške i skupe za proizvodnju dok postaju duže. Neobično je da MPRA biblioteka sadrži sekvence duže od 1.000 baza — što je ozbiljno ograničenje, pošto prirodni regulatorni regioni genoma mogu biti mnogo veći.

MPRA stoga daju redukcionistički pogled na regulaciju gena. Reporterski testovi govore šta sekvenca može da uradi, ne nužno šta zapravo radi u genomu. Kao takvi, MPRA zahtevaju znatnu validaciju — koja se može uraditi, na primer, korišćenjem strategija za modifikaciju gena na bazi CRISPR metoda ili transgenskih životinjskih modela.

Razumevanje mutacija

Regulacija gena je pitanje lokacije, tajminga i uslova okoline, a MPRA izveden na statičnoj ćelijskoj kulturi će neizbežno prevideti elemente koji su aktivni samo pod određenim uslovima. Shodno tome, mnogi istraživači razvijaju eksperimentalne varijante za dokumentovanje kako različiti okidači utiču na regulatornu aktivnost.

Osmislili su računarski okvir da bi razumeli koji faktori transkripcije su relevantni za nervnu diferencijaciju. Ti podaci su upotrebljeni da se rekonstruiše regulatorna šema za razvoj mozga i pokaže kako tajming i ćelijsko okruženje moduliraju aktivaciju ili represiju gena putem različitih regulatornih domena.

Druge grupe istražuju kako različiti regulatorni elementi reaguju na specifične fiziološke i okolne okidače. Razvijaju jednoćelijske MPRA radi procene efekta varijanti regulatornih sekvenci u pojedinačnim ćelijama, a ne u ćelijskim populacijama. Koriste ovaj pristup da bi razumeli kako različite varijante regulatornih sekvenci ili mutacije dovode do abnormalne aktivacije T-ćelija u kontekstu autoimunskih poremećaja.

MPRA testovi takođe mogu pomoći u razumevanju genetike u osnovi ljudskih bolesti. Decenije genomskih studija su otkrile bezbroj varijanti koje imaju veze sa stanjima poput Alchajmerove bolesti, dijabetesa i raka. Međutim, mnoge od ovih varijanti nalaze se izvan sekvenci koje kodiraju proteine.

Prošle godine je dizajniran MPRA za analizu skoro 18.000 genetskih varijanti povezanih sa osam psihijatrijskih poremećaja. Istraživači su identifikovali podskup mutacija sa jasnim efektom na ekspresiju gena. Varijante identifikovane na ovaj način mogle bi biti korišćene u cilju razvoja boljih alata za dijagnostiku i predviđanje rizika.

I druge grupe primenjuju MPRA na genetske osnove bolesti. Istražuju kako mutacije regulatornih sekvenci doprinose različitim kancerima. MPRA se koristi i za procenu potencijalnih efekata više od milion varijanti regulatornih sekvenci na ljudsko zdravlje.

MPRA čak daju uvid u evoluciju. Godine 2021, test je upotrebljen za procenu funkcionalnog uticaja sekvenci koje su se razlikovale između modernog ljudskog genoma i genoma neandertalaca i denisovaca. Otkrivene su stotine regiona sa merljivim regulatornim uticajem u ćelijama mozga i kostiju. Nastavlja se ispitivanje kako ove i druge varijante doprinose posebnim fizičkim i kognitivnim odlikama modernih ljudi.

Ima još mnogo da se uči

S obzirom na obim i složenost podataka proizvedenih tipičnim MPRA eksperimentom, mnoge istraživačke grupe su se okrenule dubokom učenju da bi protumačile rezultate. Nakon obuke sa MPRA podacima koji su obuhvatali deset miliona genomskih fragmenata, model je mogao precizno da predvidi sekvence koje aktiviraju ili potiskuju transkripciju i pri osnovnom stanju i kao odgovor na okidače kao što su promene temperature i izloženost određenim hemikalijama. Korist postoji i u pogledu istraživanja raka, omogućavajući simulaciju efekata različitih mutacija. Modelu možete samo dati bilo koji mutantni oblik DNK i reći će vam koliko je aktivan — a predviđanja su obično prilično dobra, kažu naučnici.

Međutim, ovi modeli se zasad muče da generalizuju svoja predviđanja na širok spektar ćelijskih tipova i eksperimentalnih uslova. Pitanje od milion dolara je kako možete obučiti model da predvidi regulatornu aktivnost na tipu ćelije koji je nepoznat za MPRA. Odgovor je, delimično, 'više podataka', a dobra vest je da je obilan materijal za obuku već dostupan. Na primer, arhivirano je više od 17 miliona sekvenci iz 129 eksperimenata izvedenih u raznim laboratorijama. Raznolikost MPRA, pak, može otežati direktno poređenje — a stoga i kombinovanje — rezultata različitih eksperimenata.

Ako bi se ovi problemi rešili, korist bi mogla biti ogromna. Ahituv je posebno uzbuđen zbog implikacija po terapije sledeće generacije — od genskih terapija koje postižu preciznu specifičnost tkiva i izuzetne kontrole nivoa ekspresije do genetskih manipulacija koje selektivno primoravaju tumorske ćelije na samouništenje ili izlaganje imunskom sistemu. „Ima mnogo posla gde bi veštačka inteligencija bila od ogromne pomoći“.

(Telegraf Nauka/Nature)