Populære Innlegg

Redaksjonens - 2019

Datamodell er "krystallkule" for E. coli-bakterier

Anonim

Det er vanskelig å lage spådommer, spesielt om fremtiden, og enda mer når de involverer reaksjonene til levende celler - store antall gener, proteiner og enzymer, innebygd i komplekse veier og tilbakemeldingsløkker. Likevel forsøker forskere ved Universitetet i California, Davis, Genomsenter og Institutt for datavitenskap bare å bygge en datamodell som forutsetter atferden til en enkelt celle i bakterien Escherichia coli.

annonse


Resultatene av arbeidet ble publisert 7. oktober i journal Nature Communications .

Den nye simuleringen er den største i sitt slag enda, sa Ilias Tagkopoulos, professor i informatikk ved UC Davis, som ledet laget.

"Antall lag, og mengden data som er involvert, er uten sidestykke, " sa han. Datasettet som modellen bygger på, inkluderer for eksempel over 4 389 profiler av uttrykket av forskjellige gener og proteiner på tvers av 649 forskjellige forhold. Både datasettet, kalt "Ecomics" og den integrerte modellen, MOMA (Multi-Omics Model og Analytics) er tilgjengelig for andre forskere å bruke og teste.

Modellen kan være nyttig for forskere som en rask og billig måte å forutsi hvordan en organisme kan oppføre sig i et bestemt eksperiment, sa Tagkopoulos. Selv om ingen prediksjon kan være like nøyaktig som faktisk utfører forsøket, vil dette hjelpe forskere til å designe sine hypoteser og eksperimenter. Applikasjoner spenner fra å finne de beste vekstbetingelsene i bioteknologi for å identifisere viktige veier for antibiotika og stressmotstand.

En uke å laste ned, to år å bygge

Innsamling og nedlasting av dataene tok en uke, men behandling av dataene i et enkelt datasett tok to år av det treårige prosjektet, sa Tagkopoulos. Teamet bygget modeller for fire lag, som begynner med genuttrykk og arbeider opp til aktiviteten på helcellens nivå. Da integrerte de lagene sammen. De brukte teknikker i maskinlæring til å trene modellene for å forutse oppførselen til hvert lag, og til slutt selve cellen, under forskjellige forhold.

Modellen ble bygget på dataklynger ved UC Davis, og på superdatamaskiner tilgjengelig gjennom et nasjonalt nettverk. Forskerne mottok en National Science Foundation-stipend for beregningstid på "Blue Waters", en av verdens mest kraftfulle superdatamaskiner, på National Center for Supercomputer Applications.

Selv om E. coli er en velkjent organisme, er vi langt fra å vite alt om biokjemi og metabolisme, sa Tagkopoulos.

"Vi undersøker en stor plass her, " sa han. "Vårt mål er å skape en krystallkule for bakteriene, som kan hjelpe oss med å bestemme hva som er det neste eksperimentet vi bør gjøre for å utforske dette rommet bedre."

Med samarbeidspartnere hos Mars Inc. håper Tagkopoulos å bygge lignende databaser og modeller for bakterier involvert i matbåren sykdom, som Salmonella enterica og Bacillus subtilis. Han forventer at andre forskere skal trekke på Ecomics-databasen, og håper å gjøre MOMA-modellgrensesnittet mer tilgjengelig for biologer å bruke.

"Vi lever i en fantastisk epoke i krysset mellom datavitenskap, ingeniørfag og biologi, " sa han. "Det er en veldig interessant tid."

Medforfattere på papiret er Minseung Kim på UC Davis-avdelingen for datavitenskap og genomsenter, og Navneet Rai og Violeta Zorraquino, UC Davis Genome Center. Arbeidet ble støttet av US Army Research Office og National Science Foundation.

annonse



Historie Kilde:

Materialer levert av University of California, Davis . Original skrevet av Andy Fell. Merk: Innholdet kan redigeres for stil og lengde.


Tidsreferanse :

  1. Minseung Kim, Navneet Rai, Violeta Zorraquino, Ilias Tagkopoulos. Multi-omics-integrasjonen forutsier nøyaktig mobil tilstand i uutforskede forhold for Escherichia coli . Nature Communications, 2016; 7: 13090 DOI: 10, 1038 / ncomms13090