Genom-skala algoritmar
Masteremne
- Studiepoeng
- 10
- Undervisningssemester
- Vår
- Emnekode
- BINF301
- Talet på semester
- 1
- Undervisningsspråk
- Engelsk. Norsk om kun norskspråklege studentar deltek
- Ressursar
- Timeplan
Emnebeskrivelse
Mål og innhald
Emnet gi ei innføring i teknologiar, metodar og algoritmar som er brukt i genomikk. Høg-kapasitets sekvenseringsteknologiar har revolusjonert genomikk fagfeltet og gjort det mogleg å rekonstruere genomer, epigenomer og transkriptomer på tvers av populasjonar og på enkelt-celle nivå. Desse omics-teknologiane gir oss unik innsyn i korleis livet fungerer, men analysen av desse datasetta er ei stor bioinformatisk utfordring.
Emnet er delt opp i to delar. Den første delen gir ei oversikt over lange og korte sekvenseringsteknologiar og bruksområder, herunder global biodiversitet, meta-genomikk, enkelt-celle sekvensering, epigenetikk, og medisinsk genomikk.
Den andre delen av emnet fokuserer på dei nyaste algoritmane og data strukturane for å prosessere og analysere data frå høg-kapasitets sekvensering, og bruk av maskinlæringsmetodar for å integrere og få biologisk innsikt frå stor-skala omics-data. Desse teknologiane omfattar de Bruijn grafar, "genome assemblers", Burrows-Wheeler" transformasjon, og "suffic arrays" for genom indeksering og identifisering av gjentak sekvensar ("repeats"), og metodar for gruppering og nettverksrekonstruksjon frå tidsseriedata og populasjonsbaserte -"omics" datasett. Ei innføring i kompleksiteten av algoritmar og ein samanlikning vil også bli presentert.
Læringsutbyte
Studenten skal ved avslutta emne ha følgjande læringsutbyte definert i kunnskapar, ferdighetier og generell kompetanse:
Kunnskapar
Studenten kan
- forklare forskjellige sekvenseringsteknologiar, deira potensial og begrensninger, og deira anvendelsar
- velja og designe metodar for å prosessere, analysere og tolke genomiske, epigenomiske og transkriptomiske sekvenseringsdata
- velja og designe metodar for å samle inn, integrere, analysere og tolke store datamengder frå high-throughput sekvenseringseksperimentar, bl.a. enkeltcelle ("single cell") data og multi-omics data frå same prøve
- velja, integrere og anvende passande verktøy fra forskjellige bioinformatikk- og maskinlæringsbibliotekar
Ferdigheter
Studenten kan
- implementere algoritmar for å prosessere og analysere high-throughput-sekvenseringsdata, f.eks. de-novo assembly
- implementere algoritmar for å integrere og analysere store datamengder med prøver frå multippel high-throughput sekvenseringseksperimentar, til og med clustering og nettverksrekonstruksjon frå tidsseriedata, forstyrrelsesdata og populasjonsbaserte omics data
- anvende bioinformatikk verktøy på Linux kommandolinje
- søkje effektivt i sekvensdatabasar
- implementere eigna skripts og programmer ved hjelp av eksisterande bioinformatikk og maskinlæringsbibliotekar
- tolke resultata frå bioinformatikk- og maskinlærings-pipelines ved hjelp av funksjonell annotasjon, metabolise stiar ("pathways"), og interakjonsdatabasar
- argumentere for val av algoritme og kunne finne årsaker til feil i programmering.
Generell kompetanse
studenten kan
- jobbe sjølvstendig og i små grupper med analyse av high-throughput sekvenseringsdata
- kommunisere analysen og deira biologiske tolking til eit tverrfagleg publikum
- velja og presentere relevante emner innanfor genomikk frå vitenskaplige artiklar
Studienivå (studiesyklus)
Undervisningssemester
Tilrådde forkunnskapar
Vere i stand til å implementere enkle algoritmar i eit programmeringsspråk ein veljar sjølv (fortrinnsvis Python, Java, R eller Perl). Ein grunnleggande forståing for algoritmar og effektiviteten deira samt statistikk er naudsynt.
God bakgrunn innan algoritmar er anbefalt, tilsvarande minst INF102. I tillegg er ein god bakgrunn innan bioinformatikk anbefalt, tilsvarande BINF200, BINF201.
Krav til studierett
Arbeids- og undervisningsformer
Undervisninga gis i form av førelesningar og studentøvingar
Førelesningar, 4 timar per uke
Studentøvingar, 2 timar per uke
Obligatorisk undervisningsaktivitet
Vurderingsformer
I emnet nyttar ein mappevurdering. mappa består av følgjande element:
- innleveringar 30 %
- skriftleg eksamen (3 timar) 70 %
Både innleveringar og eksamen må vere bestått då elementa testar emnet sitt læringutbyte. Det er ordinær eksamen kvart semester. I semesteret utan undervisning er skriftleg eksamen tidleg i semesteret. På første påfølgjande tidleg eksamen vert reaultata frå resten av mappa vidareført.