Genom-skala algoritmar

Masteremne

Emnebeskrivelse

Mål og innhald

Emnet gi ei innføring i teknologiar, metodar og algoritmar som er brukt i genomikk. Høg-kapasitets sekvenseringsteknologiar har revolusjonert genomikk fagfeltet og gjort det mogleg å rekonstruere genomer, epigenomer og transkriptomer på tvers av populasjonar og på enkelt-celle nivå. Desse omics-teknologiane gir oss unik innsyn i korleis livet fungerer, men analysen av desse datasetta er ei stor bioinformatisk utfordring.

Emnet er delt opp i to delar. Den første delen gir ei oversikt over lange og korte sekvenseringsteknologiar og bruksområder, herunder global biodiversitet, meta-genomikk, enkelt-celle sekvensering, epigenetikk, og medisinsk genomikk.

Den andre delen av emnet fokuserer på dei nyaste algoritmane og data strukturane for å prosessere og analysere data frå høg-kapasitets sekvensering, og bruk av maskinlæringsmetodar for å integrere og få biologisk innsikt frå stor-skala omics-data. Desse teknologiane omfattar de Bruijn grafar, "genome assemblers", Burrows-Wheeler" transformasjon, og "suffic arrays" for genom indeksering og identifisering av gjentak sekvensar ("repeats"), og metodar for gruppering og nettverksrekonstruksjon frå tidsseriedata og populasjonsbaserte -"omics" datasett. Ei innføring i kompleksiteten av algoritmar og ein samanlikning vil også bli presentert.

Læringsutbyte

Studenten skal ved avslutta emne ha følgjande læringsutbyte definert i kunnskapar, ferdighetier og generell kompetanse:

Kunnskapar

Studenten kan

  • forklare forskjellige sekvenseringsteknologiar, deira potensial og begrensninger, og deira anvendelsar
  • velja og designe metodar for å prosessere, analysere og tolke genomiske, epigenomiske og transkriptomiske sekvenseringsdata
  • velja og designe metodar for å samle inn, integrere, analysere og tolke store datamengder frå high-throughput sekvenseringseksperimentar, bl.a. enkeltcelle ("single cell") data og multi-omics data frå same prøve
  • velja, integrere og anvende passande verktøy fra forskjellige bioinformatikk- og maskinlæringsbibliotekar

Ferdigheter

Studenten kan

  • implementere algoritmar for å prosessere og analysere high-throughput-sekvenseringsdata, f.eks. de-novo assembly
  • implementere algoritmar for å integrere og analysere store datamengder med prøver frå multippel high-throughput sekvenseringseksperimentar, til og med clustering og nettverksrekonstruksjon frå tidsseriedata, forstyrrelsesdata og populasjonsbaserte omics data
  • anvende bioinformatikk verktøy på Linux kommandolinje
  • søkje effektivt i sekvensdatabasar
  • implementere eigna skripts og programmer ved hjelp av eksisterande bioinformatikk og maskinlæringsbibliotekar
  • tolke resultata frå bioinformatikk- og maskinlærings-pipelines ved hjelp av funksjonell annotasjon, metabolise stiar ("pathways"), og interakjonsdatabasar
  • argumentere for val av algoritme og kunne finne årsaker til feil i programmering.

Generell kompetanse

studenten kan

  • jobbe sjølvstendig og i små grupper med analyse av high-throughput sekvenseringsdata
  • kommunisere analysen og deira biologiske tolking til eit tverrfagleg publikum
  • velja og presentere relevante emner innanfor genomikk frå vitenskaplige artiklar

Studienivå (studiesyklus)

Master

Undervisningssemester

Vår.
Krav til forkunnskapar
Tilrådde forkunnskapar

Vere i stand til å implementere enkle algoritmar i eit programmeringsspråk ein veljar sjølv (fortrinnsvis Python, Java, R eller Perl). Ein grunnleggande forståing for algoritmar og effektiviteten deira samt statistikk er naudsynt.

God bakgrunn innan algoritmar er anbefalt, tilsvarande minst INF102. I tillegg er ein god bakgrunn innan bioinformatikk anbefalt, tilsvarande BINF200, BINF201.

Krav til studierett
For oppstart på emnet er det krav om at du har ein studierett knytt til eit masterprogram/ ved Fakultet for naturvitskap og teknologi eller ph.d.-utdanninga. www.uib.no/nt/52646/studere-ved-fakultet-naturvitenskap-og-teknologi
Arbeids- og undervisningsformer

Undervisninga gis i form av førelesningar og studentøvingar

Førelesningar, 4 timar per uke

Studentøvingar, 2 timar per uke

Obligatorisk undervisningsaktivitet
Godkjent obligatorisk aktivitet er gyldig i 1 påfølgande semester etter godkjenninga.
Vurderingsformer

I emnet nyttar ein mappevurdering. mappa består av følgjande element:

  • innleveringar 30 %
  • skriftleg eksamen (3 timar) 70 %

Både innleveringar og eksamen må vere bestått då elementa testar emnet sitt læringutbyte. Det er ordinær eksamen kvart semester. I semesteret utan undervisning er skriftleg eksamen tidleg i semesteret. På første påfølgjande tidleg eksamen vert reaultata frå resten av mappa vidareført.

Karakterskala
Karakterskalaen A-F blir nytta.
Vurderingssemester
Det er ordinær eksamen kvart semester. I semesteret utan undervisning er eksamen tidleg i semesteret.
Litteraturliste
Litteraturlista vil vere klar innan 01.07. for haustsemesteret og 01.12. for vårsemesteret.
Emneevaluering
Studentane skal evaluere undervisninga i tråd med UiB og instituttet sitt kvalitetssikringssystem.
Hjelpemiddel til eksamen
Enkel kalkulator tillatt, i samsvar med modeller angitt i fakultetets regler
Programansvarleg
Programstyret har ansvar for fagleg innhald og oppbygging av studiet og for kvaliteten på studieprogrammet og alle emna der.
Emneansvarleg
Emneansvarleg og administrativ kontaktperson finn du på Mitt UiB, kontakt eventuelt studieveileder@ii.uib.no
Administrativt ansvarleg
Fakultet for naturvitskap og teknologi ved Institutt for informatikk har det administrative ansvaret for emnet og studieprogrammet.