Estimering av tetthetsfunksjoner med flere variabler
Håkon Otneim disputerer for ph.d.-graden ved Universitetet i Bergen den 23.09.2016 med avhandlingen ”Multivariate and conditional density estimation using local Gaussian approximations”.
Hovedinnhold
En sentral størrelse i statistikken er tetthetsfunksjonen for tilfeldige variable. Ved hjelp av tetthetsfunksjonen for et bestemt fenomen kan vi gjøre teoretiske beregninger om hvordan fremtidige observasjoner vil se ut. For eksempel kan vi regne ut hva vi sannsynligvis kan forvente, hvor mye observasjonene vil variere, og hva sannsynligheten er for å få et ekstremt utfall.
Slike betraktninger er svært viktige i empirisk forskning innen naturvitenskap, medisin, samfunnsfag og økonomi. For eksempel er det mye som tyder på at mange økonomiske modeller var bygget på uriktige tetthetsfunksjoner før finanskrisen i 2008. Disse funksjonene anslo sannsynligheten for at en slik krise skulle inntreffe til å være alt for liten, gitt det som faktisk hendte i ettertid. Problemet er nettopp at vi stort sett ikke kjenner de teoretiske tetthetsfunksjonene som beskriver hvordan utfall av komplekse og tilfeldige prosesser vil fordele seg. Vi må da estimere dem ved hjelp av historiske data, og dette er en viktig oppgave for en statistiker.
Det eksisterer en rikholdig littertur som løser denne oppgaven i en rekke praktiske situasjoner, men vi får et problem dersom følgende er tilfelle: 1) Vi må estimere tetthetsfunksjonen til mange variable samtidig, og 2) Vi har på forhånd ingen informasjon om hvordan den ukjente tetthetsfunksjonen ser ut. Da er det en fare for at tradisjonelle metoder ikke vil fungere godt.
Når vi ikke kan estimere tetthetsfunksjonen eksakt, gjelder det å finne en tilnærming som er så nær sannheten som mulig. I denne avhandlingen kombineres kjente teknikker med en ny forenklende struktur som vi legger på den ukjente tetthetsfunksjonen. Resultatet er en estimeringsmetode som både er robust nok til at den lar seg gjennomføre i praksis, men også fleksibel nok til at den lar seg anvende i mange forskjellige situasjoner. Dette vises gjennom teoretiske beregninger og ved hjelp av eksperimenter med simulerte og reelle datasett. Det vises også hvordan metoden kan utvides til å gjelde estimering av såkalte betingede tetthetsfunksjoner, som har enda større praktisk nytteverdi. Relevant programvare er gjort tilgjengelig på nettet.
Personalia:
Håkon Otneim (f. 1987) er oppvokst og bosatt i Os, og fullførte mastergraden i matematisk statistikk ved Universitetet i Bergen i 2012. Han har vært ansatt som universitetsstipendiat ved Matematisk Institutt frem til 2016 under veiledning av Professor Dag Tjøstheim, og tiltrer 1. oktober som postdoktor ved Norges Handelshøyskole.