Multivariat analyse og kategoriserede data

Kurset er en fusion af Erling B. Andersens tidligere kurser "Multivariate statistiske metoder med sas" og "Kategoriserede data".

 

ECTS 8 ECTS point.

 

Forudsætninger

Kurset bygger på de obligatoriske matematik-, statistik og økonometrikurser på bachelorstudiet herunder SAS-gennemgangen i disse kurser.


Foreløbig pensumplan

1)     Erling B. Andersen : Noter til Multivariate Statistiske Metoder med SAS, Økonomisk Institut 2002 – ca. 100 sider Findes på internettet
2) Erling B. Andersen:  Introduction to the Analysis of Categorical Data. Heidelberg. Springer Verlag. 1997 – kapitlerne 1 – 5 samt 8 – i alt ca. 150 sider.
3) Anders Milhøj Supplerede noter (udleveres ved forelæsningerne)

 

Undervisningssprog Dansk

 

OBS Oplysninger om noterne 1) og 3) gives ved forelæsningerne. Bogen 2) er bestilt i Studenterbogladen, men den skal tidligst bruges efter efterårsferien/påskeferien.

 

Jeg vil gerne have en tilmelding via Absalon, hvor nærmere beskrivelser herunder om tid og sted findes.

 

 

Formål

At gøre de studerende fortrolige med statistiske modeller for analyse af større datasæt med flere variable, der indgår simultant på lige fod i modellen. Det skal ses som en modsætning til regressionsmodeller, der alle antager at visse variable er responsvariable (altså specielt interessante), mens andre er forklarende variable. Der betragtes både diskrete og kontinuerte variable.

At sætte deltagerne i stand til på egen hånd at gennemføre de praktiske statistiske analyser ved hjælp as SAS.

 

Indhold

1) Introduktion

Kort repetition af de vigtigste matrixoperationer, herunder dekomponering i egenværdier og egenvektorer, herunder også brug af SAS .

2) Multivariatate modeller

Faktoranalyse, herunder principalkomonentmetoden.
LISREL-modeller (Struktural Equation Modelling).

3) Modeller for kategoriserede data

Det teoretiske grundlag er de log-lineære modeller, ved hjælp af hvilke man kan gennemføre en samlet beskrivelse af samvariationen eller afhængighederne mellem flere diskrete variable. Først gennemgås teorien for log-lineære modeller og disse modellers anvendelse på 2- og 3-dimensionale kontingenstabeller. Derefter gennemgås de log-lineære modeller for tabeller af højere dimension med hovedvægten lagt på modeludvælgelse og fortolkning af den model, der udvælges til beskrivelse af materialet.


Undervisningsform

Forelæsninger kombineret med praktiske dataanalyser med skærmprojektor. Desuden  regning og gennemgang af mindre opgaver etc. i form af computerbaseret fjernundervisning.

 

Evaluering

Første opgave stilles før efterårsferien og afleveres ca. 1. november/1. april

Anden opgave stilles ca. 15. november og afleveres ca. 1. december/1. maj.

Tredje opgave stilles ca. 10. december og afleveres mellem jul og nytår/20 maj og afleveres ca. 15. juni


De to første opgaver er indlæringsopgaver, der skal godkendes. De kan afleveres i grupper op til tre studerende.

Den tredje opgave besvares INDIVIDUELT og bedømmes med deltagelse af ekstern censor. Der gives karakter efter den nye 7-trins skala.

Diverse materialer til download:

Mutivariat normalfordeling september 2006.pdf

Opgave i todimensional normalfordeling sep 2006.pdf

skolemultkat.sas7bdat

d89um.sas7bdat