Anvendt regressionsanalyse



Data på maskinlæsbar form



Anders Milhøj





Data findes på S-disken ordnet med følgende system, jf. sas-vejledningen for windows.



Data er også på disketten, der følger med bogen:

Andersen, Bedsted, Brentved,Jakobsen og Stene: Brugerhåndbog i SAS, Akademisk Forlag 1995.



s:\usisas findes filerne med efternavn sas. De indeholder læseordrer til sas.



s:\usidat findes data med efternavn dat. de indeholder de rene tal.



s:\usitext findes for enkelte data kilder etc med efternavn txt.



Tabellerne nedenfor angiver navnene på filerne svarende til de enkelte datasæt.



Desuden findes data på internettet ved hjælp af nedenstående links.. Data ligger som SAS datasæt i SAS version 6 format (det hedder SD2 som filtype)







Eksempler fra lærebogen :



Eksempel nummer i lærebogen filnavn
1.1 priv
2.1 bistsjal
6.3 gronkut
7.2 sengedag
7.6 tvkig
8.2 hongkong
8.4 taepper
10.1 amtudg9
10.2 invomk
11.2 oblpan
12.1 ejerlejl
14.1 bisthovs
14.2 region1








Opgaver i lærebogen :



Opgave nummer i lærebogen filnavn
1.6 kyndby
2.3 beftilv
2.4 forsik
4.3 bilsik
7.4 micra
11.1 japan
11.2 pankrea
12.1 typehus
eks 84 sce
eks86 canada
eks 87/88 histdata
eks 89 solid1
eks 90/91 baumol




Som en service er indholdet af alle filerne på s:\usisas listet nedenunder, da de i de fleste tilfælde identificerer variablene. Ellers er variablenes betydning angivet ved kommentarer nedenfor. I nogle af datasættene er der variable, der ikke anvendes i lærebogen.





priv (variablen aar betegner måneden og årstallet)

data a;

infile 's:\usidat\priv.dat';

input OBS AAR DMDINDEX DMDPRIV;

run;





bistsjal

DATA BISTSJAL;

INFILE "s:\usidat\BISTSJAL.dat" ;

INPUT NR BISTAND BOLIG UNGE UGIFTE URBAN;

run;





gronkut

data a;

label kr = "Indhandlede værdi i 1000 kr";

label alder = "Skibets alder i 1991";

label hk = "Antal HK";

label indh = "Antal indhandlinger";

label bes = "Antal besætningsmedlemmer";

label brt = "Antal Bruttoregistertons";

label hjemsted = "Skibets indregistreringssted, Hjemsted";

/*

-brt

Mange fiskekuttere er "målt ned" til under 20 brt p.g.a

bemandingsreglerne.

-hjemsted

1: Sydgrønland (Nanortalik, Qaqortoq og Narsaq)

2: Midtgrønland (Paamiut, Nuuk, Maniitsoq og Sisimiut). Isfri hele året.

3: Diskobugten (Kangaatsiaq, Aasiaat, Qasigiannguit og Ilulissat)

*/

infile 's:\usidat\gronkut.dat';

input kr alder hk indh bes brt hjemsted;

syd=0;disko=0;

if hjemsted=1 then syd=1;

if hjemsted=2 then disko=1;

brtu19=0;brto20=0;

if brt<19 then brtu19=1;

if brt>20 then brto20=1;

run;





sengedag (tallene læses formateret og @ angiver hvilken kolonne tallet starter i)

data sengedag;

INFILE "s:\usidat\SENGEDAG.dat" ;

input @1 navn $15.

@21 s80 4.

@26 a80 6.

@33 s 1.;

run;





tvkig (Q45 er det antal timer, der ses fjernsyn)

data a;

infile 's:\usidat\tvkig.dat';

input OBS Q45 KON GAMMEL TV3;

run;





hongkong

data a;

infile 's:\usidat\hongkong.dat';

input aar cont;

run;





taepper (variablen uds angiver den udsalgspris, der anvendes i bogen. Variablen norm er en normalpris)

data a;

infile "s:\usidat\taepper.dat";

input art $ navn $ l1 l2 norm uds;

run;







amtudg9

data a;

infile 's:\usidat\amtudg9.dat';

input OBS NR NAUDG9 NAENLF;

run;





invomk(variablen admabs er responsvariablen)

data a;

infile 's:\usidat\invomk.dat';

input navn $ adm formue;

admabs=adm*formue;

run;





oblpan

DATA A;

infile 's:\usidat\oblpan.dat';

INPUT AAR OBL AKT PAN AAR1;

run;

data b;

set a;

if aar<198400 then delete;

if aar>198900 then delete;

run;





ejerlejl

DATA EJERLEJL;

INFILE "s:\usidat\EJERLEJL.dat" ;

INPUT NR STUE AREAL FJERNV VURDSUM OPAAR CENTRAL OVN UDENBAD BAD1 WC;

run;





bisthovs

DATA BISTHOVS;

INfile "s:\usidat\BISTHOVS.dat" ;

INPUT NAVN $ BISTAND INDBYG BOLIG UNGE ENLIGE;

run;





region1

data region;

infile "s:\usidat\REGION1.dat" ;

input region branche1 branche2 vdtlv invest loen el;

i+1;

run;





kyndby

DATA KYNDBY;

INFILE "s:\usidat\KYNDBY.dat" ;

INPUT NAVN $ PERIODE ELPROD KULOLIE;

run;





beftilv

DATA BEFTILV;

INFILE "s:\usidat\BEFTILV.dat" ;

INPUT NR BEFTILV BESK KVBESK FOEDSHYP REGION1 REGION2;

RUN;





forsik (variablen skat er indbetalte skatter og gebyrer)

data a;

infile "s:\usidat\forsik.dat";

input navn :$50. praem adm skat;

run;







bilsik (variablen adk betegner aresponsvariablen antal dræbte og kvæstede, abil antal biler og akm antal km)



data a;

infile 's:\usidat\bilsik.dat';

length navn $ 30;

input navn adk abil akm;

run;







micra

data a;

infile 's:\usidat\micra.dat';

input pris km aar;

run;





japan

DATA JAPAN;

INFILE "s:\usidat\JAPAN.dat" ;

INPUT KONFLIKT LEDIG PRIS;

label konflikt='Indeks for arbejdskonflikter';

label pris='Forbrugerprisstigninger i pct';

label ledig='Arbejdsløshed i pct';

RUN;







pankrea (variablen a9total er det totale antal dødsfald, a9mtota og a9ktota antal dødsfald blandt hhv. mænd og kvinder)

DATA A;

infile 's:\usidat\pankrea.dat';

INPUT AAR1 AAR ALKOHOL A9TOTAL A9MTOTA A9KTOTA;

run;







typehus

DATA TYPEHUS;

infile "s:\usidat\TYPEHUS.dat" ;

INPUT NR PRIS AREAL SOVEVAR KAELDER TERRASE BAD GARAGE CENTVARM PEJS

VASK VINKEL;

run;





sce

data sce ;

infile "s:\usidat\SCE.dat" ;

INPUT

INPUT BOPAEL NR KOEN TOBAK ALDER HG PB CD SE KOST SCE;

i+1;

run;





canada

DATA CANADA;

INFILE "s:\usidat\CANADA.dat" ;

LABEL NR='Obs. nr.'

AAR='År'

LABPAR='%-del voksne kvinder i arbejdsstyrken'

FERT='Fertilitetskvotient'

WOMEN='Gensn. netto ugel. for kv.'

DEBT='Forbrugsgæld pr. capita '

PART='Andel af deltidsarbejdene';

INPUT NR AAR FERT MEN WOMEN DEBT PART LABPAR;

RUN;





histdata

DATA HISTDATA;

infile "s:\usidat\HISTDATA.dat" ;

INPUT AAR LOEN BFI LEDIG ORGGRAD STREJKER;

i+1;

run;





solid1

data solid ;

infile "s:\usidat\SOLID1.dat" ;

input nr x1 x2 x3 x4 x5 y1;

i+1;

run;







baumol (variablen aar er ikke i data, men den konstrueres så første observaton er 1960 etc. @ angiver kolonnen, hvor første observaiton findes.)

data baumol;

INFILE "s:\usidat\BAUMOL.dat" ;

retain aar 1959;

aar+1;

input @1 aeldre 4.

@7 kvierh 4.

@13 reger 1.

@19 arblos 4.

@25 y 7.6

@36 baumol ;

format y 8.7;

run;