Statystyka od Podstaw z wykorzystaniem narzędzi SAS

Nr przedmiotu: 136030-0131 SLLD

Prowadzący: dr hab. Ewa Frątczak, dr Sebastian Zając
Zakład Analizy Historii Zdarzeń i Analiz Wielopoziomowych

Ćwiczenia 1

Libname sop 'C:\sciezka do katalogu';

proc import
datafile="C:\sciezka do pliku\diagnoza07.xls"
out=sop.diagnoza07
dbms=xls
replace;
getnames=yes;
run;

proc export data=sop.diagnoza07
outfile="C:\Twoj_katalog\diagnoza07_.dta"
dbms=dta
replace;
run;
proc export data=sop.diagnoza07
outfile="C:\Twoj_katalog\diagnoza07_.csv"
dbms=csv
replace;
run;

proc contents data=sop.diagnoza07;
run;

proc sort data=sop.diagnoza07 out=sop.d2(keep = ID_GOSP DOCHM);
by DOCHM;
where DOCHM>=0;
run;
/* sql */ proc sql;
create table sop.d2_sql as
select t1.id_gosp, t1.dochm
from sop.diagnoza07 t1
where t1.dochm >= 0
order by t1.dochm ;
quit;

data work.d6_9;
set sop.diagnoza07;
where dochm >= 6000 and dochm <= 9000;
keep ID_GOSP WOJ PLEC STAZP DOCHM;
run;

/* format danych */ proc format lib=work;
value plecfmt
1 = "Mężczyzna"
2 = "Kobieta"
; value wojfmt
2= 'DOLNOŚLĄSKIE'
4= 'KUJAWSKO-POMORSKIE'
6= 'LUBELSKIE'
8= 'LUBUSKIE'
10= 'ŁÓDZKIE'
12= 'MAŁOPOLSKIE'
14= 'MAZOWIECKIE'
16= 'OPOLSKIE'
18= 'PODKARPACKIE'
20= 'PODLASKIE'
22= 'POMORSKIE'
24= 'ŚLĄSKIE'
26= 'ŚWIĘTOKRZYSKIE'
28= 'WARMIŃSKO-MAZURSKIE'
30= 'WIELKOPOLSKIE'
32= 'ZACHODNIOPOMORSKIE'
;
run;
/* zastosowanie formatów wer 1*/
data sop.d6_9_names1;
set sop.d6_9;
format plec plecfmt. woj wojfmt. ;
label id_gosp="ID" plec="Płeć" dochm="Dochód" woj="Województwo";
run;
/* zastosowanie formatów wer 2*/
proc sql;
create table sop.d6_9_names_2 as
select t1.kmz, t1.woj format=wojfmt., t1.plec format=plecfmt. ,
t1.dochm format=nlmnlpln12.
from sop.d6_9 t1;
quit;

proc sql;
create table sop.raport1 as
select t1.woj format=wojfmt,
(SUM(t1.dochm)) format=nlmnlpln12. as dochody_total,
(AVG(t1.dochm)) format=nlmnlpln12. as sredni_dochod
from sop.diagnoza07 t1
group by t1.woj;
quit;

proc tabulate data=sop.diagnoza07;
where plec not in (-8,-2,-1) and dochm>=0;
var dochm;
class woj plec;
format plec plecfmt.
woj wojfmt.;
Table
dochm={label="dochód"}*woj={label='wojewodztwo'}*plec={lable="płeć"},
min, Mean={label="srednie dochody} Median={label="madiana dochodów"} max;
run;