방송통신대학교(방통대) 통계패키지 과제 (28점/30점)
방통대과제
다운로드
장바구니
소개글
학교: 방송통신대학교(방통대)전공: 정보통계학과
과목: 통계패키지
학기: 2019학년도 1학기
30점 만점 중 28점 받은 과제입니다.
목차
1. (1장 3번 문제) 다음은 한 도시의 20개 중,고교를 대상으로 조사한 흡연율 자료이다. 도시와 농촌별로 흡연율 자료의 기술통계량 및 상자그림을 그리고 비교, 분석하라2. (1장 5번 문제) 다음은 “개인 특성과 경력에 따른 만족도 조사”를 실시한 결과이다. 자료를 입력하고 연령대와 사회분야 만족도에 대해 이차원 분할표를 작성하라.
(1) SPSS를 이용하여 데이터를 입력하고, 변수보기에서 각 이산형 변수의 값에 대한 레이블 및 측도를 지정하라.
(2) 성별, 결혼상태, 직업, 학력에 대한 도수분포표를 구하고, 막대그림, 원그림을 그려보라.
(3) 나이와 월수입과의 관계를 밝히기 위한 산점도를 그려라.
(4) 남녀별 결혼상태에 따라 월급의 평균 및 표준편차를 구하라.
(5) 남녀별로 월급 평균을 나타내는 그림을 그려보라.
(6) 학력별 원그림에서 가장 많이 발생하는 부분을 강조하기 위한 그림을 그려보라.
5. (4장 5번 문제) 연습문제 1번 설문지 자료에서 데이터 통합절차를 이용하여,
(1) 직업별, 종교별, 성별, 교육수준별로 보험금액과 월수입의 평균, 표준편차를 가진 데이터 파일 생성
(2) 직업과 종교를 기준으로 하여 보험금액과 월수입의 평균, 표준편차를 나타내는 데이터 파일을 만들어라.
6. (5장 4번 문제) 다음은 통계학개론을 수강하는 두 학과(A, C)의 성적분포이다. 이 두 그룹을 비교하기 위한 기술통계량을 구하고 줄기-잎 그림, 상자그림을 그려서 비교, 분석하라.
7. (5장 5번 문제) 다음은 통계학 전공(stat) 학생과 전산학 전공(comp) 학생의 통계학 과목에 대한 중간고사 성적과 기말시험 성적을 나타낸 표이다.
(1) 전공에서 stat을 1로, comp를 2로 변환하고, 변수값에 대한 레이블을 주어라.
(2) 중간고사 및 기말고사 성적에 대한 각종 기술통계량을 구하고, 분석하라.
(3) 중간고사 및 기말고사 성적에 대한 히스토그램을 그리고, 분석하라.
(4) 중간고사 및 기말고사 성적에 대한 상자그림과 줄기-잎 그림을 그리고 분석하라.
(5) 전공별로 중간고사 및 기말고사 성적에 대한 히스토그램을 그리고, (3)번의 결과와 비교하라.
(6) 전공별로 중간고사 및 기말고사 성적에 대한 상자그림과 줄기-잎 그림을 그리고, (4)번의 결과와 비교하라.
8. (5장 6번 문제) 다음 자료는 어느 회사의 직원 100명의 나이를 나열한 것이다. 이 자료를 회사의 특수성에 따른 나이의 적합도를 알기 위한 자료로 이용하고자 한다.
(1) 평균과 표준편차를 구하라.
(2) 중앙값 및 사분위수를 구하라.
(2) 중앙값 및 사분위수를 구하라.
9. (5장 10번 문제) 부모와 자식 간 정치 성향의 관련성에 관한 미국의 연구자료이다. 부모의 정치활동 수준이 활동적인 경우와 비활동적인 경우 각각에 대해서 분할표를 만든 다음 카이제곱 검정을 시행하라. 어떤 결론을 내릴 수 있는가? 민주당은 진보적, 공화당은 보수적이다.
본문내용
1. (1장 3번 문제) 다음은 한 도시의 20개 중,고교를 대상으로 조사한 흡연율 자료이다. 도시와 농촌별로 흡연율 자료의 기술통계량 및 상자그림을 그리고 비교, 분석하라[소스 코드]
/* 데이터 입력 */
DATA prac1_3;
INPUT area$ sex$ smoke;
DATALINES;
city male 0.64
city female 0.45
country mixed 0.7
city male 0.85
country male 0.72
city male 0.78
city female 0.62
city male 0.79
country male 0.75
country mixed 0.81
country female 0.56
city female 0.48
country male 0.72
city mixed 0.68
country male 0.79
city male 0.9
country female 0.34
city female 0.48
country female 0.49
country mixed 0.76
RUN;
/* 영구 라이브러리 'mylib' 지정 */
LIBNAME mylib '/folders/myfolders/dataset';
RUN;
DATA mylib.prac1_3;
SET prac1_3;
RUN;
/* 지역으로 정렬 */
PROC SORT DATA=mylib.prac1_3;
BY area;
Run;
/* 기술통계량 출력 */
PROC MEANS DATA=mylib.prac1_3;
BY area;
VAR smoke;
RUN;
<중 략>
[분석]
도시와 농촌의 흡연율 평균은 비슷하다. 하지만 그래프의 분포를 보면, 도시의 경우 비교적 고르게 분포되어있고, 농촌의 경우 흡연율이 높은 쪽(꼬리가 왼쪽으로 가게)으로 좀 더 치우쳐져 있음을 알 수 있다. 또한, 도시의 흡연율 변동성이 농촌보다 심하다고 추정할 수 있다. (분산 차이가 통계적으로 유의미한지 검정하기 위해선 추가 검정 단계가 필요하다.) 이상치 값은 두 그룹 다 존재하지 않는다.
참고 자료
없음이 자료와 함께 구매한 자료
- (30점 만점) 데이터마이닝 출석수업대체과제 한국방송통신대학교 정보통계학과 21페이지
- 통계패키지('19-01) 중간과제물 31페이지
- [방송통신대학교] 통계조사방법론 A+ 레포트 10페이지
- 통계조사방법론 9페이지
- 통계패키지R 기본TOOL 정리본 10페이지