(방송대) 파이썬과 R, 출석수업 과제물 (2022 2학기, 30점 만점)
- 최초 등록일
- 2023.01.17
- 최종 저작일
- 2022.10
- 9페이지/ 한컴오피스
- 가격 4,000원
소개글
"(방송대) 파이썬과 R, 출석수업 과제물 (2022 2학기, 30점 만점)"에 대한 내용입니다.
목차
1) 교재 연습문제 3장(p. 73) – 1번, 2번, 3번 (배점 9점)
2) 교재 연습문제 4장(p. 100) - 7번, 8번, 9번 (배점 9점)
3) 교재 연습문제 8장(p. 268) - 2번 (배점 12점)
2-(1). 자료에서 결측치는 0으로 표시되어 있다. 결측치를 제거하는 명령을 쓰고, 각 변수에 결측치가 몇 개 있는지 구하시오.
2-(2). 변수(calcium, iron, protin, vitamin A, vitamin C)의 (평균, 표준편차, 최솟값, 최댓값, 중앙값, 제1사분위수, 제3사분위수)를 구하시오.
본문내용
상자그림과 히스토그램을 통해 관찰한 각 변수의 분포는 다음과 같다. calcium변수는 중앙값인 500전후로 값의 출현 빈도수가 높다. 중앙값과 1사분위수 사이의 길이가 중앙값-3사분위수 길이보다 아주 약간 작은 것으로 보아 다른 변수들에 비해 데이터가 약간 왼쪽으로 치우친 분포 형태를 띄고 있다. iron변수와 protein변수는 다른 변수들에 비해 중앙값과 평균의 차이가 적다. 분포 또한 중앙값이 1사분위수와 3사분위수의 중간쯤에 위치하고 있어 치우친 데이터는 아니라고 말할 수 있다. vitaminA변수는 이상치의 최댓값이 너무 커 그 분포를 제대로 확인할 수 없었으나, 이상치를 제외하고는 대체로 중앙값 근처에 데이터가 밀집되어 있었다. 이러한 데이터를 분석하기 위해서는 이상치를 제거하고 데이터 분석을 실시하는 것이 바람직하다. vitaminC변수는 중앙값과 1사분위수 사이의 길이가 작은 것으로 보아 다른 변수들에 비해 데이터가 왼쪽으로 치우친 분포 형태를 띄고 있다.
참고 자료
없음