다변량 14장 report
- 최초 등록일
- 2019.07.18
- 최종 저작일
- 2019.04
- 7페이지/ 한컴오피스
- 가격 1,000원
목차
1. (계층적 군집) 다음 표는 10개 섬에 서식하는 땃쥐(흰색 쥐의 일종)에 대해 여러 변수를 측정한 다변량 자료로부터 각 섬의 땃쥐 종들 간의 마할라노비스 거리 를 구한 결과이다. 이 자료를 이용하여 계층적 군집을 수행하고자 한다.
(a) 최단연결법을 사용하여 덴드로그램을 그리고 몇 개의 군집이 적절한 지를 판단하라
(b) 최장연결법을 사용하여 덴드로그램을 그리고 몇 개의 군집이 적절한 지를 판단하라
2. (k-평균군집) {datasets } 패키지의 attitude 자료는 대형 금융기관에서 무작위로 선택된 30개 부서 각각에서 약 35명의 사무직원에 대해 설문조사를 요약한 결과이다. 수치는 각 부서별로 7가지 질문에 대해 긍정적인 응답의 비율을 나타낸다. 7개의 문항 변수는 다음과 같다: x1=평가, x2=직원의 불만처리, x3=특권을 허용하지 않음, x4=배움의 기회, x5=성과에 따른 보수인상, x6=매우 엄격함, x7=승진.
(a) 두 개 변수 x3와 x4만 사용하여 k-평균군집 분석을 수행하고, 이를 시각화하여라.
(b) 전체변수를 이용하여 k-평균군집 분석을 수행하고, 위의 결과와 비교해 보아라.
3. {PAM} {datasets}패키지의 USArrests 자료를 이용하여 k-대표 개체(PAM)군집을 수행하고, 그 결과를 요약하여라.
본문내용
1. (계층적 군집) 다음 표는 10개 섬에 서식하는 땃쥐(흰색 쥐의 일종)에 대해 여러 변수를 측정한 다변량 자료로부터 각 섬의 땃쥐 종들 간의 마할라노비스 거리 를 구한 결과이다. 이 자료를 이용하여 계층적 군집을 수행하고자 한다.
먼저 lower triangle matrix를 생성한다
마할라노비스 거리를 계산한다.
<중 략>
2. (k-평균군집) {datasets } 패키지의 attitude 자료는 대형 금융기관에서 무작위로 선택된 30개 부서 각각에서 약 35명의 사무직원에 대해 설문조사를 요약한 결과이다. 수치는 각 부서별로 7가지 질문에 대해 긍정적인 응답의 비율을 나타낸다. 7개의 문항 변수는 다음과 같다:
x1=평가, x2=직원의 불만처리, x3=특권을 허용하지 않음, x4=배움의 기회, x5=성과에 따른 보수인상, x6=매우 엄격함, x7=승진.
(a) 두 개 변수 x3와 x4만 사용하여 k-평균군집 분석을 수행하고, 이를 시각화하여라.
자료를 표준화하고 군집수를 몇 개로 해야 가장 적절할지 본다.
자료를 두 개의 군집으로 나누는 것이 가장 적절하다고 판정되었다.
참고 자료
없음