다변량분석_중간과제물_30점만점
- 최초 등록일
- 2022.11.20
- 최종 저작일
- 2022.04
- 16페이지/ 어도비 PDF
- 가격 5,000원
소개글
"다변량분석_중간과제물_30점만점"에 대한 내용입니다.
목차
1. 주성분 분석(p.78, 2 장 4 번)
(1) R 을 이용하여 주성분분석을 실행하고 해석하라.
(2) 파이썬을 이용하여 주성분 분석을 실행하고 설명하라.
2. 인자 분석(p.123, 3 장 3 번)
(1) R 로 분석하라.
(2) 파이썬으로 분석하라.
3. 군집 분석(p.176, 4 장 5 번)
본문내용
(1)R 을 이용하여 주성분분석을 실행하고 해석하라.
변수 별 기술 통계량과 Cor=T 상관계수 행렬을 이용하여 주성분분석을 실행한 결과이다. 이를 바탕으로 막대 그래프를 그려보았다. 누적 기여율이 85%가 넘으면 주성분의 수로 결정하기 때문에 2 개의 주성분이 있다고 결정할 수 있다. 또한 스크리 그림은 아래와 같이 나타난다. 스크리 그림을 통해 고유값이 수평을 유지하기 전 단계로 주성분의 수를 선택하기에 유효한 주성분을 2 개로 판단한다. 이에 따라 주성분의 계수도 다음과 같이 2 개로 나타낼 수 있다.
주성분 1=0.536(Murder)+0.583(Assault)+0.278(Urban Pop)+0.543(Rape)
주성분 2=0.418(Murder)+0.188(Assault)-0.873(Urban Pop)-0.167(Rape)
아래 그림은 4 개 변수들 간의 산점도를 확인한 것이다. Murder 과 urbanPOP 비율 간의 관련성이 적은 것으로 확인된다. Murder/Assault 의 비율이 상대적으로 높은 지역은 조지아, 메릴랜드이고 Repe 의 비율이 높은 지역은 미시간, 텍사스인 것을 확인할 수 있다.
(2)파이썬을 이용하여 주성분 분석을 실행하고 설명하라.
describe 로 기술 통계량을 구한 값은 위와 같다.
참고 자료
없음