[A+][95][한국외대-마케팅애널리틱스] 제 2 과제 레포트. Linear Regression
gptpem38
다운로드
장바구니
소개글
한국외대 마케팅애널리틱스(ㅈㅅㅇ), 제 2 과제 Linear Regression을 이용하여 두산베어스(해외 야구 데이터셋 기반) dataset을 분석하는 과제입니다.목차
1. 문제 정의2. 데이터 분석
3. 모델 수정
4. 프로모션의 효과
5. 마케팅 전략 제안
6. 한계점
참고문헌
본문내용
1. 문제정의본 과제의 목표는 두산베어스의 프로모션, 날씨 등과 같은 독립변수와 종속변수인 관중 수의 상관관계를 회귀분석을 통하여 프로모션의 효과를 분석하고, 해당 결과를 분석하여 향후에 두산 베어스 팀이 관중을 더욱 동원할 수 있는 마케팅 전략을 제안하는 것이다.
2. 데이터 분석
주어진 ‘doosan bears.csv’ 데이터셋은 4월부터 10월까지 81개의 관측치를 갖고 있으며, 최대 관중 수는 56000명으로 제한되어있다. 범주형 변수와 연속형 변수를 가장 먼저 구분하여 보자면, 관중 수(attend)를 제외한 11개의 변수 중 기온(temp)는 연속형 변수이다. 7개의 변수 ’상대팀(opponent)’, ‘하늘(skies)’, ‘밤낮(day_night)’, ‘모자(cap)’, ‘셔츠(shirt)’, ‘불꽃놀이(fireworks)’, ‘박철순 인형 프로모션(park)(이하, 박철순)’는 모두 범주형 변수로 구분할 수 있다.
‘월’, ‘일’, ‘요일’변수는 연속형 변수로 볼 수도 있고, 범주형 변수로 볼 수도 있다. 이는 다음에 이어지는 2-1 절에서 자세히 살펴보기로 한다.
‘상대팀’변수는 ‘롯데, LG, 기아, 삼성, 키움, NC, SK, 한화, KT’의 9개로, 나머지 ‘하늘’, ‘밤낮’, ‘모자’, ‘셔츠’, ‘불꽃놀이’, ‘박철순’ 변수는 각 2개(YES or NO)로 이루어져 있다.
2-1 ‘월’, ‘일’, ‘요일’ 변수에 대하여
‘월’, ‘일’, ‘요일’변수는 다음의 두가지로 해석할 수 있다.
1. 해당 변수의 값이 증가할수록, 관중 수가 증가 혹은 감소한다는 가정(e.g. 월말이 가까워질수록 관중 수는 증가 또는 감소한다)을 통해 연속형 변수로 해석하는 방법
2. 해당 변수와 관중 수가 양/음의 관계를 갖지 않는다는 가정, 다시 말해 특정 ‘월’,’일’(e.g. 공휴일엔 사람이 증가한다), ‘요일’ 이 관중 수에 영향을 미친다는 가정을 통해, 범주형 변수로 해석하는 방법
본 과제에서 ‘월’ 변수와 ‘일’변수는 통제변수로서 지정되었다.
참고 자료
변수유형 https://m.blog.naver.com/libido1014/120113775017 (get_dummies)https://rfriend.tistory.com/tag/pd.get_dummies%28%29%20%EB%A5%BC%20%EC%9D%B4%EC%9A%A9%ED%95%B4%20%EA%B0%80%EB%B3%80%EC%88%98%28dummy%20var%29%20%EB%A7%8C%EB%93%A4%EA%B8%B0
https://rfriend.tistory.com/57(가변수함정)
회귀분석 https://nonmeyet.tistory.com/entry/Python-Pvalue-VIF-%ED%99%95%EC%9D%B8%ED%95%98%EA%B8%B0-Linear-regression
https://datascienceschool.net/view-notebook/36176e580d124612a376cf29872cd2f0/
https://datascienceschool.net/view-notebook/ff9458c7156c4961b012c60e5fc97301/
https://nittaku.tistory.com/474?category=765632
http://www.statedu.com/QnA/130488
https://freshrimpsushi.tistory.com/821
https://m.blog.naver.com/leedk1110/220775742538
https://m.blog.naver.com/PostView.nhn?blogId=victor3dh&logNo=220859478444&proxyReferer=https%3A%2F%2Fwww.google.com%2F
https://towardsdatascience.com/verifying-the-assumptions-of-linear-regression-in-python-and-r-f4cd2907d4c0
https://www.youtube.com/watch?v=8ypjhy_Aqjk
잔차분석 http://wolfpack.hnu.ac.kr/Stat_Notes/adv_stat/LinearModel/Regression/ch3_residual.pdf
조정결정계수 https://chukycheese.github.io/statistics/adjusted-r2/
다중공선성 http://www.statedu.com/QnA/117848
https://ukchanoh.wordpress.com/2015/02/16/multicollinearity/
https://stats.stackexchange.com/questions/242837/does-multicollinearity-between-categorical-variables-affect-the-predictions-in-l
https://stackoverflow.com/questions/35998395/multicollinearity-of-categorical-variables
정규성https://bioinformaticsandme.tistory.com/37
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.normaltest.html
https://datastory1.blogspot.com/2017/12/blog-post_25.html
https://datascienceschool.net/view-notebook/14bde0cc05514b2cae2088805ef9ed52/
선형성 https://freshrimpsushi.tistory.com/677?category=763106
압축파일 내 파일목록
doosan bears.csv
한국외대 마케팅애널리틱스 제 2과제 보고서.docx
한국외대 마케팅애널리틱스 제 2과제 보고서.pdf
한국외대 마케팅애널리틱스 제 2과제.ipynb
한국외대 마케팅애널리틱스 제 2과제 보고서.docx
한국외대 마케팅애널리틱스 제 2과제 보고서.pdf
한국외대 마케팅애널리틱스 제 2과제.ipynb