빅데이터자료처리 과제4
- 최초 등록일
- 2022.03.18
- 최종 저작일
- 2020.09
- 8페이지/ 한컴오피스
- 가격 1,000원
목차
1. reshape2에서 제공하는 tips 데이터를 이용해서 물음에 답하여라.
1) day에 대한 도수분포표를 작성하라.
2) day에 대한 막대그래프를 작성하라.(y-축을 도수)
3) day에 대한 막대그래프를 작성하라.(y-축을 상대도수)
4) day와 time에 대한 분할표를 작성하라.(분할표에 행백분율, 열백분율, 전체백분율을 모두 포함시키기)
5) day와 time의 연관성을 검정하기 위한 카이제곱 값을 구하라.
6) 5)번의 결과에서 유의수준 1%와 p-값을 비교해서 day와 time이 연관성이 있다고 할 수 있는가를 검정하라?
2. reshape2에서 제공하는 tips 데이터를 이용해서 물음에 답하여라.
1) day와 time에 대한 군집막대그래프를 작성하라.(y-도수)
2) day와 time에 대한 군집막대그래프를 작성하라.(y-행비율)
3) day와 time에 대한 비율누적막대그래프를 작성하라.
4) day의 수준에 따라 면 분할하고, sex와 time에 대한 군집막대그래프를 작성하라.
본문내용
1. reshape2에서 제공하는 tips 데이터를 이용해서 물음에 답하여라.
1) day에 대한 도수분포표를 작성하라.
> day.freq <- xtabs(~day,data=tips)
> total.freq <- margin.table(day.freq)
> day.prop <- prop.table(day_freq)
> total.prop <- margin.table(day.prop)
> day.freq.table <-cbind(day.freq, day.prop)
> total1 <- c(total.freq, total.prop)
> day.freqency.table <- rbind(day.freq.table, total1)
> day.freqency.table
day.freq day.prop
Fri 19 0.07786885
Sat 87 0.35655738
Sun 76 0.31147541
Thur 62 0.25409836
total1 244 1.00000000
>
2) day에 대한 막대그래프를 작성하라.(y-축을 도수)
> ggplot(tips,aes(x=day))+
+ geom_bar(fill="red", color="black")
참고 자료
없음