Post

06-2. Statistics(Regression analysis)(Illiteracy rate & lifespan)

06-2. Statistics(Regression analysis)(Illiteracy rate & lifespan)

[toc]

2022-11-28 통계학 과제

문맹률이 수명에 미치는 영향에 관한 회귀분석 보고서와 문제 풀이

보고서

1
2
(1)-(2) 문맹이 수명에 미치는 영향을 알아보기 위하여, 미국 50 개 주의 문맹률 % (1970년)과 기대수명 (세)(1969–71년)을 조사하 였다.
(자료: state.x77 in R, U.S. Department of Commerce, Bureau of the Census (1977)) 단순회귀분석을 실시하여 아래의 표2과 표3를 얻었다.

표2. 분산분석: 종속변수 y는 기대수명 (세) , 독립변수 x는 문맹률 (%)

요인제곱합(sum sq)자유도(df)평균제곱(mean sq)F-value유의확률 pr(>|t|)
회귀 모형30.578(SSR)130.578525.4296.969e-06
잔차57.721(SSE)481.2025  
합계88.299(SST)49   

표3. 계수추정표

1
2
3
								Estimate 			Std.Error    t value				Pr(>|t|)
(Intercept)     72.3949        0.3383      213.973			 < 2e-16 ***
x 							-1.2960        0.2570      -5.043        6.97e-06 ***   

그림2. 미국 50개 주에 대한 문맹률(%)과 기대수명((세)의 산점도와 회귀직선

이미지

코드

1
2
3
4
5
6
7
8
9
10
11
> mydata <- data.frame(state.x77)
> fit <- lm(mydata$Life.Exp ~ mydata$Illiteracy)
> anova(fit)
Analysis of Variance Table

Response: mydata$Life.Exp
                  Df Sum Sq Mean Sq F value    Pr(>F)    
mydata$Illiteracy  1 30.578 30.5785  25.429 6.969e-06 ***
Residuals         48 57.721  1.2025                      
---
Signif. codes:  0 *** 0.001 ** 0.01 * 0.05 . 0.1   1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
> summary(fit)

Call:
lm(formula = mydata$Life.Exp ~ mydata$Illiteracy)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.7169 -0.8063 -0.0349  0.7674  3.6675 

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
(Intercept)        72.3949     0.3383 213.973  < 2e-16 ***
mydata$Illiteracy  -1.2960     0.2570  -5.043 6.97e-06 ***
---
Signif. codes:  0 *** 0.001 ** 0.01 * 0.05 . 0.1   1

Residual standard error: 1.097 on 48 degrees of freedom
Multiple R-squared:  0.3463,	Adjusted R-squared:  0.3327 
F-statistic: 25.43 on 1 and 48 DF,  p-value: 6.969e-06
1
2
> plot(mydata$Illiteracy, mydata$Life.Exp, xlab="illiteracy rate %", ylab="Life expectancy")
> abline(fit)

문제

1
2
3
4
5
6
7
8
9
10
11
1. 표2에 대한 설명으로 틀린 것은 어느 것인가?

        1. 결정계수 𝑅2= 0.346 이므로 총변동 중 회귀모형이 설명하는 변동은 34.6%이다.(30.578/88.299)

        2. 𝐻0: β = 0에 대한 검정통계량은 F=25.4이다.

        3. 잔차의 평균제곱합은 57.721이다.

        4. 유의수준 0.05에서 귀무가설을 기각하므로 <그림1>의 직선 모형이 유의하다.(틀림)
        - 유의확률이 유의수준 보다 작기 때문에 귀무가설을 기각함, 그래프도 틀린 그래프가 됨
        5. 위 보기 중 답 없음
  • 한 번 풀어봐
1
2
3
4
5
6
7
8
9
10
11
12
2. 표3에 대한 설명으로 틀린 것은 어느 것인가?

        1. 𝐻0: α = 0에 대한 검정통계량은 t=213.973이고, 유의수준 0.05에서 y절편이 0이 아니다.

        2. 유의수준 0.05에서 𝐻0: β=0 에 대한 p 값이 0.05보다 작으므로, 문맹률이 수명에 유의하게 영향을 미친다고 볼 수 있다.

        3. 표2의 F-검정통계량과 표3에서 𝐻0: β = 0에 대한 t-검정통계량의 제곱은 동일하다.(틀림)
        - 다름

        4. 유의수준 0.05에서 문맹률이 1%감소할 때 수명이 1.296세 감소한다고 할 수 있다. 

        5. 위 보기 중 답 없음
  • R^2 = 결정계수 = SSR/SST