회귀분석 Regression Analysis
회귀 (回歸) [명사]
한 바퀴 돌아 제자리로 돌아오거나 돌아감.
한번 돌아(일주하여) 원래로 돌아오는 것. 회귀의 개념을 처음 통계에 도입한 사람은 영국의 유전학자 갤톤(Galton. F.) 이다. 그는 부모와 자식간의 신장을 조사하여, 일반적으로 장신인 부모의 아이는 장신이지만, 그 평균신장은 부모만큼 크지 않다는 것을 밝혀냈다. 다시 말하면 아이의 신장은 항상 일반적인 평균으로 되돌아가는 경향이 있다고 하여, 이것을 평균의 회귀현상이라 하였다.
회귀분석 Regression Analysis
하나 이상의 독립변수가 하나의 종속변수에 대해 가지는 관계를 규명하기 위하여 사용되는 통계분석으로서 독립변수의 값의 변화에 따라 종속변수의 값의 변화를 예언하기 위한 통계적 분석 기법이다.
회귀분석은 변수와 변수와의 관계에 관한 것이다.
상관관계(Correlation)가 변수와 변수간의 '관련성'의 정도를 나타내는 것이라면,
회귀분석은 한 변수의 '변화'가 다른 변수의 '변화'에 어느 정도의 영향을 가지는 가를 말해 준다. 즉, 변수들 사이의 통계적 의존성(statistical dependence)을 나타내 주는 것이다.
통계적 관계는 독립변수의 값이 하나일 때 대응하는 종속변수의 값이 여러 개인 경우를 의미한다. 곧 반복적으로 표본을 추출했을 때, 독립변수는 고정되어 있고, 종속변수는 확률적 분포를 이루는 상태를 말한다. 회귀분석은 이와 같은 통계적 관계를 다룬다. 곧 변수들 사이의 관계를 설명하기 위하여 오차항을 최소화하는 회귀선을 찾아내는 것이 회귀분석이다.
A = aX + bY + cZ A = aX * bY + cZ A = (aX+bY)*d*cZ
회귀부석의 목적
한 변수 또는 여러 변수으 값을 가지고 다른 한 변수의 값을 예언하는데 있고, 회귀선은 변수들의 값으 분포를 바탕으로 하여 오차를 최소화하면서 변수들간의 관계를 한꺼번에 포괄적으로 설명해 주는 최적의 선이다. 이 때문에 회귀분석의 기본 원리는 예언과 회귀선의 관계에 기초하고 있다.
** 스터디를 신청하고 실제로는 불참인 경우 15명을 배정했는데 5명, 12명 최종 남는 인원이 다르다 (문제발견)
신청자를 분석해서 반 배분시 각 반별로 15명을 배정시 최소 9명 이상이 남을 수 있도록 하고 싶다.(분석목적)
** 네이버 카페의 경우 카페의 인원규모에 따른 사람의 심리도 분석
어느정도의 인원이 되면 일반적으로 상호 interaction 이 줄어들까 ?
** 스터디를 할 때 반을 옮기기로 결정하는데 영향을 미치는 주요 요소들
스터디 주제 적합도, 스터디를 하는 개인적인 목적, 멤버간의 특정한 관계에서 미치는 영향도
누군가 옮겼다더라 하는 것이 특정 부류의 사람들에게 미치는 판단영향도 차이의 통계적 분석
어떤 스터디 진행법과 특정 부류의 사람들(성격? 성별? 연령대? 학생? 직장인?)
** 항공예약데이터 분석 탑승, 계절 High peak season