필요한 데이터를 어떻게 분석할 것인가 ?
데이터간의 얽히고 얽힌 관계, 시간의 흐름, 절대/선택적 종속, 동일의미 다른데이터
데이터간의 Story 를 찾아내야
무엇이 무엇(내가 알고자 하는것) 에 어느 정도의 영향을 미치는가 ?
미리 알 수는 없는가 ?
정말 무엇이 영향을 미치는가 ?
차별성이 있는지 그 차이 정도는 유의미한 것인지
설명변수들 사이의 관계
종속변수(찾고자 하는 Insight )와 설명변수 관계
Tree Model
Neural Network
분산이 커진다. 평균에서 유격되는 정도가 크다. 격차가 커진다 또는 중간계층이 적어지고 좌/우 상/하로 치우쳐있다고 볼 수 있다.
최빈값
y 변수에 영향을 미칠것 같은 x 변수
피봇팅 <-- 결국 엑셀의 표 형태안에 머무름
y <=- [ 이벤트컨택여부, 나이, 잔액, 기간 ...... ]
==> 어떤 변수가 y 를 가장 잘 설명하고 있는지
Rpart 나무모형
Bank 마케팅의 나무모형 가지가 많은 나무 모형 > 가지를 잘라야 함
가지치기를 위한 CP 값 을 설정하여 가지치기 함.
Knime 나무모형
연관성분석
판매되는 상품들이 어떤 연관관게를 가지고 팔리는지
군집화분석
어느 고객들이 어떤 금액으로
회귀분석
하나 이상의 독립변수가 각각의 종속변수와 관련
의사결정나무분석
6개월동안 분류와 예측을 하기위한
Neural networks
마케팅 분야에서 주요하게 쓰임
그러나 이것이 훨씬 더 많은 영역으로 펼쳐질 것임
경영전략
상품개발
타켓팅
광고채널
광고 Contents 구성
http://www.youtube.com/watch?v=qg9k9B6y2jw
Buying Patterns
Purchase Habits
Consumer Behavior
develop data driven markeing strategy
Personalized
Relevant
Timely Offers
To anticipate next behavior
Abundance of loyalty
Break Down Data Silos
Compile Insights
Automate Processes
'Data Analytics' 카테고리의 다른 글
PCA : Interpretation Examples (Principal Components Analysis) (0) | 2014.01.12 |
---|---|
R get the data from excel into R with read.delim('clipboard') (0) | 2014.01.05 |
[펌] 10 types of regressions. Which one to use? (1) | 2013.12.23 |
R 자료형 (0) | 2013.12.22 |
data.frame(x=xvar, y=yvar, z=zvar) (0) | 2013.12.22 |