본문 바로가기

Data Analytics

데이터분석 1


필요한 데이터를 어떻게 분석할 것인가 ? 


데이터간의 얽히고 얽힌 관계, 시간의 흐름, 절대/선택적 종속, 동일의미 다른데이터 

데이터간의 Story 를 찾아내야


무엇이 무엇(내가 알고자 하는것) 에 어느 정도의 영향을 미치는가 ? 

미리 알 수는 없는가 ? 


정말 무엇이 영향을 미치는가 ? 


차별성이 있는지 그 차이 정도는 유의미한 것인지


설명변수들 사이의 관계

종속변수(찾고자 하는 Insight )와 설명변수 관계

Tree Model 

Neural Network


분산이 커진다. 평균에서 유격되는 정도가 크다.  격차가 커진다 또는 중간계층이 적어지고 좌/우 상/하로 치우쳐있다고 볼 수 있다. 

최빈값


y 변수에 영향을 미칠것 같은 x 변수 

피봇팅 <-- 결국 엑셀의 표 형태안에 머무름



y <=- [ 이벤트컨택여부, 나이, 잔액, 기간  ...... ] 

 ==>  어떤 변수가 y 를 가장 잘 설명하고 있는지 



Rpart 나무모형

Bank 마케팅의 나무모형  가지가 많은 나무 모형 > 가지를 잘라야 함 

가지치기를 위한 CP 값 을 설정하여 가지치기 함.


Knime 나무모형




연관성분석

판매되는 상품들이 어떤 연관관게를 가지고 팔리는지



군집화분석

어느 고객들이 어떤 금액으로 

회귀분석

하나 이상의 독립변수가 각각의 종속변수와 관련


의사결정나무분석

6개월동안  분류와 예측을 하기위한 


Neural networks


마케팅 분야에서 주요하게 쓰임

그러나 이것이 훨씬 더 많은 영역으로 펼쳐질 것임

경영전략 

상품개발 

타켓팅

광고채널

광고 Contents 구성


http://www.youtube.com/watch?v=qg9k9B6y2jw

Buying Patterns

Purchase Habits

Consumer Behavior

develop data driven markeing strategy


Personalized

Relevant

Timely Offers


To anticipate next behavior

Abundance of loyalty


Break Down Data Silos

Compile Insights

Automate Processes