[예습] データを視る (데이터를 보기)
定量的データ分析 (정량적 데이터 분석)
(2015-春学期-月曜日-2限)
1강 예습, 데이터를 보기.
- 목표
1. 산포도
2. 분산
3. 공분산과 상관계수
4. 다차원 데이터와 그 특징
- 미리 나누어준 자료를 보고, 예습하는게 목표. 4월 13일 하는 수업의 목표는 위와 같다. 개인적으로 수학에 관련된 지식이
부족하다는걸 인지하고 있으므로, 이에 관련된 예습이 주된 목표가 되겠다. 미리 질문할 거리, 무엇을 배우는지 어느정도 감을
잡아놓기위한 포스팅.
1 - 분산, 공분산, 상관계수
데이서 해석의 예, 연습에서는 EX.01
博報堂 Global HABIT조사, 아시아 10도시에 있어서 일, 한, 미 콘텐트 수용성의 비교.
※ http://www.hakuhodo.co.jp/archives/newsrelease/558
(클릭하면 커집니다)
- 위 사례에서 파악할 수 있는 데이터.
1. 만화, 애니, 영화, 음악 등에 관한 조사
JManga Anime | 자주 보는 애니, 만화로 일본 걸 선택하는 비율 |
JChinema | 좋아하는 영화 타입으로 일본영화를 고른 비율 |
JMusic | 자주 듣는 음악이 일본 음악인 비율 |
2. 아시아 10도시에 있어서의 일본의 영향력 (제일 위 그래프 참조)
3. 사례의 데이터를 보자
Q1. 좋아하는 영화가 일본 영화라고 하는건 전체로보면 어느정도의 점수인가?
Q2. 3개의 변수 중, 국가간에 분포가 가장 흩어져있는 건 어느 것인가?
Q3. 일본의 만화, 애니를 자주보는 국가는 일본 음악도 자주 듣는 경향이 있는가?
위 강의를 통해서, 변수의 식을 세울 수 있어야하는데.....
애초에 문과였던 필자로는 그냥 골때릴 뿐이다.
주어진 데이터 사례를 보고, 그래프를 분석 할수 있는 능력을 얻어야한다.
좀 더 자세한 부분은, 강으를 듣고나서 복습할 때 확인해보도록 하자.