수학 전공자 입장에서 데이터분석을 공부하면서 느낀 점을 정리해본다. 일단 다양한 모델들을 공부하게 된다.
이 때, 기존에 이미 개발되어있는 모델들을 가져다 쓰는 것 뿐만 아니라 다루는 데이터마다 어떤 모델이 더 낫을지 기존 모델을 어떻게 재구성해서 사용하면 좀 더 유의미한 값을 도출해낼 수 있을지를 고민을 많이 하게 된다. 그래서 관련 모델들과 다룰 데이터에 대한 이해도 높을 수록 데이터를 잘 분석할 수 있는 것 같다.
탑재되어 있으면 좋을 만한 것 들은 여러가지가 있지만 세 개정도로 요약해보면
.
.
.
일단 첫번째!!!!
기본적인 통계 개념.
기본적인 통계 개념이라고 하면 보통 통계학개론 + a 정도라고 생각한다.
물론 처음부터 이걸 다알고 시작한다면 아주 좋겠지만...관련 전공이 아니면 솔직히 힘이들 것 같다.
나는 수학전공이라 학부때 공부했는 걸 생각해보면서 하긴 했지만 그래도 다시 한번 사용된 개념들을 체크중이다. 관련 개념들도 꼭 정리해야겠다.
.
.
.
다음 두번째!!
선형분석 분야에서는 선형대수학 개념들이 많이 사용되었다.
변수들 간에 관계값, 계산된 값들이 어떤 걸 의미하는지, 계수값이 의미하는 바라던지, 행렬의 고유값이 의미하는 것, 등등 더불어 기본 용어들! 다행히 심도 깊은 수학은 아니라 다양한 분야의 사람들도 접근이 가능할 것 같다.
.
.
.
마지막 세번째!!!
KNN이나 KMeans... 등의 모델들에는 위상수학 개념이 많이 쓰인 것 같았다.
위상수학에서 쓰던 용어들도 많이 보이는 것 같아 아주 반가웠지만, 사실 이런 모델들을 쓰기위해는 크게 필요없어 보였고 모델들을 연구하는 분들이라면 알고 있으면 많은 도움이 될 것 같아 보였다.
뭐 예를들면....
KNN에서 사용되는 개념이 위상수학에서 근방가지고 위상을 정의하는 개념과 비슷하다....정도?
혹은, 저 자료들을 구분할 때는 뭔가 closure개념을 쓰면 확실히 구분되겠다 라던가...
분명히 다른 데이터인데 같은 데이터라고 인식할때는 차이가 'ε' 정도 되는가보다...?? 뭐 등등
그냥 문득문득 이해하는데 도움되는 디딤돌 느낌정도인 것 같다.
.
.
.
공부한 개념들도 정리되는데로 얼른 기록해놔야겠다.
< 요약 >
기본적으로 데이터 분석 공부할 때 필요한 개념들은
1. 통계학개론( = 고등학교 수준의 확률과 통계 + a )
2. 선형대수학(값들이 계산되는 원리들을 이해하려면 필수. )
3. 위상수학(필수아님, 모델연구 수준이라면 도움될 듯)
'Work > 데이터분석' 카테고리의 다른 글
데이터 시각화(Data visualization) (0) | 2022.05.22 |
---|---|
타이타닉 데이터 분석 (0) | 2022.05.12 |