본문 바로가기
Work/데이터분석

데이터 분석엔 어떤 것을 공부하는게 유리할까?

by jaunnnngs21 2022. 5. 11.

수학 전공자 입장에서 데이터분석을 공부하면서 느낀 점을 정리해본다. 일단 다양한 모델들을 공부하게 된다.

이 때, 기존에 이미 개발되어있는 모델들을 가져다 쓰는 것 뿐만 아니라 다루는 데이터마다 어떤 모델이 더 낫을지 기존 모델을 어떻게 재구성해서 사용하면 좀 더 유의미한 값을 도출해낼 수 있을지를 고민을 많이 하게 된다. 그래서 관련 모델들과 다룰 데이터에 대한 이해도 높을 수록 데이터를 잘 분석할 수 있는 것 같다.

탑재되어 있으면 좋을 만한 것 들은 여러가지가 있지만 세 개정도로 요약해보면

.

.

.

일단 첫번째!!!!

 

기본적인 통계 개념.

기본적인 통계 개념이라고 하면 보통 통계학개론 + a 정도라고 생각한다.

물론 처음부터 이걸 다알고 시작한다면 아주 좋겠지만...관련 전공이 아니면 솔직히 힘이들 것 같다.

나는 수학전공이라 학부때 공부했는 걸 생각해보면서 하긴 했지만 그래도 다시 한번 사용된 개념들을 체크중이다. 관련 개념들도 꼭 정리해야겠다.

.

.

.

다음 두번째!!

 

선형분석 분야에서는 선형대수학 개념들이 많이 사용되었다.

변수들 간에 관계값, 계산된 값들이 어떤 걸 의미하는지, 계수값이 의미하는 바라던지, 행렬의 고유값이 의미하는 것, 등등 더불어 기본 용어들! 다행히 심도 깊은 수학은 아니라 다양한 분야의 사람들도 접근이 가능할 것 같다.

.

.

.

마지막 세번째!!!

 

KNN이나 KMeans... 등의 모델들에는 위상수학 개념이 많이 쓰인 것 같았다.

위상수학에서 쓰던 용어들도 많이 보이는 것 같아 아주 반가웠지만, 사실 이런 모델들을 쓰기위해는 크게 필요없어 보였고 모델들을 연구하는 분들이라면 알고 있으면 많은 도움이 될 것 같아 보였다. 

뭐 예를들면....

KNN에서 사용되는 개념이 위상수학에서 근방가지고 위상을 정의하는 개념과 비슷하다....정도?

혹은, 저 자료들을 구분할 때는 뭔가 closure개념을 쓰면 확실히 구분되겠다 라던가...

분명히 다른 데이터인데 같은 데이터라고 인식할때는 차이가 'ε' 정도 되는가보다...?? 뭐 등등

그냥 문득문득 이해하는데 도움되는 디딤돌 느낌정도인 것 같다.

.

.

.

공부한 개념들도 정리되는데로 얼른 기록해놔야겠다.

 

< 요약 >

기본적으로 데이터 분석 공부할 때 필요한 개념들은

1. 통계학개론( = 고등학교 수준의 확률과 통계 + a )

2. 선형대수학(값들이 계산되는 원리들을 이해하려면 필수. )

3. 위상수학(필수아님, 모델연구 수준이라면 도움될 듯)

'Work > 데이터분석' 카테고리의 다른 글

데이터 시각화(Data visualization)  (0) 2022.05.22
타이타닉 데이터 분석  (0) 2022.05.12