수학과 통계는 무슨 관계에 있는가?
파이썬을 배우다보니 확실히 수학적 개념을 많이 맞닥들이게 된다.
파이썬 자체가 수학은 아니지만, 특히 데이터에 대한 일을 하겠다고 했을 때는 그 분야에 대한 지식은 물론, 통계와 수학적 지식이 있어야만 한다.
수학 공부의 필요성을 많이 느끼고 있다.
수학을 좋아했었다고는 하지만, 사실 해외로 나가면서 수학에 대한 감을 많이 잃어버렸다. 공부를 하지 않아도 좋은 점수를 받을 수 있었으니 말이다.
좀 아쉬운 부분이다.
1. 통계란 무엇인가?
통계는 데이터 수집, 분석, 설명 및 표시와 관련이 있는 학문이다. 완전하지 않은 정보를 통해서 결과를 예측하는데 도움을 준다. 예측이 필요한 시장이나 비즈니스, 건강, 정부 부서 등 필요로 하는 곳이 많다. 즉, 통계는 데이터의 품질을 향상시키고 그것에서 유의미한 통찰을 이끌어내는 학문이라고 할 수 있다.
수학은 학문 과목이고, 통계는 응용 수학의 일부이다. 수학은 숫자와 패턴을 다룬다면, 통계는 그러한 수학적 사고력을 기반으로 데이터의 체계적인 표현과 분석을 다룬다.
수학과 통계의 차이점을 보면, 통계는 수학의 공식이나 원리를 사용하기는 하지만, 그러한 것으로는 불가능한 관찰의 해석을 다루는 수학이라고 할 수 있다.
요약하면, 데이터를 연구하는 학문이다.
2. 통계에 쓰이는 수학
실제로 수학이 통계에서 자유롭게 사용되기는 하지만, 수학과처럼 이론을 깊게 배우지는 않는다. 대학교의 교육과정에 따라 해석학까지는 배운다고는 하지만, 과정마다 다르다. 수학과에서는 주류로 편입되는 미분, 대수, 기하, 위상 등에서는 오히려 확률과 통계 등을 배우지 않는다.
수학과 통계는 교집합의 관계이기는 하지만, 서로 조금씩 독립된 학문이라고 여겨진다.
3. 통계를 배워야 하는 이유
데이터에 기반한 사고다. 우리가 직관이라고 하는 것은 우리의 제한된 인식의 범위에서 일어나는 데이터 추론 결과라고 할 수 있다. 그러나 우리 눈에 보이는 것, 우리의 판단이 과연 우리 삶에 옳은 판단을 내리도록 돕는 경우는 얼마나 많을까?
나는 체스를 참 좋아하는데, 체스를 두다보면 인간의 인식 수준이라는 것이 얼마나 보잘 것 없는가를 느끼게 된다. 너무나도 좋은 수라고 생각했지만, 실제로는 그 선택 때문에 게임에서 지게 되는 경우가 허다하다. 그런데 체스 로봇을 보면, 매 수를 완벽하게 둔다. 모든 경우의 수를 계산할 수 있기 때문이다.
우리 뇌속에 들어가있는 지식의 수준이라는 것은 실제로 꺼내보면 사실 생각보다 보잘 것 없을 수 있는 것이다.
사실을 관찰하고 그것을 모아서 분석하는 것으로써 우리가 미처 보지 못하고 있었던 통찰이 일어난다. 그래서 진정한 통찰이라는 것은 완전히 반직관적인 경우가 많다.
'Mathematics > Statistics' 카테고리의 다른 글
Feature Engineering(특성 공학)이란? (0) | 2021.12.30 |
---|---|
전처리(processing) vs 탐색적 데이터 분석(EDA) (0) | 2021.12.30 |
데이터란 무엇인가? 데이터와 정보의 개념 차이 (0) | 2021.12.30 |
이 시대의 새로운 석유, 데이터. 데이터 리터러시(data literacy)를 기르자. (0) | 2021.12.30 |
API란? (0) | 2021.12.29 |