과학

[세상에서 가장 재미있는 통계학]

바람과 술 2008. 6. 15. 05:54
[세상에서 가장 재미있는 통계학], 래리 고닉(그림), 울코트 스미스, 전영택, 궁리, 2007, (070708).
 

1. 통계학이란?

 

우리들은 불완전한 정보들을 가지고 여러 가지 결정을 해 나간다. 통계학은 불확실성을 계량적으로 측정해서 정확하게 만드는 특징이 있다. 통계라는 수학적 마술 효과를 발휘하기 위해 통계학자들은 다음 세 가지를 근거로 삼는다. 1. 데이터 분석:데이터의 수집, 전시 그리고 요약 2. 확률 3. 통계적 추론:확률 지식을 이용해 데이터에서 통계적 결론을 이끌어내는 과학.

 

2. 데이터 기술

 

데이터는 통계학자들이 내용을 이해하는 데 사용하는 원자료로서 숫자로 되어 있다. 모든 통계 문제에는 데이터의 수집, 기술, 분석 또는 그에 대한 생각이 담겨 있다.

계급을 정하는 기준 1. 반올림된 숫자를 중앙값이 되도록 하고 같은 크기가 되도록 정하라 2. 데이터의 양이 적으면 계급의 개수도 적게 하라 3. 데이터의 양이 많으면 계급의 개수도 많게 하라

어떤 측정값이든 두 가지의 중요한 특징인 중앙값 또는 대표값, 그리고 그 값을 중심으로 흩어져 있는 정도, 즉 산포도가 있다.

평균값은 모든 데이터의 값을 더한 다음 데이터의 개수로 나누어서 구한다.

중앙값(메디안)은 또 다른 대표값으로, 도로의 '중앙선'처럼 데이터의 '중점'을 말한다. 중앙값을 구하는 일반 법칙은 데이터를 작은 것부터 순서대로 정리하고, 데이터의 개수가 홀수이면 중앙값은 중앙에 있는 데이터의 값의 된다. 데이터의 개수가 짝수이면 중앙값은 중앙 부근에 있는 2개의 데이터의 평균값이다.

산포도는 데이터가 대표값에서 얼마나 멀리 떨어져 있는지를 나타낸다.