본문 바로가기

😀 기초/판다스(Pandas)

3장 기술 통계(3.4)

3.4 기술 통계

 

1. 기술 통계

- 넘파이는 다음과 같은 데이터 집합에 대해 간단한 통계를 계산하는 함수를 제공
- 이러한 값들은 통틀어 기술 통계(descirpitive statistics)라고 한다.
- 데이터의 개수
- 평균
- 분산
- 표준 편차
- 최댓값
- 최솟값
- 중앙값
- 사분위수

x = np.array([18,   5,  10,  23,  19,  -8,  10,   0,   0,   5,   2,  15,   8,
              2,   5,   4,  15,  -1,   4,  -7, -24,   7,   9,  -6,  23, -13])
              
# 데이터의 개수
len(x) # 갯수
# 결과
26

# 표본 평균
np.mean(x)
# 결과
4.8076923076923075

# 표본 분산
np.var(x)
# 결과
115.23224852071006

np.var(x, ddof=1)
#비편향 분산, 추후 공부하게 된다.
# 결과
119.84153846153846

# 표본 표준편차
np.std(x)
# 결과
10.734628476137871

np.max(x) # 최댓값
# 결과
23

np.min(x) # 최솟값
# 결과
-24

np.median(x) # 중앙값
# 결과
5.0

# 사분위수
np.percentile(x, 0) # 최소값
# 결과
-24.0

np.percentile(x, 25) # 1사분위 수
#결과
0.0

np.percentile(x, 50) # 2사분위 수
#결과
5.0

np.percentile(x, 75) # 3사분위 수
#결과
10.0

np.percentile(x, 100) # 최댓값
#결과
23.0