3.4 기술 통계
1. 기술 통계
- 넘파이는 다음과 같은 데이터 집합에 대해 간단한 통계를 계산하는 함수를 제공
- 이러한 값들은 통틀어 기술 통계(descirpitive statistics)라고 한다.
- 데이터의 개수
- 평균
- 분산
- 표준 편차
- 최댓값
- 최솟값
- 중앙값
- 사분위수
x = np.array([18, 5, 10, 23, 19, -8, 10, 0, 0, 5, 2, 15, 8,
2, 5, 4, 15, -1, 4, -7, -24, 7, 9, -6, 23, -13])
# 데이터의 개수
len(x) # 갯수
# 결과
26
# 표본 평균
np.mean(x)
# 결과
4.8076923076923075
# 표본 분산
np.var(x)
# 결과
115.23224852071006
np.var(x, ddof=1)
#비편향 분산, 추후 공부하게 된다.
# 결과
119.84153846153846
# 표본 표준편차
np.std(x)
# 결과
10.734628476137871
np.max(x) # 최댓값
# 결과
23
np.min(x) # 최솟값
# 결과
-24
np.median(x) # 중앙값
# 결과
5.0
# 사분위수
np.percentile(x, 0) # 최소값
# 결과
-24.0
np.percentile(x, 25) # 1사분위 수
#결과
0.0
np.percentile(x, 50) # 2사분위 수
#결과
5.0
np.percentile(x, 75) # 3사분위 수
#결과
10.0
np.percentile(x, 100) # 최댓값
#결과
23.0
반응형
'😀 기초 > 판다스(Pandas)' 카테고리의 다른 글
4.3 데이터프레임 고급 인덱싱 (0) | 2022.01.30 |
---|---|
4.2 데이터 입출력 (0) | 2022.01.28 |
4.1장 판다스 패키지의 소개(4.1_데이터프레임 클래스) (0) | 2022.01.26 |
4장 난수 발생과 카운팅(4.0 ~ 4.1_시리즈 클래스) (0) | 2022.01.26 |
판다스 (0) | 2022.01.18 |