본문 바로가기

반응형

전체 글

(105)
2022-02-01 운동일지 운동 종목 운동 시간 식단 X X X 운동 운동 부위 무게 / 세트 횟수 비고 식단 아침 점심 저녁 비고 메뉴 과일 소고기, 미역국, 전 쭈꾸미, 피자, 비빔밥, 꼬치, 맥주 식사 시간 13:00 19:00
4.4 데이터프레임의 데이터 조작 4.4 데이터프레임의 데이터 조작 1. 데이터프레임의 데이터 조작 - 판다스는 넘파이 2차원 배열에서 가능한 대부분의 데이터 처리가 가능 - 추가로 데이터 처리 및 변환을 위한 다양한 함수와 메서드를 제공 2. #### 데이터 갯수 세기 - 가장 간단한 데이터 분석은 데이터의 갯수를 세는 것이다. - count 메서드를 사용한다. - NaN 값은 세지 않는다. s = pd.Series(range(10)) s[3] = np.nan s #결과 0 0.0 1 1.0 2 2.0 3 NaN 4 4.0 5 5.0 6 6.0 7 7.0 8 8.0 9 9.0 dtype: float64 s.count() #결과 9 - 데이터프레임에서는 각 열마다 별도로 데이터 갯수를 센다. - 데이터에서 값이 누락된 부분을 찾을 때 유..
4.3 데이터프레임 고급 인덱싱 4.3 데이터프레임 고급 인덱싱 1. 데이터프레임 고급 인덱싱 - 데이터프레임에서 특정한 데이터만 골라내는 것을 인덱싱(indexing)이라고 함. - 앞 절에서는 라벨, 라벨 리스트, 인덱스데이터(정수) 슬라이스의 3가지 인덱싱 값을 사용하여 인덱싱을 하는 방법을 공부 - 근데 Pandas는 numpy 행렬과 같이 쉼표를 사용한(행과 열 인덱스) 형식의 2차원 인덱싱을 지원하기 위해 - 다음과 같은 특별한 인덱서(indexer)속성도 제공한다. - loc : 라벨값 기반의 2차원 인덱싱 - iloc : 순서를 나타내는 정수 기반의 2차원 인덱싱 2. #### loc 인덱서 - loc 인덱서는 다음처럼 사용한다. - df.loc[행 인덱싱 값] - 또는 - df.loc[행 인덱싱값, 열 인덱싱값] - 이..