본문 바로가기

🥾 프로젝트/(STEP)파이썬을 활용한 인공지능 자연어 처리

8-1회차) BERT 모델을 활용한 Text Classification 모델 구현

1. BERT Binary Classification 모델구현

1) 학습 및 평가 데이터 세트

 (1) 데이터 세트 준비

- id컬럼은 사용하지 않음.

- 8:2로 분리

- train data를 또 분리 7:3

 

 (2) 데이터 세트 클래스 정의

 

 (3) Pre-trained Tokenizer 다운로드

- 한국어 관련 다운 하고 싶으면? ko or kor 검색

 

 (4) 데이터 세트 클래스 객체 생성

2) Pre-trained 모델 다운로드 및 Fine-tunning 설정

 (1) Pre-trained 모델 다운로드

 (2) Fine-tunning 설정

- 3번 전략 할 예정.

 

3) 모델 학습 및 평가

(1) Training을 위한 하이퍼 파라미터 설정

 (2) Evaluation을 위한 Test 데이터 세트 준비 및 파라미터 설정

- do_predict = True 설정 꼭!

 

(3) Evaluation을 위한 predict 수행