1. BERT Binary Classification 모델구현
1) 학습 및 평가 데이터 세트
(1) 데이터 세트 준비
- id컬럼은 사용하지 않음.
- 8:2로 분리
- train data를 또 분리 7:3
(2) 데이터 세트 클래스 정의
(3) Pre-trained Tokenizer 다운로드
- 한국어 관련 다운 하고 싶으면? ko or kor 검색
(4) 데이터 세트 클래스 객체 생성
2) Pre-trained 모델 다운로드 및 Fine-tunning 설정
(1) Pre-trained 모델 다운로드
(2) Fine-tunning 설정
- 3번 전략 할 예정.
3) 모델 학습 및 평가
(1) Training을 위한 하이퍼 파라미터 설정
(2) Evaluation을 위한 Test 데이터 세트 준비 및 파라미터 설정
- do_predict = True 설정 꼭!
(3) Evaluation을 위한 predict 수행
반응형
'🥾 프로젝트 > (STEP)파이썬을 활용한 인공지능 자연어 처리' 카테고리의 다른 글
8-2회차) BERT 모델을 활용한 Text Classification 모델 구현 (0) | 2023.05.15 |
---|---|
7-2회차) 자연어 처리를 위한 BERT 모델 (1) | 2023.05.14 |
7-1회차) 자연어 처리를 위한 BERT 모델 (0) | 2023.05.13 |
6-2회차) 자연어 처리를 위한 Transformer 적용 (0) | 2023.05.11 |
6-1회차) 자연어 처리를 위한 Transformer 적용 (0) | 2023.05.10 |