영문 형태소 분석
1. 형태소 분석을 위한 전처리 수행
- 위와 같은 작업을 모두 한 후에, 형태소 작업을 실시
2. nltk 패키지를 이용해 형태소 분석 수행
- pos_tag 함수 이용해 형태소 분석
- set() 함수 : 중복 단어를 제거하기 위해 사용함.
한글 형태소 분석
1. 형태소 분석을 위한 전처리 수행
- 위와 같은 작업을 모두 한 후에, 형태소 작업을 실시
- 한글은 띄어쓰기 처리를 해야 함.
2. KoNLPy 및 패키지 설치
- 위와 같은 작업을 모두 한 후에, 형태소
- 다음과 같이 설치 해야 함.
3. KoNLPy 이용해 한글 형태소 분석
- KoNLPy의 Okt, Kkma, Komoran, Hannanum, Mecab 등의 클래스를 이용하여 객체 생성
- 각 형태소 클래스별 특성 이해 및 활용
4. 형태소 분석기 성능 비교
5. KoNLPy를 이용한 한글 형태소 분석
- morphs / pos / nouns 함수 사용
- 경우에 따라서, 1글자는 제거하는 방법을 따로 조건을 걸어도 된다.
'🥾 프로젝트 > (STEP)파이썬을 활용한 인공지능 자연어 처리' 카테고리의 다른 글
3-2회차) 자연어 처리를 위한 Word2Vec (0) | 2023.05.03 |
---|---|
3-1회차) 자연어 처리를 위한 Word2Vec (0) | 2023.05.03 |
2-2회차) 자연어 처리 형태소 분석 (형태소 분석 사전활용) (0) | 2023.01.21 |
1-2회차) 인공지능 자연어 전처리 (한글 자연어 전처리) (0) | 2023.01.15 |
1-1회차) 인공지능 자연어 전처리 (영문 자연어 전처리) (0) | 2023.01.15 |