본문 바로가기

🥾 프로젝트/(STEP)파이썬을 활용한 인공지능 자연어 처리

2-1회차) 자연어 처리 형태소 분석 (영문, 한글 형태소 분석)

영문 형태소 분석

1. 형태소 분석을 위한 전처리 수행

- 위와 같은 작업을 모두 한 후에, 형태소 작업을 실시

2. nltk 패키지를 이용해 형태소 분석 수행

- pos_tag 함수 이용해 형태소 분석

- set() 함수 : 중복 단어를 제거하기 위해 사용함.

 

한글 형태소 분석

1. 형태소 분석을 위한 전처리 수행

- 위와 같은 작업을 모두 한 후에, 형태소 작업을 실시

- 한글은 띄어쓰기 처리를 해야 함.

 

2. KoNLPy 및 패키지 설치

- 위와 같은 작업을 모두 한 후에, 형태소 

- 다음과 같이 설치 해야 함.

 

3. KoNLPy 이용해 한글 형태소 분석

- KoNLPy의 Okt, Kkma, Komoran, Hannanum, Mecab 등의 클래스를 이용하여 객체 생성 

- 각 형태소 클래스별 특성 이해 및 활용

 

4. 형태소 분석기 성능 비교

형태소 분석기 성능 비교

5. KoNLPy를 이용한 한글 형태소 분석

- morphs / pos / nouns 함수 사용

- 경우에 따라서, 1글자는 제거하는 방법을 따로 조건을 걸어도 된다.