[PYTHON/NLTK] pos_tag 함수 : 단어 토큰 리스트의 단어 토큰에 태그를 설정한 단어 토큰/태그 튜플 리스트 구하기

icodebroker NLTK 2024-06-24

■ pos_tag 함수를 사용해 단어 토큰 리스트의 단어 토큰에 태그를 설정한 단어 토큰/태그 튜플 리스트를 구하는 방법을 보여준다.

▶ main.py


import nltk

wordTokenList = nltk.word_tokenize("""덴마크 항구 도시에는 오래된 성이 하나 있다.
바로 외국인들은 엘시노어라고 알고 있는 '크론보르크 성'이다.
크론보르크는 덴마크와 스웨덴 사이에 있는 외레순 해협의 끝에 있었다."""
)

wordTokenTagTupleList = nltk.pos_tag(wordTokenList)

print(wordTokenTagTupleList)

"""
[('덴마크', 'JJ'), ('항구', 'NNP'), ('도시에는', 'NNP'), ('오래된', 'NNP'), ('성이', 'NNP'), ('하나', 'NNP'), ('있다', 'NNP'), ('.', '.'), ('바로', 'VB'), ('외국인들은', 'JJ'), ('엘시노어라고', 'NNP'), ('알고', 'NNP'), ('있는', 'NNP'), ("'크론보르크", 'POS'), ("성'이다", 'NN'), ('.', '.'), ('크론보르크는', 'CC'), ('덴마크와', 'JJ'), ('스웨덴', 'NNP'), ('사이에', 'NNP'), ('있는', 'NNP'), ('외레순', 'NNP'), ('해협의', 'NNP'), ('끝에', 'NNP'), ('있었다', 'NNP'), ('.', '.')]
"""

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

import nltk

wordTokenList = nltk.word_tokenize("""덴마크 항구 도시에는 오래된 성이 하나 있다.

바로 외국인들은 엘시노어라고 알고 있는 '크론보르크 성'이다.

크론보르크는 덴마크와 스웨덴 사이에 있는 외레순 해협의 끝에 있었다."""

)

wordTokenTagTupleList = nltk.pos_tag(wordTokenList)

print(wordTokenTagTupleList)

"""

[('덴마크', 'JJ'), ('항구', 'NNP'), ('도시에는', 'NNP'), ('오래된', 'NNP'), ('성이', 'NNP'), ('하나', 'NNP'), ('있다', 'NNP'), ('.', '.'), ('바로', 'VB'), ('외국인들은', 'JJ'), ('엘시노어라고', 'NNP'), ('알고', 'NNP'), ('있는', 'NNP'), ("'크론보르크", 'POS'), ("성'이다", 'NN'), ('.', '.'), ('크론보르크는', 'CC'), ('덴마크와', 'JJ'), ('스웨덴', 'NNP'), ('사이에', 'NNP'), ('있는', 'NNP'), ('외레순', 'NNP'), ('해협의', 'NNP'), ('끝에', 'NNP'), ('있었다', 'NNP'), ('.', '.')]

"""

▶ requirements.txt


click==8.1.7
joblib==1.4.2
nltk==3.8.1
regex==2024.5.15
tqdm==4.66.4

1

2

3

4

5

6

7

click==8.1.7

joblib==1.4.2

nltk==3.8.1

regex==2024.5.15

tqdm==4.66.4

※ pip install nltk 명령을 실행했다.

Post Views: 0

AI NLP NLTK PYTHON

icodebroker

[PYTHON/NLTK] pos_tag 함수 : 단어 토큰 리스트의 단어 토큰에 태그를 설정한 단어 토큰/태그 튜플 리스트 구하기

분류

보관함