konlp.kma.kkma package

Submodules

konlp.kma.kkma.kkma module

kkma 한국어 형태소 분석기

이 코드는 꼬꼬마 형태소 분석기를 Python으로 wrapping한 코드입니다. 꼬꼬마 형태소 분석기는 서울대학교 IDS(intelligent Data Systems)에서 만들어졌습니다. 더 많은 정보를 보실려면 http://kkma.snu.ac.kr/ 에서 보시면 됩니다.

현재 kkma는 analyze, morphs, nouns 기능을 제공합니다. 기능을 사용하기 전에는 pc에 jdk(8 or older)가 설치되어 있어야 합니다.

$ sudo apt-get install openjdk-8-jdk
그리고 또한 파이썬 패키지인 JPype가 설치되어 있어야 합니다.
$ sudo pip3 install JPype1-py3

Example

>>> from konlp.kma import Kkma
>>> kk = Kkma()
>>> simple_text = "안녕하세요. 국민대학교 자연어처리 연구실입니다."
>>> kk.analyze(simple_text)
[['안녕하세요.', ['안녕/NNG', '하/XSV', '세요/EFN', './SF']],
['국민대학교 자연어처리 연구실입니다.',
['국민대학교/NNG', '자연어/NNG', '처리/NNG', '연구실/NNG',
'이/VCP', 'ㅂ니다/EFN', './SF']]]
>>> kk.morphs(simple_text)
['안녕', '하', '세요', '.', '국민대학교',
'자연어', '처리', '연구실', '이', 'ㅂ니다', '.']
>>> kk.nouns(simple_text)
['안녕', '국민', '국민대학교', '대학교',
'자연어', '자연어처리', '처리', '연구실']

TODO : The way to initialize JVM have to change

class konlp.kma.kkma.kkma.Kkma(jvmpath=None)[source]

Bases: konlp.kma.api.KmaI

서울대학교 IDS에서 만들어진 꼬꼬마 형태소 분석기입니다.

기능을 사용하기 전에는 pc에 jdk(8 or older)가 설치되어 있어야 합니다.
$ sudo apt-get install openjdk-8-jdk
그리고 또한 파이썬 패키지인 JPype가 설치되어 있어야 합니다.
$ sudo pip3 install JPype1-py3

Example

>>> from konlp.kma import Kkma
>>> kk = Kkma()
>>> simple_text = "안녕하세요. 국민대학교 자연어처리 연구실입니다."
>>> kk.analyze(simple_text)
[['안녕하세요.', ['안녕/NNG', '하/XSV', '세요/EFN', './SF']],
['국민대학교 자연어처리 연구실입니다.',
['국민대학교/NNG', '자연어/NNG', '처리/NNG', '연구실/NNG',
'이/VCP', 'ㅂ니다/EFN', './SF']]]
>>> kk.morphs(simple_text)
['안녕', '하', '세요', '.', '국민대학교',
'자연어', '처리', '연구실', '이', 'ㅂ니다', '.']
>>> kk.nouns(simple_text)
['안녕', '국민', '국민대학교', '대학교',
'자연어', '자연어처리', '처리', '연구실']
analyze(string)[source]

형태소 분석기

문장을 입력받아 형태소 분석을 합니다.

Parameters:string (str) – 형태소/품하 분석할 문장
Returns:[[원본, [형태소/품사]]]
nouns(string)[source]

단어 추출기

문장을 입력받아 단어를 추출합니다.

Parameters:string (str) – 단어 추출할 문장
Returns:단어가 추출된 list
tokens(string)[source]

형태소 분리

형태소 분석 후에 분리된 형태소만 얻는 함수 입니다.

Parameters:string (str) – 형태소 분리할 문장
Returns:분리된 형태소의 list

Module contents

KoNLP Korean morpheme analyzer Package - kkma

TODO : We will introduce kkma in detail.