월간 보관물: 2019년 6월월

자연어처리 (NLP) 도구들

1. 한국어 형태소 분석기 한국어 텍스트를 분석할 때 가장 기본적으로 수행하는 형태소 분석기 & 품사태거 KTS (1995) GPL v2, c/c++ – http://wiki.kldp.org/wiki.php/KTS MeCab-ko (2013) GPL LGPL BSD, c/c++ – https://bitbucket.org/eunjeon/mecab-ko 한나눔 (1999) GPL v3, java – http://semanticweb.kaist.ac.kr/home/index.php/HanNanum 꼬꼬마 (2010) GPL … 계속 읽기

카테고리: 미분류 | 댓글 남기기

konlpy 태그셋

Sejong, Twitter, Komoran, Mecab-ko, Kkma, Hannanum 형태소 분석기 태그셋

카테고리: 미분류 | 댓글 남기기

konlpy 품사태거 성능 비교

성능 비교 (1회 실행 시간 – 10개 문장에 대해서 1000번 실행 후, 총 실행 시간을 1,000으로 나눔)– 품질 비교는 해보지 않았지만, 실행 시간만으로는 mecab 분석기가 압도적으로 빠르네요… 품사 부착기 pos 평균 시간 morphs, nouns, pos 평균 시간 순위 kkma 0.023728 … 계속 읽기

카테고리: 미분류 | 댓글 남기기

konlpy 사용 방법

KoNLPy는 한국어 정보처리를 위한 파이썬 패키지입니다. 설치 우분투 1. Install dependencies# Install Java 1.7 or up$ sudo apt-get install g++ openjdk-7-jdk python-dev python3-dev 2. Install KoNLPy$ pip install konlpy # Python 2.x$ pip3 install konlpy # Python 3.x 3. MeCab … 계속 읽기

카테고리: 미분류 | 댓글 남기기