1. 한국어 형태소 분석기
한국어 텍스트를 분석할 때 가장 기본적으로 수행하는 형태소 분석기 & 품사태거
- KTS (1995) GPL v2, c/c++ – http://wiki.kldp.org/wiki.php/KTS
- MeCab-ko (2013) GPL LGPL BSD, c/c++ – https://bitbucket.org/eunjeon/mecab-ko
- 한나눔 (1999) GPL v3, java – http://semanticweb.kaist.ac.kr/home/index.php/HanNanum
- 꼬꼬마 (2010) GPL v2, java – http://kkma.snu.ac.kr/
- KOMORAN (2013) Apache v2, java – https://shineware.tistory.com/tag/KOMORAN
- KoNLPy (2014) GPL v3, python – http://konlpy.org/en/latest/
2. 다른 텍스트 분석 도구들
- Hangulize – 다양한 언어의 단어를 한글로 변환함 (https://hangulize.org)
- Hanja – 한자 – 한글 변환 (https://github.com/suminb/hanja)
- Jamo – 한글 음절 조합 및 분리, 여러가지 한글 처리 (https://github.com/JDongian/python-jamo)
- KoreanParser – 한글 파서 (http://semanticweb.kaist.ac.kr/home/index.php/KoreanParser)
- Korean – 적절한 조사를 붙여주는 도구 (https://pythonhosted.org/korean)
- 세종21 – 세종시맨틱검색시스템 (http://www.sejong21.org)
3. 말뭉치 (코퍼스)
- 한국일보-20000/한국일보-40075 문서범주화 실험문서집합 – http://www.kristalinfo.com/TestCollections/readme_hkib.html, http://www.kristalinfo.com/TestCollections/#hkib
- 오픈소스 정보검색관리시스템 KRISTAL-IRMS – http://www.kristalinfo.com/download
- Kaist 코퍼스 – http://semanticweb.kaist.ac.kr/home/index.php/KAIST_Corpus
- 세종코퍼스 – http://www.sejong.or.kr
- 한글 감성 분석 코퍼스 – http://word.snu.ac.kr/kosac
- 네이버 감성 분석 코퍼스 – https://github.com/e9t/nsmc
4. 그 밖의 도움도는 사이트
- 학술정보 통합관리 시스템 – http://ocean.kisti.re.kr/IS_mvpopo212L.do?method=list&poid=sighlt&kojic=OOGHAK&sVnc=y2018m10a&sFree=
- Google NLP publications – https://ai.google/research/pubs?area=NaturalLanguageProcessing
- Microsoft NLP Group – http://research.microsoft.com/en-us/groups/nlp/