Skip to content

Thai natural language processing in Python.

License

Apache-2.0, Apache-2.0 licenses found

Licenses found

Apache-2.0
LICENSE
Apache-2.0
LICENSE.txt
Notifications You must be signed in to change notification settings

pontakornth/pythainlp

 
 

PyThaiNLP Logo

PyThaiNLP

Codacy Badgepypi Build Status Build status Coverage Status

Thai natural language processing in Python.

PyThaiNLP is a python module similar to nltk , but it's working primarily on Thai language instead of English.

It supports both Python 2.7 and Python 3.

Capability

  • Thai word segmentation
  • Thai wordnet
  • Thai Character Clusters (TCC) and ETCC
  • Thai stop word
  • Thai meta sound
  • Thai soundex
  • Thai postaggers
  • Thai romanization
  • Thai misspellings detection and correction

and much more.

Install

using pip.

$ pip install pythainlp

Documentation

Read on https://github.com/PyThaiNLP/pythainlp/tree/dev/docs

License

Apache Software License 2.0

ภาษาไทย

ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python

Natural language processing หรือ การประมวลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่อพัฒนาการประมวลภาษาธรรมชาติภาษาไทยในภาษา Python และมันฟรี (ตลอดไป) เพื่อคนไทยและชาวโลกทุกคน !

เพราะโลกขับเคลื่อนต่อไปด้วยการแบ่งปัน

รองรับ Python 2.7 และ Python 3

ความสามารถ

  • ตัดคำภาษาไทย
  • ถอดเสียงภาษาไทยเป็น Latin
  • Postaggers ภาษาไทย
  • อ่านตัวเลขเป็นข้อความภาษาไทย
  • เรียงจำนวนคำของประโยค
  • แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
  • เช็คคำผิดในภาษาไทย
  • รองรับ Thai Character Clusters (TCC) และ ETCC
  • Thai WordNet
  • Stop Word ภาษาไทย
  • Meta Sound ภาษาไทย
  • Thai Soundex
  • และอื่น ๆ

ติดตั้ง

รองรับ Python 2.7 และ Python 3

รุ่นเสถียร

$ pip install pythainlp

เอกสารการใช้งาน

อ่านได้ที่ https://github.com/PyThaiNLP/pythainlp/tree/dev/docs

License

Apache Software License 2.0

พัฒนาโดย PyThaiNLP

Logo

ออกแบบโดยคุณ วรุตม์ พสุธาดล จากการประกวดที่ https://www.facebook.com/groups/408004796247683/permalink/475864542795041/ และ https://www.facebook.com/groups/408004796247683/permalink/474262752955220/

สนับสนุน

คุณสามารถร่วมพัฒนาโครงการนี้ได้ โดยการ Fork และส่ง pull requests กลับมา

About

Thai natural language processing in Python.

Resources

License

Apache-2.0, Apache-2.0 licenses found

Licenses found

Apache-2.0
LICENSE
Apache-2.0
LICENSE.txt

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 95.4%
  • Shell 2.9%
  • Makefile 1.6%
  • Batchfile 0.1%