Homepages :https://sites.google.com/view/pythainlp/home
ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python
Natural language processing หรือ การประมวลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่องานวิจัยและพัฒนาการประมวลภาษาธรรมชาติภาษาไทยในภาษา Python
รองรับ Python 3.4 ขึ้นไป
- เอกสารการใช้งาน : https://sites.google.com/view/pythainlp/home
- หน้าหลัก GitHub : https://github.com/wannaphongcom/pythainlp
กำลังพัฒนา
1.4
- ตัดคำภาษาไทย
- ถอดเสียงภาษาไทยเป็น Latin
- Postaggers ภาษาไทย
- อ่านตัวเลขเป็นข้อความภาษาไทย
- เรียงจำนวนคำของประโยค
- แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
- เช็คคำผิดในภาษาไทย
- และอื่น ๆ
รองรับ Python 3.4 ขึ้นไป
รุ่นเสถียร
$ pip install pythainlp
วิธีติดตั้งสำหรับ Windows
ให้ทำการติดตั้ง pyicu โดยใช้ไฟล์ .whl จาก http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu
หากใช้ python 3.5 64 bit ให้โหลด PyICU‑1.9.7‑cp35‑cp35m‑win_amd64.whl แล้วเปิด cmd ใช้คำสั่ง
pip install PyICU‑1.9.7‑cp35‑cp35m‑win_amd64.whl
แล้วจึงใช้
pip install pythainlp
ติดตั้งบน Mac
$ brew install icu4c --force
$ brew link --force icu4c
$ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip install pythainlp
ข้อมูลเพิ่มเติม คลิกที่นี้
อ่านได้ที่ https://github.com/wannaphongcom/pythainlp/blob/master/docs/pythainlp-1-3-thai.md
Apache Software License 2.0
พัฒนาโดย นาย วรรณพงษ์ ภัททิยไพบูลย์
คุณสามารถร่วมพัฒนาโครงการนี้ได้ โดยการ Fork และส่ง pull requests กลับมา