สำเนาข้อมูลของ https://www.arts.chula.ac.th/ling/tnc/searchtnc/ เผื่อว่าในภายหลังต้นทางอาจถูกลบไป (มีแก้ไขชื่อผู้พัฒนาเพราะเว็บต้นทางเขียนชื่อผิดครับ ที่รู้ก็เพราะเป็นเพื่อนกัน ฮ่า แต่คนทำเว็บต้นทางนั้นไม่ใช่คุณเพื่อน)
ไฟล์ทั้งหมดอยู่ในนี้ → Thai National Corpus
+ + + + +
ระบบสืบค้นคลังข้อมูล TNC 3.0 ข้อมูลประมาณ 33 ล้านคำ [เข้าสู่ระบบ]
ออกแบบและพัฒนาโดย นายไพริชน์ นิตยานุภาพ โดยดัดแปลงแบบจากเว็บ http://corpus.byu.edu/
สืบค้นผ่าน Lancaster CQPWeb
(จำเป็นต้องมี account และขณะนี้ ยังเป็นข้อมูล TNC เก่า แต่สามารถค้นเป็นวลีหรือค้นแบบซับซ้อนได้)
- รายการคำพร้อมความถี่แจงแจงตาม genres 5000 คำแรก
- รายการคำพร้อมความถี่ทั้งหมด
- TNC Bigram
- TNC Trigram
- TNC.3g to be used with TLTK
- TNC word2vec data to be used with TLTK 1.3.8 or lower
- TNC word2vec data to be used with TLTK 1.4 or higher
- TNC word2vec interface (w2v.py)
ตัวอย่างการใช้งาน TNC w2v
[Keywords]
คำที่ใช้บ่อย, คำไทยที่ใช้บ่อย
ไม่มีความคิดเห็น:
แสดงความคิดเห็น