วันพฤหัสบดีที่ 19 กุมภาพันธ์ พ.ศ. 2569

การสแกนหนังสือมาสร้างไฟล์ ePUB ไว้อ่าน

ผมมีหนังสือเล่มที่ซื้อเก็บไว้รออ่านอยู่เป็นร้อยๆ เล่ม แต่ด้วยความที่หลายปีให้หลังมีปัญหาเรื่องการอ่านหนังสือเล่มเพราะเรื่องของสายตา จึงสะดวกอ่านเป็น ePUB มากกว่า ก็เลยแทบไม่ได้แตะหนังสือเล่มเลย วิธีการทะลายกองดองของหลายๆ คนจึงจับเอาหนังสือเล่มมาทำให้เป็นไฟล์ดิจิทัลซะ

ช่วงไหนที่ขยันผมก็จะเอาหนังสือที่มีอยู่มาสแกนเก็บไว้ก่อน แล้วค่อยมาแปลงเป็น epub เพราะไฟล์ที่สแกนมาทำเป็น pdf นั้น ถึงจะใช้ iPad 10 นิ้วเปิด ผมก็ยังรู้สึกอ่านไม่สบายตาอยู่ดี ไม่เหมือนอ่านจากหน้าจอ Kindle 6 นิ้ว ที่เราสามารถย่อขยายตัวหนังสือได้ตามต้องการและสะดวกต่อการพกพาไปอ่านที่ไหนต่อที่ไหนได้

การสแกนหนังสือของเราเก็บไว้อ่านเอง ว่ากันตามกฎหมายแล้วไม่ถือว่ามีความผิด ก่อนหน้านี้เคยมีคดีความที่เป็นแนวคิดคล้ายๆ กันมาแล้ว แต่ไฟล์ที่ทำออกมานี่หากเอาไปจำหน่ายจากแจก แบบนี้คือผิดกฎหมายทันที และถ้าเราสแกนเสร็จแล้วขายหนังสือเล่มนั้นไปแล้ว นั่นคือเราไม่ได้มีสิทธิความเป็นเจ้าของของหนังสือเล่มนั้นๆ อีกต่อไป ไฟล์ที่เราสแกนไว้ก็ไม่ควรอยู่ในการครอบครองของเราอย่างถูกกฎหมายเช่นกัน


วิธีการทำไฟล์ ePUB จากหนังสือเล่ม ก่อนหน้านี้เคยเขียนบล็อกแบบคร่าวๆ ไว้ที่ การทำไฟล์ ePUB ด้วยโปรแกรม Sigil แบบสังเขป หลังจากนั้นก็เคยโพสต์ไว้ในกลุ่มชุมชนนักอ่าน eBook ซึ่งมีขั้นตอนอธิบายรายละเอียดมากกว่าเดิม คิดว่าจะเอามาแปะในบล็อกก็ลืมทุกที วันนี้นึกขึ้นได้ เลยลงมือจัดการซะ เนื้อหาจะแบ่งออกเป็น 3 ตอนด้วยกัน

  • ตอนที่ 1 การนำไฟล์สแกน (หรือถ่ายภาพ) มาทำเป็นข้อความ text ด้วย Google Docs
  • ตอนที่ 2 การเตรียมไฟล์ต้นฉบับสำหรับทำเป็น ePUB
  • ตอนที่ 3 การสร้างเอกสาร ePUB ด้วยโปรแกรม Sigil






ตอนที่ 1 การนำไฟล์สแกน (หรือถ่ายภาพ) มาทำเป็นข้อความ text ด้วย Google Docs

วิธีการทำให้หนังสือเป็นรูปภาพ โดยหลักๆ จะใช้เครื่องสแกนเนอร์ หรือไม่ก็ใช้โทรศัพท์มือถือถ่ายภาพ ถ้าเอาแบบสะดวกสำหรับคนทั่วๆ ไป ก็ใช้กล้องโทรศัพท์นี่แหละ แอปที่ใช้งานก็มีหลายแอป ผมใช้ vFlat เพราะฟีเจอร์ถ่ายแบบอัตโนมัติ และลบนิ้วมือที่เราจับหนังสือ

ที่จริงตัว vFlat ก็มีฟีเจอร์ ocr ที่ถอดตัวหนังสือจากภาพให้กลายเป็นข้อความ text ได้ แต่ว่าต้องใช้แบบจ่ายเงินรายเดือน

เมื่อถ่ายภาพเสร็จแล้ว ผมก็ใช้โปรแกรมจัดการไฟล์ในโทรศัพท์ บีบอัดเป็นก้อนแล้วส่งเข้าเครื่องคอมฯ มาทำงานต่อ ที่จริงในโทรศัพท์ก็มีแอปแปลงไฟล์ภาพให้รวมเป็นไฟล์ pdf เหมือนกัน ใครถนัดใช้ตัวไหนก็เลือกได้ตามต้องการ

ไฟล์ภาพที่ได้จาก vFlat จะมีขนาดค่อนข้างใหญ่สักหน่อย ผมใช้โปรแกรม XnConvert เพื่อลดขนาดไฟล์พร้อมๆ กัน (บน Windows คือ XnView) ก่อนจะเอาไปรวมไฟล์

จากนั้นเอาไฟล์ภาพที่ได้มารวมเป็น pdf บนคอมพิวเตอร์ด้วยโปรแกรม GScan2pdf

sudo apt install gscan2pdf

ขั้นต่อมาคือเอามาครอปพวกหัวกระดาษท้ายกระดาษ และเลขหน้าออก เวลาเราเอาข้อมูลมาใช้ จะได้ไม่ติดส่วนเกินพวกนี้มา ซึ่งผมใช้ Krop (Python) หรือ Briss (Java)

sudo apt install krop

หรือจะจัดการส่วนนี้ตั้งแต่ตอนที่เป็นไฟล์รูปภาพแล้วค่อยเอามารวมเป็น pdf ก็ได้เหมือนกัน ผมใช้โปรแกรม gThumb ใช้ง่ายและสะดวกอยู่

sudo apt install gthumb

เมื่อจัดการไฟล์ pdf ต้นฉบับเรียบร้อย ก็ส่งเข้าไปใน Google Drive แล้วเปิดไฟล์ด้วย Google Docs รอสักพัก ก็จะได้เนื้อความที่เป็นข้อความ text

ถ้าไฟล์ใหญ่หรือมีจำนวนหน้ามากเกินไปอาจจะแปลงไม่สำเร็จ ให้ลดจำนวนหน้าลงด้วยโปรแกรมตัดแบ่งไฟล์ pdf ผมใช้ PDFsam Basic ตัดแบ่งไฟล์ครับ


ข้อความเนื้อหาที่ได้มานี้ เราจะเอามาใช้ทำไฟล์ ePUB แต่ต้องเอามาล้างพวกรูปแบบข้อความทิ้งไปให้หมดเสียก่อน ซึ่งไฟล์ ePUB จะเรียบร้อยแค่ไหนก็ขึ้นอยู่กับขั้นตอนการจัดเตรียมตัวข้อมูลนี้แหละ ถ้าขยันมากอึดมากหน่อยก็ได้คุณภาพดีหน่อย เรียกได้ว่าเป็นขั้นตอนที่เสียเวลามากที่สุดเลยก็ว่าได้


ตอนที่ 2 การเตรียมไฟล์ต้นฉบับสำหรับทำเป็น ePUB

ไฟล์ใน Google Docs นี้ เราจัดรูปแบบเพื่อเอามาทำ ePUB เลยก็ได้ แต่ผมชอบเอามาจัดการเป็น html เองมากกว่า เพราะไฟล์ที่ได้จะค่อนข้างสะอาดและจัดรูปแบบได้ตรงใจกว่า ผมดาวน์โหลดไฟล์จาก Google Docs แล้วใช้โปรแกรม Pandoc แปลงให้เป็น html วิธีการใช้งานผมเคยเขียนไว้หลายบล็อกแล้ว


ตอนที่ 3 การสร้างเอกสาร ePUB ด้วยโปรแกรม Sigil

ขั้นตอนนี้เป็นขั้นตอนสุดท้ายในการทำไฟล์หนังสือให้กลายเป็น ePUB ซึ่งมีหลายโปรแกรมที่สามารถทำได้ หรือจะใช้โปรแกรมแปลงในเว็บก็ได้ แต่ผมถนัดใช้ Sigil

การทำไฟล์ ePUB ด้วยโปรแกรม Sigil แบบสังเขป

ขั้นตอนนี้เรียกได้ว่าเป็นขั้นตอนที่ง่ายที่สุดในกระบวนการแล้ว


[ Reference ]


[ Keywords ]

scan, ebook, vflat, epub, ocr

ไม่มีความคิดเห็น:

แสดงความคิดเห็น