การหมุนอัตโนมัติ: การแก้ไขทิศทาง PDF อัตโนมัติและกระบวนการ deskew
ลองใช้ Auto-Rotate โดย Edwin de Jong ซึ่งเป็นยูทิลิตี้ Windows ที่แก้ไขทิศทางของหน้าใน PDF ที่สแกน เครื่องมือนี้จะสแกนเอกสารหลายหน้าและใช้การวิเคราะห์เชิงแสงเพื่อตรวจจับหน้าที่กลับหัวหรืออยู่ในแนวนอน จากนั้นจะสร้างไฟล์เอาท์พุตที่ถูกต้อง ความสามารถหลักรวมถึงการตรวจจับทิศทางที่ใช้ OCR การเรนเดอร์หน้า การแก้ไขการเอียงอย่างละเอียด และการประมวลผลแบบกลุ่มสำหรับชุดเอกสารทั้งหมด เจ้าหน้าที่สำนักงาน นักเก็บเอกสาร และผู้ใช้สแกนเนอร์บ่อย ๆ จะได้รับวิธีการที่มีประสิทธิภาพในการทำความสะอาดห้องสมุด PDF ขนาดใหญ่โดยไม่ต้องหมุนด้วยมือ.
การหมุนอัตโนมัติใช้การตรวจสอบที่ขับเคลื่อนด้วย OCR เพื่อระบุหน้าที่มีการจัดวางผิด เครื่องมือ ใช้การวิเคราะห์ข้อความและเลย์เอาต์เพื่อตัดสินใจเกี่ยวกับการจัดวางในแนวตั้ง โดยอิงจากการตรวจจับทิศทางและสคริปต์ของ Tesseract สำหรับการตัดสินใจในระดับหน้า มันจะทำการเรสเตอร์ไรซ์หน้า PDF ก่อนการวิเคราะห์เพื่อให้แน่ใจว่าองค์ประกอบทางภาพได้รับการพิจารณา จากนั้นจึงแก้ไขการเอียงด้วยอัลกอริธึม jdeskew เส้นทางการประมวลผลจะผลิต PDF ใหม่ที่มีหน้าที่ถูกแก้ไข ดังนั้นผู้ใช้จึงจัดการกับการดำเนินการอัตโนมัติเพียงครั้งเดียวแทนที่จะเป็นการแก้ไขทีละหน้าแบบแมนนวล
การตรวจจับทิศทางผ่าน OCR การเรสเตอร์ไรซ์สำหรับการวิเคราะห์ภาพ การแก้ไขการเอียงด้วย jdeskew ผลกระทบต่อระบบยังคงเชื่อมโยงกับการทำงานแบบชุดมากกว่าบริการพื้นหลัง การหมุนอัตโนมัติทำงานเป็นยูทิลิตี้การประมวลผลเอกสารที่ออกแบบมาสำหรับงานที่แยกจากกันแทนที่จะเป็นงานพื้นหลังที่ต่อเนื่อง นักพัฒนาจัดจำหน่ายผ่าน Windows Package Manager และ GitHub ซึ่งเหมาะสำหรับการติดตั้งแบบสคริปต์และการทำงานตามกำหนดเวลาบนเครื่องเดสก์ท็อป ข้อเสนอแนะแบบชุมชนเน้นความเหมาะสมสำหรับการทำงานของผู้ใช้ที่มีความสามารถสูง ดังนั้นคาดว่าจะทำงานเป็นงานที่มุ่งเน้นที่เรียกใช้ตามความต้องการแทนที่จะเป็นส่วนประกอบของระบบที่เปิดอยู่ตลอดเวลา
การทำงานรักษาเอกสารต้นฉบับโดยการผลิตไฟล์เอาต์พุตที่ถูกต้อง เมื่อการหมุนอัตโนมัติสิ้นสุดการทำงาน มันจะเขียนหน้าที่ถูกแก้ไขลงในไฟล์ PDF ใหม่ ซึ่งรักษาเอกสารต้นฉบับไว้โดยไม่เปลี่ยนแปลง โมเดลเอาต์พุตนี้ลดความเสี่ยงเมื่อเปรียบเทียบกับการแก้ไขในที่เพราะการสแกนต้นฉบับยังคงสามารถตรวจสอบได้ เครื่องมือที่พึ่งพาการวิเคราะห์แทนการเปลี่ยนแปลงในระดับรีจิสทรีหรือระบบทำให้การดำเนินการมีขอบเขตเฉพาะไฟล์และจำกัดขอบเขตของข้อผิดพลาดในการประมวลผลใดๆ ให้กับชุดเอกสารที่กำลังจัดการอยู่
การติดตั้งและการทำงานเหมาะกับผู้ใช้ที่มีทักษะทางเทคนิคมากกว่าผู้ที่มุ่งเน้น GUI การติดตั้งผ่าน Windows Package Manager หรือการปล่อย GitHub โดยตรงทำให้ยูทิลิตี้เหมาะสำหรับผู้ใช้ที่สะดวกสบายกับการจัดการแพ็คเกจหรือการทำงานที่อิงจากคลัง ผู้ใช้ที่ไม่ใช่ทางเทคนิคที่คาดหวังการติดตั้งกราฟิกหรือโปรแกรมแก้ไข PDF แบบรวมอาจต้องเผชิญกับการเรียนรู้ที่ยากลำบาก แนวทางโอเพนซอร์สของนักพัฒนาช่วยเหลือผู้ที่ต้องการการทำงานที่สามารถเขียนสคริปต์ได้ ทำซ้ำได้ และต้องการการประมวลผลเอกสารที่คาดการณ์ได้และสามารถทำให้เป็นอัตโนมัติได้
ทางเลือกที่ใช้งานได้จริงสำหรับผู้ใช้ที่มีความชำนาญซึ่งทำความสะอาด PDF ที่สแกนเป็นชุด โดยมีข้อควรระวังในการติดตั้ง Auto-Rotate เหมาะสำหรับมืออาชีพในสำนักงานและนักเก็บเอกสารที่ประมวลผลหลายหน้าที่สแกนและชอบเครื่องมือที่สามารถเขียนสคริปต์ได้; มันเสนอการทำงานที่คาดการณ์ได้ซึ่งอิงจากไฟล์ที่รักษาเอกสารต้นฉบับไว้ ข้อแลกเปลี่ยนหลักคือโมเดลการติดตั้งที่ใช้ตัวจัดการแพ็คเกจและคลังข้อมูล ซึ่งต้องการความคุ้นเคยทางเทคนิค สำหรับผลลัพธ์ที่ดีที่สุด ให้เรียกใช้เครื่องมือบนสำเนาในช่วงเวลาที่ไม่ใช้งานและตรวจสอบผลลัพธ์ตัวอย่างก่อนที่จะทำการประมวลผลชุดใหญ่เพื่อยืนยันกฎการจัดแนวตรงกับเอกสารของคุณ.
ข้อดี ใช้ Tesseract OSD สำหรับการตัดสินใจเกี่ยวกับการจัดแนวแบบข้อความ รวม jdeskew เพื่อแก้ไขการเอียงเล็กน้อยในหน้าที่สแกน เขียนหน้าที่แก้ไขลงใน PDF ใหม่ โดยรักษาเอกสารต้นฉบับไว้ รองรับไฟล์ PDF หลายหน้าเพื่อการประมวลผลแบบกลุ่มในครั้งเดียว ข้อเสีย ออกแบบมาเพื่อการติดตั้งผ่าน package-manager หรือ GitHub ไม่ใช่การติดตั้งผ่าน GUI Workflow ถือว่ามีความสะดวกสบายกับการทำงานที่เขียนสคริปต์หรือการดำเนินการผ่านคำสั่ง ไม่ตั้งใจให้เป็นโปรแกรมแก้ไข PDF แบบโต้ตอบสำหรับการปรับแต่งครั้งเดียว