Skip to content

OCR

OCR ดึง text ออกจาก images, scans และ document screenshots

หลัง recognition แล้ว คุณสามารถ copy result, export เป็น Markdown, PDF หรือ Word หรือ package หลาย formats รวมกันเพื่อ download

OCR ทำอะไรได้บ้าง

FeatureDescription
Image text recognitionExtract text จาก images, screenshots และ scans
Document layout recognitionเหมาะกับ tables, formulas, stamps และ mixed text-image layouts
Multiple servicesรองรับ Baidu PaddleOCR, Microsoft Azure Vision และ Google Vision
Copy resultsCopy recognized text หลัง processing
Export filesExport Markdown, PDF และ Word
Batch packagingหลัง recognize หลาย files สามารถ download results เป็น package

Configure OCR Services ก่อน

เปิด:

text
System Settings -> Other Settings -> OCR

IP geolocation and OCR

กรอก credentials สำหรับ services ที่ต้องการใช้:

ServiceWhat To EnterBest For
Baidu PaddleOCRPaddleOCR TokenRecommended first choice เหมาะกับ documents, images, tables และ mixed layouts
Microsoft Azure VisionAzure Vision Endpoint และ Azure Vision API Keyเหมาะถ้าใช้ Microsoft cloud services อยู่แล้ว
Google VisionGoogle Vision API Key ส่วน service account JSON ใช้เฉพาะ quota queryเหมาะถ้าใช้ Google Cloud services

กรอก credentials แล้ว save

สำหรับ initial testing configure service เดียวก็พอ ไม่จำเป็นต้องครบทั้งสาม

Google Vision Setup

Google setup มีสองส่วน:

GoalRequirement
ใช้ OCREnable Cloud Vision API แล้วสร้าง API Key
Query usageสร้าง service account, grant Monitoring Viewer, แล้ว download service account JSON

Google API key and service account

ใช้ Google สำหรับ OCR

  1. เปิด Google Cloud Console
  2. ไปที่ APIs & Services
  3. เปิด Library, search Cloud Vision API แล้ว enable
  4. กลับไปที่ Credentials
  5. Create API Key
  6. เปิด API Key แล้ว copy
  7. Paste ใน Google Vision API Key ของ ImgBed
  8. Save

จากนั้นเลือก Google Vision ใน OCR dialog ได้

Query Google Usage

Quota query ไม่ required สำหรับ recognition

ใช้แสดงคร่าว ๆ ว่า Google Vision calls ถูกใช้ไปเท่าไรใน 30 วันที่ผ่านมา

  1. ใน Google Cloud Console เปิด IAM & Admin
  2. เปิด Service Accounts
  3. สร้าง service account เช่น vision-monitor
  4. Grant role Monitoring Viewer
  5. เปิด service account details แล้ว create key
  6. เลือก JSON
  7. Download generated JSON file
  8. กลับไป ImgBed แล้ว import ใน service account JSON (optional)
  9. หลัง import สำเร็จ คลิก quota query

หลัง import ImgBed จะแสดง project name ที่เป็นเจ้าของ service account เมื่อ query usage ImgBed จะอ่าน Google monitoring data แล้วแสดง call count ของเดือนนี้

สรุป:

ItemPurpose
Google Vision API Keyทำ OCR recognition
Service account JSONQuery จำนวน Google Vision calls ที่ใช้
Monitoring Viewer roleให้ service account อ่าน usage data

รับ Baidu PaddleOCR Token

Baidu PaddleOCR ต้องใช้ access token

Get PaddleOCR token

เปิด API call window ในหน้า Baidu PaddleOCR คลิกเพื่อรับ token แล้ว copy

กลับไป ImgBed paste ใน PaddleOCR Token แล้ว save

เริ่ม Recognition

ใน File Management เลือก image หรือ document screenshot แล้วคลิก OCR

OCR recognition

ใน dialog เลือก recognition service และ model

Common PaddleOCR model choices:

ModelBest For
PP-StructureV3Recommended default เหมาะกับ documents, tables, formulas, stamps และ mixed layouts
PP-OCRv5Simple images, ordinary text และ lightweight recognition
PaddleOCR-VLMultilingual, complex images และ chart-like content
PaddleOCR-VL-1.5Document pages ที่ซับซ้อนกว่า และ layout recovery

ถ้าไม่แน่ใจ เริ่มด้วย PP-StructureV3

Advanced Options

OptionDescription
Orientation correctionใช้เมื่อ image หมุนหรือเอียง
Document flatteningใช้กับ photographed documents ที่มี curvature หรือ tilt
Layout detectionใช้เมื่อต้องการ preserve headings, paragraphs, tables และ image structure
Chart recognitionใช้เมื่อ image มี charts หรือ structures ซับซ้อน
Beautify Markdownทำให้ exported Markdown อ่านง่ายขึ้น

สำหรับ regular screenshots ให้ใช้ options น้อยที่สุด สำหรับ document scans ให้ enable document-related options มากขึ้น

ดู Results

หลัง recognition เสร็จ dialog จะแสดง result

คุณ copy ได้ทันทีหรือเลือก export formats

PDF recognition

สำหรับ document pages, exported PDF สามารถ preserve page appearance พร้อมให้ text searchable เหมาะกับ archiving scans และค้นหา content ภายหลัง

เลือก Export Format

FormatBest For
Markdown (.md)Notes, documentation systems และการ edit ภายหลัง
PDF (.pdf)Preserve page appearance และ scanned document results
Word (.docx)Layout editing, text modification และส่งต่อให้คนอื่น
Export allSave multiple formats และ original image เหมาะกับ archives สำคัญ

ถ้าต้องการแค่ text ให้ export Markdown

ถ้าต้องการ page appearance ให้ใช้ PDF หรือ Word

Word Output

Exported Word documents เปิดและ edit ด้วย office software ได้

Word result

Documents บางแบบมี recognized images, headings และ paragraphs ใน Word output

Recognition quality ขึ้นกับ original image clarity, model choice และ document complexity

File Types ที่เหมาะกับ OCR

File TypeRecommendation
Clear screenshotsRecognize ได้โดยตรง
ScansPrefer PP-StructureV3
Photographed documentsEnable orientation correction และ document flattening
Tables, formulas, stampsPrefer structured models
Simple short text imagesPP-OCRv5 มักพอ

Images ที่ชัดและ text ตรงจะให้ results ดีกว่า

Common Cases

CaseMeaning
Recognition failsตรวจว่า service token หรือ key ถูก save แล้ว
Recognition slowComplex documents และ large images ใช้เวลานานกว่า
Table incompleteลอง structured model
Text มี mistakesBlur, glare และ skew เพิ่ม recognition errors ลอง image ที่ชัดกว่า
Word output มี images จำนวนมากStructured models อาจ preserve recognized images บางส่วน เป็นเรื่องปกติ

Google Quota Query Fails

ตรวจว่า:

  1. Import service account JSON แล้ว
  2. Service account มี role Monitoring Viewer
  3. Project enable Cloud Vision API

ถ้าต้องการแค่ OCR ไม่ต้อง query usage สามารถไม่ใส่ service account JSON และกรอกแค่ Google Vision API Key

Quick Flow

text
เปิด System Settings
-> เปิด Other Settings
-> กรอก OCR service credentials
-> Save
-> กลับไป File Management
-> เลือก file แล้วคลิก OCR
-> เลือก model
-> รอ recognition
-> Copy results หรือ export Markdown / PDF / Word

Released as user documentation for CloudFlare ImgBed.