Skip to content

OCR

OCR mengekstrak text daripada images, scans dan document screenshots.

Selepas recognition, anda boleh copy result, export sebagai Markdown, PDF atau Word, atau package beberapa formats bersama untuk download.

Fungsi OCR

FeatureDescription
Image text recognitionMengekstrak text daripada images, screenshots dan scans.
Document layout recognitionLebih baik untuk tables, formulas, stamps dan mixed text-image layouts.
Multiple servicesMenyokong Baidu PaddleOCR, Microsoft Azure Vision dan Google Vision.
Copy resultsCopy recognized text selepas processing.
Export filesExport Markdown, PDF dan Word.
Batch packagingSelepas recognize beberapa files, download results sebagai package.

Configure OCR Services Dahulu

Buka:

text
System Settings -> Other Settings -> OCR

IP geolocation and OCR

Isi credentials untuk services yang mahu digunakan:

ServiceWhat To EnterBest For
Baidu PaddleOCRPaddleOCR TokenRecommended first choice. Baik untuk documents, images, tables dan mixed layouts.
Microsoft Azure VisionAzure Vision Endpoint dan Azure Vision API KeyBerguna jika anda sudah menggunakan Microsoft cloud services.
Google VisionGoogle Vision API Key. Service account JSON hanya digunakan untuk quota query.Berguna jika anda menggunakan Google Cloud services.

Save selepas mengisi credentials.

Untuk initial testing, configure satu service sahaja sudah cukup. Tidak perlu ketiga-tiganya.

Google Vision Setup

Google setup mempunyai dua bahagian:

GoalRequirement
Menggunakan OCREnable Cloud Vision API, kemudian cipta API Key.
Query usageCipta service account, grant Monitoring Viewer, kemudian download service account JSON.

Google API key and service account

Gunakan Google Untuk OCR

  1. Buka Google Cloud Console.
  2. Pergi ke APIs & Services.
  3. Buka Library, cari Cloud Vision API dan enable.
  4. Kembali ke Credentials.
  5. Cipta API Key.
  6. Buka API Key dan copy.
  7. Paste ke Google Vision API Key dalam ImgBed.
  8. Save.

Selepas itu, anda boleh memilih Google Vision dalam OCR dialog.

Query Google Usage

Quota query tidak required untuk recognition.

Ia hanya menunjukkan anggaran berapa banyak Google Vision calls digunakan dalam 30 hari terakhir.

  1. Dalam Google Cloud Console, buka IAM & Admin.
  2. Buka Service Accounts.
  3. Cipta service account, contohnya vision-monitor.
  4. Grant role Monitoring Viewer.
  5. Buka service account details dan create key.
  6. Pilih JSON.
  7. Download generated JSON file.
  8. Kembali ke ImgBed dan import di bawah service account JSON (optional).
  9. Selepas import berjaya, klik quota query.

Selepas import, ImgBed menunjukkan project name yang memiliki service account. Semasa query usage, ImgBed membaca Google monitoring data dan menunjukkan call count bulan ini.

Ringkasnya:

ItemPurpose
Google Vision API KeyMelakukan OCR recognition.
Service account JSONQuery berapa banyak Google Vision calls digunakan.
Monitoring Viewer roleMembenarkan service account membaca usage data.

Dapatkan Baidu PaddleOCR Token

Baidu PaddleOCR memerlukan access token.

Get PaddleOCR token

Buka API call window pada halaman Baidu PaddleOCR, klik untuk mendapatkan token, kemudian copy.

Kembali ke ImgBed, paste ke PaddleOCR Token dan save.

Mulakan Recognition

Dalam File Management, pilih image atau document screenshot dan klik OCR.

OCR recognition

Dalam dialog, pilih recognition service dan model.

Common PaddleOCR model choices:

ModelBest For
PP-StructureV3Recommended default. Baik untuk documents, tables, formulas, stamps dan mixed layouts.
PP-OCRv5Simple images, ordinary text dan lightweight recognition.
PaddleOCR-VLMultilingual, complex images dan chart-like content.
PaddleOCR-VL-1.5Document pages yang lebih kompleks dan layout recovery.

Jika tidak pasti, mulakan dengan PP-StructureV3.

Advanced Options

OptionDescription
Orientation correctionGunakan apabila image rotated atau skewed.
Document flatteningGunakan untuk photographed documents dengan curvature atau tilt.
Layout detectionGunakan apabila mahu preserve headings, paragraphs, tables dan image structure.
Chart recognitionGunakan apabila image mengandungi charts atau structures kompleks.
Beautify MarkdownMenjadikan exported Markdown lebih mudah dibaca.

Untuk regular screenshots, kekalkan options minimum. Untuk document scans, enable lebih banyak document-related options.

Lihat Results

Selepas recognition selesai, dialog menunjukkan result.

Anda boleh copy terus atau pilih export formats.

PDF recognition

Untuk document pages, exported PDF boleh preserve page appearance sambil mengekalkan text searchable. Ini berguna untuk archiving scans dan mencari content kemudian.

Memilih Export Format

FormatBest For
Markdown (.md)Notes, documentation systems dan editing kemudian.
PDF (.pdf)Preserve page appearance dan scanned document results.
Word (.docx)Layout editing, text modification dan handoff kepada orang lain.
Export allMenyimpan beberapa formats dan original image, sesuai untuk archives penting.

Jika hanya perlukan text, export Markdown.

Jika perlukan page appearance, gunakan PDF atau Word.

Word Output

Exported Word documents boleh dibuka dan diedit dengan office software.

Word result

Sesetengah documents mengandungi recognized images, headings dan paragraphs dalam Word output.

Recognition quality bergantung pada original image clarity, model choice dan document complexity.

File Types Terbaik Untuk OCR

File TypeRecommendation
Clear screenshotsRecognize secara terus.
ScansPrefer PP-StructureV3.
Photographed documentsEnable orientation correction dan document flattening.
Tables, formulas, stampsPrefer structured models.
Simple short text imagesPP-OCRv5 biasanya cukup.

Images yang lebih jelas dan text yang lebih lurus biasanya menghasilkan results lebih baik.

Common Cases

CaseMeaning
Recognition failsSemak service token atau key telah disimpan.
Recognition slowComplex documents dan large images mengambil masa lebih lama.
Table incompleteCuba structured model.
Text ada kesilapanBlur, glare dan skew meningkatkan recognition errors. Cuba image yang lebih jelas.
Word output mengandungi banyak imagesStructured models mungkin preserve beberapa recognized images. Ini normal.

Google Quota Query Gagal

Semak:

  1. Service account JSON telah diimport.
  2. Service account mempunyai role Monitoring Viewer.
  3. Cloud Vision API enabled untuk project.

Jika anda hanya perlukan OCR dan bukan usage query, abaikan service account JSON dan isi hanya Google Vision API Key.

Quick Flow

text
Buka System Settings
-> Buka Other Settings
-> Isi OCR service credentials
-> Save
-> Kembali ke File Management
-> Pilih file dan klik OCR
-> Pilih model
-> Tunggu recognition
-> Copy results atau export Markdown / PDF / Word

Released as user documentation for CloudFlare ImgBed.