Skip to content

OCR

OCR متن را از images، scans و document screenshots استخراج می‌کند.

پس از recognition، می‌توانید result را copy کنید، به‌صورت Markdown، PDF یا Word export کنید، یا چند format را با هم package و download کنید.

OCR چه کارهایی می‌تواند انجام دهد

FeatureDescription
Image text recognitionاستخراج text از images، screenshots و scans.
Document layout recognitionمناسب‌تر برای tables، formulas، stamps و mixed text-image layouts.
Multiple servicesپشتیبانی از Baidu PaddleOCR، Microsoft Azure Vision و Google Vision.
Copy resultscopy کردن recognized text پس از processing.
Export filesexport کردن Markdown، PDF و Word.
Batch packagingپس از recognize کردن چند file، results را به‌صورت package download کنید.

ابتدا OCR Services را Configure کنید

باز کنید:

text
System Settings -> Other Settings -> OCR

IP geolocation and OCR

credentials مربوط به services موردنیاز را وارد کنید:

ServiceWhat To EnterBest For
Baidu PaddleOCRPaddleOCR Tokenانتخاب پیشنهادی اول. مناسب documents، images، tables و mixed layouts.
Microsoft Azure VisionAzure Vision Endpoint و Azure Vision API Keyاگر از Microsoft cloud services استفاده می‌کنید مفید است.
Google VisionGoogle Vision API Key. Service account JSON فقط برای quota query استفاده می‌شود.اگر از Google Cloud services استفاده می‌کنید مفید است.

بعد از پر کردن credentials، save کنید.

برای تست اولیه، configure کردن یک service کافی است. لازم نیست هر سه را داشته باشید.

Google Vision Setup

Google setup دو بخش دارد:

GoalRequirement
استفاده از OCRCloud Vision API را enable کنید و سپس API Key بسازید.
query کردن usageservice account بسازید، Monitoring Viewer بدهید، سپس service account JSON را download کنید.

Google API key and service account

استفاده از Google برای OCR

  1. Google Cloud Console را باز کنید.
  2. به APIs & Services بروید.
  3. Library را باز کنید، Cloud Vision API را جست‌وجو و enable کنید.
  4. به Credentials برگردید.
  5. API Key بسازید.
  6. API Key را باز و copy کنید.
  7. در ImgBed داخل Google Vision API Key paste کنید.
  8. Save کنید.

بعد از آن می‌توانید Google Vision را در OCR dialog انتخاب کنید.

Query کردن Google Usage

Quota query برای recognition لازم نیست.

فقط حدوداً نشان می‌دهد در 30 روز گذشته چند Google Vision call استفاده شده است.

  1. در Google Cloud Console، IAM & Admin را باز کنید.
  2. Service Accounts را باز کنید.
  3. service account بسازید، مثل vision-monitor.
  4. role Monitoring Viewer را به آن بدهید.
  5. جزئیات service account را باز کنید و key بسازید.
  6. JSON را انتخاب کنید.
  7. generated JSON file را download کنید.
  8. به ImgBed برگردید و آن را زیر service account JSON import کنید (اختیاری).
  9. پس از موفقیت import، quota query را بزنید.

پس از import، ImgBed نام project مالک service account را نشان می‌دهد. هنگام query usage، ImgBed Google monitoring data را می‌خواند و call count این ماه را نشان می‌دهد.

خلاصه:

ItemPurpose
Google Vision API KeyOCR recognition را اجرا می‌کند.
Service account JSONتعداد Google Vision calls استفاده‌شده را query می‌کند.
Monitoring Viewer roleاجازه می‌دهد service account usage data را بخواند.

گرفتن Baidu PaddleOCR Token

Baidu PaddleOCR به access token نیاز دارد.

Get PaddleOCR token

در صفحه Baidu PaddleOCR، پنجره API call را باز کنید، برای گرفتن token کلیک کنید و آن را copy کنید.

به ImgBed برگردید، داخل PaddleOCR Token paste کنید و save کنید.

شروع Recognition

در File Management، یک image یا document screenshot انتخاب کنید و OCR را بزنید.

OCR recognition

در dialog، recognition service و model را انتخاب کنید.

مدل‌های رایج PaddleOCR:

ModelBest For
PP-StructureV3default پیشنهادی. مناسب documents، tables، formulas، stamps و mixed layouts.
PP-OCRv5simple images، ordinary text و lightweight recognition.
PaddleOCR-VLmultilingual، complex images و chart-like content.
PaddleOCR-VL-1.5document pages پیچیده‌تر و layout recovery.

اگر مطمئن نیستید، با PP-StructureV3 شروع کنید.

Advanced Options

OptionDescription
Orientation correctionوقتی image چرخیده یا skewed است.
Document flatteningبرای photographed documents با curvature یا tilt.
Layout detectionوقتی می‌خواهید headings، paragraphs، tables و image structure حفظ شود.
Chart recognitionوقتی image شامل charts یا structures پیچیده است.
Beautify Markdownexported Markdown را خواناتر می‌کند.

برای screenshots عادی، options را حداقلی نگه دارید. برای document scans، گزینه‌های مرتبط با document را بیشتر enable کنید.

مشاهده Results

پس از پایان recognition، dialog result را نشان می‌دهد.

می‌توانید آن را مستقیم copy کنید یا export formats را انتخاب کنید.

PDF recognition

برای document pages، exported PDF می‌تواند ظاهر page را حفظ کند و text را searchable نگه دارد. برای archive کردن scans و پیدا کردن content بعداً مفید است.

انتخاب Export Format

FormatBest For
Markdown (.md)notes، documentation systems و later editing.
PDF (.pdf)حفظ ظاهر page و scanned document results.
Word (.docx)ادامه layout editing، text modification و handoff به دیگران.
Export allذخیره multiple formats و original image، مناسب archives مهم.

اگر فقط text می‌خواهید، Markdown export کنید.

اگر ظاهر page مهم است، PDF یا Word استفاده کنید.

Word Output

exported Word documents با office software قابل باز کردن و edit هستند.

Word result

بعضی documents شامل recognized images، headings و paragraphs در Word output هستند.

recognition quality به original image clarity، model choice و document complexity بستگی دارد.

بهترین File Types برای OCR

File TypeRecommendation
Clear screenshotsمستقیم recognize کنید.
ScansPP-StructureV3 را ترجیح دهید.
Photographed documentsorientation correction و document flattening را enable کنید.
Tables, formulas, stampsstructured models را ترجیح دهید.
Simple short text imagesPP-OCRv5 معمولاً کافی است.

images واضح‌تر با text صاف‌تر معمولاً result بهتری می‌دهند.

Common Cases

CaseMeaning
Recognition failsبررسی کنید service token یا key ذخیره شده باشد.
Recognition slow استdocuments پیچیده و images بزرگ زمان بیشتری می‌برند.
Table incomplete استیک structured model امتحان کنید.
Text mistakes داردblur، glare و skew خطا را زیاد می‌کنند. image واضح‌تر امتحان کنید.
Word output images زیادی داردstructured models ممکن است بعضی recognized images را حفظ کنند. این عادی است.

Google Quota Query Fail می‌شود

بررسی کنید:

  1. Service account JSON import شده باشد.
  2. service account role Monitoring Viewer داشته باشد.
  3. Cloud Vision API برای project enabled باشد.

اگر فقط OCR لازم دارید و usage query نمی‌خواهید، می‌توانید service account JSON را نادیده بگیرید و فقط Google Vision API Key را وارد کنید.

Quick Flow

text
System Settings را باز کنید
-> Other Settings را باز کنید
-> OCR service credentials را وارد کنید
-> Save
-> به File Management برگردید
-> file را انتخاب کنید و OCR را بزنید
-> model را انتخاب کنید
-> منتظر recognition بمانید
-> results را copy کنید یا Markdown / PDF / Word export کنید

Released as user documentation for CloudFlare ImgBed.