Skip to content

OCR

OCR images, scans और document screenshots से text extract करता है।

Recognition के बाद आप result copy कर सकते हैं, उसे Markdown, PDF या Word के रूप में export कर सकते हैं, या multiple formats को साथ package करके download कर सकते हैं।

OCR क्या कर सकता है

FeatureDescription
Image text recognitionImages, screenshots और scans से text extract करता है।
Document layout recognitionTables, formulas, stamps और mixed text-image layouts के लिए बेहतर।
Multiple servicesBaidu PaddleOCR, Microsoft Azure Vision और Google Vision support करता है।
Copy resultsProcessing के बाद recognized text copy करें।
Export filesMarkdown, PDF और Word export करें।
Batch packagingMultiple files recognize करने के बाद results को package के रूप में download करें।

पहले OCR Services Configure करें

खोलें:

text
System Settings -> Other Settings -> OCR

IP geolocation and OCR

जिन services को इस्तेमाल करना चाहते हैं उनके credentials भरें:

ServiceWhat To EnterBest For
Baidu PaddleOCRPaddleOCR TokenRecommended first choice। Documents, images, tables और mixed layouts के लिए अच्छा।
Microsoft Azure VisionAzure Vision Endpoint और Azure Vision API Keyअगर आप पहले से Microsoft cloud services इस्तेमाल करते हैं तो useful।
Google VisionGoogle Vision API Key। Service account JSON केवल quota query के लिए इस्तेमाल होता है।अगर आप Google Cloud services इस्तेमाल करते हैं तो useful।

Credentials भरने के बाद save करें।

Initial testing के लिए केवल एक service configure करना काफी है। तीनों की ज़रूरत नहीं।

Google Vision Setup

Google setup के दो हिस्से हैं:

GoalRequirement
OCR इस्तेमाल करनाCloud Vision API enable करें, फिर API Key बनाएं।
Usage query करनाService account बनाएं, Monitoring Viewer दें, फिर service account JSON download करें।

Google API key and service account

OCR के लिए Google इस्तेमाल करना

  1. Google Cloud Console खोलें।
  2. APIs & Services पर जाएँ।
  3. Library खोलें, Cloud Vision API search करें और enable करें।
  4. Credentials पर वापस जाएँ।
  5. एक API Key create करें।
  6. API Key खोलकर copy करें।
  7. ImgBed के Google Vision API Key में paste करें।
  8. Save करें।

इसके बाद OCR dialog में Google Vision चुन सकते हैं।

Google Usage Query करना

Quota query recognition के लिए required नहीं है।

यह केवल roughly दिखाता है कि पिछले 30 दिनों में कितनी Google Vision calls इस्तेमाल हुईं।

  1. Google Cloud Console में IAM & Admin खोलें।
  2. Service Accounts खोलें।
  3. एक service account बनाएं, जैसे vision-monitor
  4. उसे Monitoring Viewer role दें।
  5. Service account details खोलें और key create करें।
  6. JSON चुनें।
  7. Generated JSON file download करें।
  8. ImgBed पर लौटें और service account JSON के तहत इसे import करें (optional)।
  9. Import successful होने के बाद quota query click करें।

Import के बाद ImgBed service account वाला project name दिखाता है। Usage query करते समय ImgBed Google monitoring data पढ़कर इस महीने का call count दिखाता है।

संक्षेप में:

ItemPurpose
Google Vision API KeyOCR recognition करता है।
Service account JSONGoogle Vision calls की usage query करता है।
Monitoring Viewer roleService account को usage data पढ़ने देता है।

Baidu PaddleOCR Token लेना

Baidu PaddleOCR को access token चाहिए।

Get PaddleOCR token

Baidu PaddleOCR page पर API call window खोलें, token लेने के लिए click करें, फिर उसे copy करें।

ImgBed पर लौटें, PaddleOCR Token में paste करें और save करें।

Recognition शुरू करना

File Management में image या document screenshot select करें और OCR click करें।

OCR recognition

Dialog में recognition service और model चुनें।

Common PaddleOCR model choices:

ModelBest For
PP-StructureV3Recommended default। Documents, tables, formulas, stamps और mixed layouts के लिए अच्छा।
PP-OCRv5Simple images, ordinary text और lightweight recognition।
PaddleOCR-VLMultilingual, complex images और chart-like content।
PaddleOCR-VL-1.5ज़्यादा complex document pages और layout recovery।

अगर unsure हैं, तो PP-StructureV3 से शुरू करें।

Advanced Options

OptionDescription
Orientation correctionImage rotated या skewed हो तो इस्तेमाल करें।
Document flatteningCurvature या tilt वाले photographed documents के लिए इस्तेमाल करें।
Layout detectionHeadings, paragraphs, tables और image structure preserve करना हो तो इस्तेमाल करें।
Chart recognitionImage में charts या complex structures हों तो इस्तेमाल करें।
Beautify MarkdownExported Markdown को पढ़ने में आसान बनाता है।

Regular screenshots के लिए options minimal रखें। Document scans के लिए document-related options ज़्यादा enable करें।

Results देखना

Recognition finish होने के बाद dialog result दिखाता है।

आप इसे directly copy कर सकते हैं या export formats चुन सकते हैं।

PDF recognition

Document pages के लिए exported PDF page appearance preserve कर सकता है और text searchable रखता है। यह scans archive करने और बाद में content खोजने में उपयोगी है।

Export Format चुनना

FormatBest For
Markdown (.md)Notes, documentation systems और बाद की editing।
PDF (.pdf)Page appearance और scanned document results preserve करना।
Word (.docx)Layout editing, text modification और दूसरों को handoff।
Export allMultiple formats और original image save करता है, important archives के लिए suitable।

अगर सिर्फ text चाहिए, तो Markdown export करें।

अगर page appearance चाहिए, तो PDF या Word इस्तेमाल करें।

Word Output

Exported Word documents office software में खोले और edit किए जा सकते हैं।

Word result

कुछ documents में Word output के अंदर recognized images, headings और paragraphs शामिल होते हैं।

Recognition quality original image clarity, model choice और document complexity पर depend करती है।

OCR के लिए Best File Types

File TypeRecommendation
Clear screenshotsDirect recognize करें।
ScansPP-StructureV3 prefer करें।
Photographed documentsOrientation correction और document flattening enable करें।
Tables, formulas, stampsStructured models prefer करें।
Simple short text imagesPP-OCRv5 आम तौर पर काफी है।

Straight text वाली clearer images बेहतर results देती हैं।

Common Cases

CaseMeaning
Recognition fail होता हैCheck करें कि service token या key save है।
Recognition slow हैComplex documents और large images में ज़्यादा समय लगता है।
Table incomplete हैStructured model try करें।
Text में mistakes हैंBlur, glare और skew recognition errors बढ़ाते हैं। Clearer image try करें।
Word output में बहुत images हैंStructured models कुछ recognized images preserve कर सकते हैं। यह normal है।

Google Quota Query fail हो रही है

Check करें:

  1. Service account JSON import हुआ है।
  2. Service account के पास Monitoring Viewer role है।
  3. Project में Cloud Vision API enabled है।

अगर आपको सिर्फ OCR चाहिए और usage query नहीं, तो service account JSON ignore कर सकते हैं और केवल Google Vision API Key भर सकते हैं।

Quick Flow

text
System Settings खोलें
-> Other Settings खोलें
-> OCR service credentials भरें
-> Save करें
-> File Management पर लौटें
-> File select करें और OCR click करें
-> Model चुनें
-> Recognition का इंतज़ार करें
-> Results copy करें या Markdown / PDF / Word export करें

Released as user documentation for CloudFlare ImgBed.