Skip to content

OCR

OCR images, scans এবং document screenshots থেকে text extract করে।

Recognition-এর পর result copy করা যায়, Markdown, PDF বা Word হিসেবে export করা যায়, অথবা multiple formats একসঙ্গে package করে download করা যায়।

OCR কী করতে পারে

FeatureDescription
Image text recognitionImages, screenshots এবং scans থেকে text extract করে।
Document layout recognitionTables, formulas, stamps এবং mixed text-image layouts-এর জন্য ভালো।
Multiple servicesBaidu PaddleOCR, Microsoft Azure Vision এবং Google Vision support করে।
Copy resultsProcessing-এর পর recognized text copy করুন।
Export filesMarkdown, PDF এবং Word export করুন।
Batch packagingMultiple files recognize করার পর results package হিসেবে download করুন।

আগে OCR Services Configure করুন

খুলুন:

text
System Settings -> Other Settings -> OCR

IP geolocation and OCR

যে services ব্যবহার করতে চান সেগুলোর credentials পূরণ করুন:

ServiceWhat To EnterBest For
Baidu PaddleOCRPaddleOCR TokenRecommended first choice। Documents, images, tables এবং mixed layouts-এর জন্য ভালো।
Microsoft Azure VisionAzure Vision Endpoint এবং Azure Vision API KeyMicrosoft cloud services ব্যবহার করলে useful।
Google VisionGoogle Vision API Key। Service account JSON শুধু quota query-এর জন্য।Google Cloud services ব্যবহার করলে useful।

Credentials পূরণ করার পর save করুন।

Initial testing-এর জন্য একটি service configure করলেই হয়। তিনটিই দরকার নেই।

Google Vision Setup

Google setup-এর দুটি অংশ:

GoalRequirement
OCR ব্যবহারCloud Vision API enable করুন, তারপর API Key তৈরি করুন।
Usage queryService account তৈরি করুন, Monitoring Viewer grant করুন, তারপর service account JSON download করুন।

Google API key and service account

OCR-এর জন্য Google ব্যবহার

  1. Google Cloud Console খুলুন।
  2. APIs & Services-এ যান।
  3. Library খুলে Cloud Vision API search করে enable করুন।
  4. Credentials-এ ফিরে যান।
  5. একটি API Key তৈরি করুন।
  6. API Key খুলে copy করুন।
  7. ImgBed-এর Google Vision API Key-এ paste করুন।
  8. Save করুন।

এরপর OCR dialog-এ Google Vision নির্বাচন করতে পারবেন।

Google Usage Query

Quota query recognition-এর জন্য required নয়।

এটি শুধু গত 30 দিনে কত Google Vision calls ব্যবহৃত হয়েছে তার rough count দেখায়।

  1. Google Cloud Console-এ IAM & Admin খুলুন।
  2. Service Accounts খুলুন।
  3. একটি service account তৈরি করুন, যেমন vision-monitor
  4. এটিকে Monitoring Viewer role দিন।
  5. Service account details খুলে key create করুন।
  6. JSON নির্বাচন করুন।
  7. Generated JSON file download করুন।
  8. ImgBed-এ ফিরে service account JSON-এর নিচে import করুন (optional)।
  9. Import successful হলে quota query ক্লিক করুন।

Import-এর পর ImgBed service account-এর project name দেখায়। Usage query করার সময় ImgBed Google monitoring data পড়ে এই মাসের call count দেখায়।

সংক্ষেপে:

ItemPurpose
Google Vision API KeyOCR recognition করে।
Service account JSONকত Google Vision calls ব্যবহৃত হয়েছে query করে।
Monitoring Viewer roleService account-কে usage data পড়তে দেয়।

Baidu PaddleOCR Token নেওয়া

Baidu PaddleOCR access token চায়।

Get PaddleOCR token

Baidu PaddleOCR page-এর API call window খুলে token নেওয়ার জন্য click করুন, তারপর copy করুন।

ImgBed-এ ফিরে PaddleOCR Token-এ paste করে save করুন।

Recognition শুরু করা

File Management-এ image বা document screenshot নির্বাচন করে OCR ক্লিক করুন।

OCR recognition

Dialog-এ recognition service এবং model নির্বাচন করুন।

Common PaddleOCR model choices:

ModelBest For
PP-StructureV3Recommended default। Documents, tables, formulas, stamps এবং mixed layouts-এর জন্য ভালো।
PP-OCRv5Simple images, ordinary text এবং lightweight recognition।
PaddleOCR-VLMultilingual, complex images এবং chart-like content।
PaddleOCR-VL-1.5আরও complex document pages এবং layout recovery।

নিশ্চিত না হলে PP-StructureV3 দিয়ে শুরু করুন।

Advanced Options

OptionDescription
Orientation correctionImage rotated বা skewed হলে ব্যবহার করুন।
Document flatteningCurvature বা tilt থাকা photographed documents-এর জন্য ব্যবহার করুন।
Layout detectionHeadings, paragraphs, tables এবং image structure preserve করতে চাইলে ব্যবহার করুন।
Chart recognitionImage-এ charts বা complex structures থাকলে ব্যবহার করুন।
Beautify MarkdownExported Markdown পড়তে সহজ করে।

Regular screenshots-এর জন্য options minimal রাখুন। Document scans-এর জন্য document-related options বেশি enable করুন।

Results দেখা

Recognition শেষ হলে dialog result দেখায়।

আপনি direct copy করতে পারেন বা export formats বেছে নিতে পারেন।

PDF recognition

Document pages-এর জন্য exported PDF page appearance preserve করতে পারে এবং text searchable রাখে। Scans archive করা এবং পরে content খোঁজার জন্য useful।

Export Format নির্বাচন

FormatBest For
Markdown (.md)Notes, documentation systems এবং পরের editing।
PDF (.pdf)Page appearance এবং scanned document results preserve করা।
Word (.docx)Layout editing, text modification এবং অন্যদের handoff।
Export allMultiple formats এবং original image save করে; important archives-এর জন্য suitable।

শুধু text দরকার হলে Markdown export করুন।

Page appearance দরকার হলে PDF বা Word ব্যবহার করুন।

Word Output

Exported Word documents office software দিয়ে খোলা এবং edit করা যায়।

Word result

কিছু documents-এর Word output-এ recognized images, headings এবং paragraphs থাকে।

Recognition quality original image clarity, model choice এবং document complexity-এর ওপর depend করে।

OCR-এর জন্য ভালো File Types

File TypeRecommendation
Clear screenshotsDirect recognize করুন।
ScansPP-StructureV3 prefer করুন।
Photographed documentsOrientation correction এবং document flattening enable করুন।
Tables, formulas, stampsStructured models prefer করুন।
Simple short text imagesPP-OCRv5 সাধারণত যথেষ্ট।

Straight text থাকা clearer images সাধারণত ভালো results দেয়।

Common Cases

CaseMeaning
Recognition failsService token বা key save আছে কি না check করুন।
Recognition slowComplex documents এবং large images বেশি সময় নেয়।
Table incompleteStructured model try করুন।
Text mistakesBlur, glare এবং skew recognition errors বাড়ায়। Clearer image try করুন।
Word output-এ অনেক imagesStructured models কিছু recognized images preserve করতে পারে। এটি normal।

Google Quota Query fail হলে

Check করুন:

  1. Service account JSON import হয়েছে।
  2. Service account-এর Monitoring Viewer role আছে।
  3. Project-এ Cloud Vision API enabled।

শুধু OCR দরকার হলে usage query না করেও চলে; service account JSON ignore করে শুধু Google Vision API Key পূরণ করতে পারেন।

Quick Flow

text
System Settings খুলুন
-> Other Settings খুলুন
-> OCR service credentials পূরণ করুন
-> Save
-> File Management-এ ফিরে যান
-> File select করে OCR ক্লিক করুন
-> Model নির্বাচন করুন
-> Recognition শেষ হওয়ার অপেক্ষা করুন
-> Results copy করুন বা Markdown / PDF / Word export করুন

Released as user documentation for CloudFlare ImgBed.