Skip to content

OCR

OCR images, scans, document screenshots-இல் இருந்து text extract செய்கிறது.

recognition பிறகு result copy செய்யலாம், Markdown, PDF, Word ஆக export செய்யலாம், அல்லது பல formats ஒன்றாக package செய்து download செய்யலாம்.

OCR என்ன செய்ய முடியும்

FeatureDescription
Image text recognitionimages, screenshots, scans-இல் இருந்து text extract.
Document layout recognitiontables, formulas, stamps, mixed text-image layouts-க்கு சிறந்தது.
Multiple servicesBaidu PaddleOCR, Microsoft Azure Vision, Google Vision support.
Copy resultsprocessing பிறகு recognized text copy.
Export filesMarkdown, PDF, Word export.
Batch packagingபல files recognize செய்த பிறகு results package download.

முதலில் OCR Services Configure செய்யவும்

திறக்கவும்:

text
System Settings -> Other Settings -> OCR

IP geolocation and OCR

பயன்படுத்த வேண்டிய services-க்கு credentials நிரப்பவும்:

ServiceWhat To EnterBest For
Baidu PaddleOCRPaddleOCR Tokenமுதலில் பரிந்துரை. documents, images, tables, mixed layouts.
Microsoft Azure VisionAzure Vision Endpoint மற்றும் Azure Vision API KeyMicrosoft cloud services ஏற்கனவே பயன்படுத்தினால் useful.
Google VisionGoogle Vision API Key. Service account JSON quota query-க்கு மட்டும்.Google Cloud services பயன்படுத்தினால் useful.

credentials நிரப்பிய பிறகு save செய்யவும்.

initial testing-க்கு ஒரு service போதும். மூன்றையும் configure செய்ய வேண்டியதில்லை.

Google Vision Setup

Google setup இரண்டு பகுதிகள்:

GoalRequirement
OCR பயன்படுத்தCloud Vision API enable செய்து API Key உருவாக்கவும்.
usage queryservice account உருவாக்கி Monitoring Viewer grant செய்து service account JSON download செய்யவும்.

Google API key and service account

Google-ஐ OCR-க்கு பயன்படுத்துவது

  1. Google Cloud Console திறக்கவும்.
  2. APIs & Services செல்லவும்.
  3. Library திறந்து Cloud Vision API தேடி enable செய்யவும்.
  4. Credentials-க்கு திரும்பவும்.
  5. API Key உருவாக்கவும்.
  6. API Key திறந்து copy செய்யவும்.
  7. ImgBed Google Vision API Key-ல் paste செய்யவும்.
  8. Save செய்யவும்.

பிறகு OCR dialog-ல் Google Vision தேர்வு செய்யலாம்.

Google Usage Query

Quota query recognition-க்கு required அல்ல.

இது கடந்த 30 நாட்களில் Google Vision calls எவ்வளவு பயன்படுத்தப்பட்டது என rough count காட்டும்.

  1. Google Cloud Console-ல் IAM & Admin திறக்கவும்.
  2. Service Accounts திறக்கவும்.
  3. service account உருவாக்கவும், உதா. vision-monitor.
  4. Monitoring Viewer role கொடுக்கவும்.
  5. service account details திறந்து key உருவாக்கவும்.
  6. JSON தேர்வு செய்யவும்.
  7. generated JSON file download செய்யவும்.
  8. ImgBed-க்கு திரும்பி service account JSON கீழ் import செய்யவும் (optional).
  9. import success ஆன பிறகு quota query கிளிக் செய்யவும்.

import பிறகு ImgBed service account-ன் project name காட்டும். usage query செய்யும்போது ImgBed Google monitoring data படித்து இந்த month's call count காட்டும்.

சுருக்கமாக:

ItemPurpose
Google Vision API KeyOCR recognition செய்யும்.
Service account JSONGoogle Vision calls usage query.
Monitoring Viewer roleservice account usage data படிக்க அனுமதி.

Baidu PaddleOCR Token பெறுதல்

Baidu PaddleOCR access token தேவை.

Get PaddleOCR token

Baidu PaddleOCR page-ல் API call window திறந்து token பெற கிளிக் செய்து copy செய்யவும்.

ImgBed-க்கு திரும்பி PaddleOCR Token-ல் paste செய்து save செய்யவும்.

Recognition தொடங்குதல்

File Management-ல் image அல்லது document screenshot தேர்வு செய்து OCR கிளிக் செய்யவும்.

OCR recognition

dialog-ல் recognition service மற்றும் model தேர்வு செய்யவும்.

Common PaddleOCR model choices:

ModelBest For
PP-StructureV3recommended default. documents, tables, formulas, stamps, mixed layouts.
PP-OCRv5simple images, ordinary text, lightweight recognition.
PaddleOCR-VLmultilingual, complex images, chart-like content.
PaddleOCR-VL-1.5complex document pages மற்றும் layout recovery.

நிச்சயமில்லையெனில் PP-StructureV3-இல் தொடங்கவும்.

Advanced Options

OptionDescription
Orientation correctionimage rotated அல்லது skewed என்றால்.
Document flatteningphotographed documents-ல் curvature அல்லது tilt இருந்தால்.
Layout detectionheadings, paragraphs, tables, image structure preserve செய்ய.
Chart recognitionimage-ல் charts அல்லது complex structures இருந்தால்.
Beautify Markdownexported Markdown readable ஆகும்.

regular screenshots-க்கு minimal options வைத்திருக்கவும். document scans-க்கு document-related options enable செய்யவும்.

Results பார்க்க

recognition முடிந்ததும் dialog result காட்டும்.

அதை நேரடியாக copy செய்யலாம் அல்லது export formats தேர்வு செய்யலாம்.

PDF recognition

document pages-க்கு exported PDF page appearance preserve செய்து text searchable ஆக வைத்திருக்கலாம். scans archive செய்யவும் பின்னர் content தேடவும் useful.

Export Format தேர்வு

FormatBest For
Markdown (.md)notes, documentation systems, later editing.
PDF (.pdf)page appearance மற்றும் scanned document results preserve.
Word (.docx)layout editing, text modification, handoff.
Export allmultiple formats மற்றும் original image சேமிக்க, important archives.

text மட்டும் வேண்டுமெனில் Markdown export செய்யவும்.

page appearance தேவை என்றால் PDF அல்லது Word.

Word Output

exported Word documents office software-ல் open/edit செய்யலாம்.

Word result

சில documents Word output-ல் recognized images, headings, paragraphs கொண்டிருக்கும்.

recognition quality original image clarity, model choice, document complexity ஆகியவற்றை சார்ந்தது.

OCR-க்கு சிறந்த File Types

File TypeRecommendation
Clear screenshotsdirectly recognize.
ScansPP-StructureV3 prefer.
Photographed documentsorientation correction மற்றும் document flattening enable.
Tables, formulas, stampsstructured models prefer.
Simple short text imagesPP-OCRv5 பொதுவாக போதும்.

clearer images மற்றும் straight text நல்ல results தரும்.

Common Cases

CaseMeaning
Recognition failsservice token அல்லது key save ஆனதா பார்க்கவும்.
Recognition slowcomplex documents மற்றும் large images நேரம் எடுக்கும்.
Table incompletestructured model try செய்யவும்.
Text mistakesblur, glare, skew errors அதிகரிக்கும். clearer image try செய்யவும்.
Word output பல images கொண்டுள்ளதுstructured models சில recognized images preserve செய்யலாம். இது normal.

Google Quota Query Fail

சரிபார்க்கவும்:

  1. Service account JSON imported.
  2. service account-க்கு Monitoring Viewer role உள்ளது.
  3. project-க்கு Cloud Vision API enabled.

OCR மட்டும் வேண்டும், usage query வேண்டாம் என்றால் service account JSON தவிர்த்து Google Vision API Key மட்டும் நிரப்பலாம்.

Quick Flow

text
System Settings திறக்கவும்
-> Other Settings திறக்கவும்
-> OCR service credentials நிரப்பவும்
-> Save
-> File Management-க்கு திரும்பவும்
-> file தேர்வு செய்து OCR கிளிக் செய்யவும்
-> model தேர்வு செய்யவும்
-> recognition முடியும் வரை காத்திருக்கவும்
-> results copy அல்லது Markdown / PDF / Word export செய்யவும்

Released as user documentation for CloudFlare ImgBed.