Skip to content

OCR

OCR haalt tekst uit afbeeldingen, scans en screenshots van documenten.

Na herkenning kun je het resultaat kopiëren, exporteren als Markdown, PDF of Word, of meerdere formaten samen downloaden als pakket.

Wat OCR kan doen

FunctieBeschrijving
Tekstherkenning in afbeeldingenHaalt tekst uit afbeeldingen, screenshots en scans.
Documentlay-outherkenningBeter voor tabellen, formules, stempels en gemengde tekst-afbeeldinglayouts.
Meerdere dienstenOndersteunt Baidu PaddleOCR, Microsoft Azure Vision en Google Vision.
Resultaten kopiërenKopieer herkende tekst na verwerking.
Bestanden exporterenExporteer Markdown, PDF en Word.
BatchverpakkingDownload na herkenning van meerdere bestanden resultaten als pakket.

Configureer eerst OCR-diensten

Open:

text
System Settings -> Other Settings -> OCR

IP-geolocatie en OCR

Vul gegevens in voor de diensten die je wilt gebruiken:

DienstWat je invultBeste keuze voor
Baidu PaddleOCRPaddleOCR TokenAanbevolen eerste keuze. Goed voor documenten, afbeeldingen, tabellen en gemengde layouts.
Microsoft Azure VisionAzure Vision Endpoint en Azure Vision API KeyHandig als je al Microsoft-cloudservices gebruikt.
Google VisionGoogle Vision API Key. Serviceaccount-JSON wordt alleen gebruikt voor quota-opvraag.Handig als je Google Cloud gebruikt.

Sla op nadat je gegevens hebt ingevuld.

Voor een eerste test kun je één dienst configureren. Je hebt ze niet alle drie nodig.

Google Vision instellen

Google heeft twee onderdelen:

DoelVereiste
OCR gebruikenSchakel Cloud Vision API in en maak daarna een API Key.
Gebruik opvragenMaak een serviceaccount, geef Monitoring Viewer en download daarna de serviceaccount-JSON.

Google API key en serviceaccount

Google gebruiken voor OCR

  1. Open Google Cloud Console.
  2. Ga naar APIs & Services.
  3. Open Library, zoek Cloud Vision API en schakel deze in.
  4. Ga terug naar Credentials.
  5. Maak een API Key.
  6. Open de API Key en kopieer deze.
  7. Plak deze in Google Vision API Key in ImgBed.
  8. Sla op.

Daarna kun je Google Vision kiezen in het OCR-venster.

Google-gebruik opvragen

Quota-opvraag is niet nodig voor herkenning.

Het toont alleen grofweg hoeveel Google Vision-aanroepen in de laatste 30 dagen zijn gebruikt.

  1. Open in Google Cloud Console IAM & Admin.
  2. Open Service Accounts.
  3. Maak een serviceaccount, bijvoorbeeld vision-monitor.
  4. Geef dit account de rol Monitoring Viewer.
  5. Open de details van het serviceaccount en maak een key.
  6. Kies JSON.
  7. Download het gegenereerde JSON-bestand.
  8. Ga terug naar ImgBed en importeer het onder serviceaccount JSON (optioneel).
  9. Klik na succesvolle import op quota opvragen.

Na import toont ImgBed de projectnaam van het serviceaccount. Bij het opvragen leest ImgBed Google monitoringgegevens en toont het aantal aanroepen van deze maand.

Kort gezegd:

ItemDoel
Google Vision API KeyVoert OCR-herkenning uit.
Serviceaccount JSONVraagt op hoeveel Google Vision-aanroepen zijn gebruikt.
Rol Monitoring ViewerLaat het serviceaccount gebruiksgegevens lezen.

Een Baidu PaddleOCR-token ophalen

Baidu PaddleOCR vereist een access token.

PaddleOCR-token ophalen

Open het API-aanroepvenster op de Baidu PaddleOCR-pagina, klik om een token te krijgen en kopieer het.

Ga terug naar ImgBed, plak het in PaddleOCR Token en sla op.

Herkenning starten

Selecteer in Bestandsbeheer een afbeelding of documentscreenshot en klik op OCR.

OCR-herkenning

Kies in het venster de herkenningsdienst en het model.

Veelgebruikte PaddleOCR-modellen:

ModelBeste keuze voor
PP-StructureV3Aanbevolen standaard. Goed voor documenten, tabellen, formules, stempels en gemengde layouts.
PP-OCRv5Eenvoudige afbeeldingen, gewone tekst en lichte herkenning.
PaddleOCR-VLMeertalig, complexe afbeeldingen en inhoud met grafieken.
PaddleOCR-VL-1.5Complexere documentpagina's en layoutreconstructie.

Weet je het niet zeker, begin dan met PP-StructureV3.

Geavanceerde opties

OptieBeschrijving
OriëntatiecorrectieGebruik wanneer de afbeelding gedraaid of scheef is.
Document afvlakkenGebruik voor gefotografeerde documenten met kromming of perspectief.
LayoutdetectieGebruik wanneer je koppen, alinea's, tabellen en afbeeldingsstructuur wilt behouden.
GrafiekherkenningGebruik wanneer de afbeelding grafieken of complexe structuren bevat.
Markdown verbeterenMaakt geëxporteerde Markdown leesbaarder.

Voor gewone screenshots houd je de opties beperkt. Voor documentscans schakel je meer documentgerichte opties in.

Resultaten bekijken

Wanneer herkenning klaar is, toont het venster het resultaat.

Je kunt het direct kopiëren of exportformaten kiezen.

PDF-herkenning

Voor documentpagina's kan geëxporteerde PDF de paginaweergave behouden en tegelijk tekst doorzoekbaar maken. Dat is handig voor archiveren van scans en later terugvinden van inhoud.

Exportformaat kiezen

FormaatBeste keuze voor
Markdown (.md)Notities, documentatiesystemen en later bewerken.
PDF (.pdf)Paginaweergave bewaren en scanresultaten archiveren.
Word (.docx)Layout verder bewerken, tekst aanpassen en delen met anderen.
Alles exporterenSlaat meerdere formaten en de oorspronkelijke afbeelding op, geschikt voor belangrijke archieven.

Heb je alleen tekst nodig, exporteer dan Markdown.

Heb je paginaweergave nodig, gebruik dan PDF of Word.

Word-uitvoer

Geëxporteerde Word-documenten kunnen met office-software worden geopend en bewerkt.

Word-resultaat

Sommige documenten bevatten herkende afbeeldingen, koppen en alinea's in de Word-uitvoer.

De kwaliteit hangt af van de scherpte van het origineel, de modelkeuze en de complexiteit van het document.

Beste bestandstypen voor OCR

BestandstypeAanbeveling
Duidelijke screenshotsDirect herkennen.
ScansKies bij voorkeur PP-StructureV3.
Gefotografeerde documentenSchakel oriëntatiecorrectie en documentafvlakking in.
Tabellen, formules, stempelsGebruik bij voorkeur gestructureerde modellen.
Eenvoudige korte tekstafbeeldingenPP-OCRv5 is meestal voldoende.

Duidelijkere afbeeldingen met rechtere tekst leveren meestal betere resultaten op.

Veelvoorkomende situaties

SituatieBetekenis
Herkenning misluktControleer of het servicetoken of de key is opgeslagen.
Herkenning is traagComplexe documenten en grote afbeeldingen kosten meer tijd.
Tabel is onvolledigProbeer een gestructureerd model.
Tekst bevat foutenOnscherpte, reflectie en scheefstand vergroten herkenningsfouten. Probeer een duidelijkere afbeelding.
Word-uitvoer bevat veel afbeeldingenGestructureerde modellen kunnen sommige herkende afbeeldingen behouden. Dat is normaal.

Google quota-opvraag mislukt

Controleer:

  1. Serviceaccount-JSON is geïmporteerd.
  2. Het serviceaccount heeft de rol Monitoring Viewer.
  3. Cloud Vision API is ingeschakeld voor het project.

Heb je alleen OCR nodig en geen gebruiksopvraag, dan kun je de serviceaccount-JSON negeren en alleen Google Vision API Key invullen.

Snelle flow

text
Open System Settings
-> Open Other Settings
-> Vul OCR-servicegegevens in
-> Sla op
-> Ga terug naar Bestandsbeheer
-> Selecteer een bestand en klik OCR
-> Kies een model
-> Wacht op herkenning
-> Kopieer resultaten of exporteer Markdown / PDF / Word

Released as user documentation for CloudFlare ImgBed.