Skip to content

OCR

OCR; görsellerden, taramalardan ve belge ekran görüntülerinden metin çıkarır.

Tanıma tamamlandıktan sonra sonucu kopyalayabilir, Markdown, PDF veya Word olarak dışa aktarabilir ya da birden fazla formatı birlikte paketleyip indirebilirsiniz.

OCR Neler Yapabilir?

ÖzellikAçıklama
Görsel metin tanımaGörsellerden, ekran görüntülerinden ve taramalardan metin çıkarır.
Belge düzeni tanımaTablolar, formüller, damgalar ve karma metin-görsel düzenler için daha uygundur.
Birden fazla servisBaidu PaddleOCR, Microsoft Azure Vision ve Google Vision destekler.
Sonuçları kopyalamaİşlemden sonra tanınan metni kopyalar.
Dosya dışa aktarmaMarkdown, PDF ve Word dışa aktarır.
Batch packagingBirden fazla dosya tanındıktan sonra sonuçları paket halinde indirir.

Önce OCR Servislerini Yapılandırın

Şurayı açın:

text
System Settings -> Other Settings -> OCR

IP geolocation ve OCR

Kullanmak istediğiniz servisler için credentials değerlerini doldurun:

ServisNe girilirEn uygun kullanım
Baidu PaddleOCRPaddleOCR Tokenİlk tercih olarak önerilir. Belgeler, görseller, tablolar ve karma düzenler için iyidir.
Microsoft Azure VisionAzure Vision Endpoint ve Azure Vision API KeyMicrosoft bulut servislerini zaten kullanıyorsanız yararlıdır.
Google VisionGoogle Vision API Key. Service account JSON yalnızca kota sorgusu için kullanılır.Google Cloud servisleri kullanıyorsanız yararlıdır.

Credentials girdikten sonra kaydedin.

İlk test için yalnızca bir servis yapılandırabilirsiniz. Üçünün de gerekli olması şart değildir.

Google Vision Kurulumu

Google kurulumu iki parçadan oluşur:

AmaçGereken
OCR kullanmakCloud Vision API etkinleştirip API Key oluşturmak.
Kullanımı sorgulamakService account oluşturmak, Monitoring Viewer vermek ve service account JSON indirmek.

Google API key ve service account

OCR İçin Google Kullanma

  1. Google Cloud Console'u açın.
  2. APIs & Services bölümüne gidin.
  3. Library açın, Cloud Vision API araması yapın ve etkinleştirin.
  4. Credentials bölümüne dönün.
  5. API Key oluşturun.
  6. API Key'i açıp kopyalayın.
  7. ImgBed'deki Google Vision API Key alanına yapıştırın.
  8. Kaydedin.

Ardından OCR penceresinde Google Vision seçebilirsiniz.

Google Kullanımını Sorgulama

Quota query tanıma işlemi için gerekli değildir.

Yalnızca son 30 günde yaklaşık kaç Google Vision çağrısı kullanıldığını gösterir.

  1. Google Cloud Console'da IAM & Admin bölümünü açın.
  2. Service Accounts bölümünü açın.
  3. vision-monitor gibi bir service account oluşturun.
  4. Monitoring Viewer rolünü verin.
  5. Service account ayrıntılarını açın ve key oluşturun.
  6. JSON seçin.
  7. Oluşturulan JSON dosyasını indirin.
  8. ImgBed'e dönün ve service account JSON altında içe aktarın (isteğe bağlı).
  9. İçe aktarma başarılı olduktan sonra quota query tıklayın.

İçe aktardıktan sonra ImgBed service account sahibi project name değerini gösterir. Kullanım sorgulanırken ImgBed Google monitoring data okur ve bu ayın çağrı sayısını gösterir.

Kısaca:

ÖğeAmaç
Google Vision API KeyOCR tanıma yapar.
Service account JSONKaç Google Vision çağrısı kullanıldığını sorgular.
Monitoring Viewer roleService account'un usage data okumasını sağlar.

Baidu PaddleOCR Token Alma

Baidu PaddleOCR access token ister.

PaddleOCR token alma

Baidu PaddleOCR sayfasındaki API çağrı penceresini açın, token alma düğmesine tıklayın ve kopyalayın.

ImgBed'e dönün, PaddleOCR Token alanına yapıştırın ve kaydedin.

Tanımayı Başlatma

File Management içinde bir görsel veya belge ekran görüntüsü seçin ve OCR tıklayın.

OCR tanıma

Pencerede tanıma servisini ve modeli seçin.

Yaygın PaddleOCR model seçenekleri:

ModelEn uygun kullanım
PP-StructureV3Varsayılan olarak önerilir. Belgeler, tablolar, formüller, damgalar ve karma düzenler için iyidir.
PP-OCRv5Basit görseller, sıradan metinler ve hafif tanıma.
PaddleOCR-VLÇok dilli, karmaşık görseller ve chart-like content.
PaddleOCR-VL-1.5Daha karmaşık belge sayfaları ve layout recovery.

Emin değilseniz PP-StructureV3 ile başlayın.

Advanced Options

SeçenekAçıklama
Orientation correctionGörsel döndürülmüş veya eğikse kullanın.
Document flatteningEğrilik veya açı içeren fotoğraflanmış belgeler için.
Layout detectionBaşlık, paragraf, tablo ve görsel yapısını korumak istediğinizde.
Chart recognitionGörselde grafik veya karmaşık yapı varsa.
Beautify MarkdownDışa aktarılan Markdown'u daha okunur yapar.

Normal ekran görüntülerinde seçenekleri az tutun. Belge taramalarında daha fazla belge odaklı seçeneği etkinleştirin.

Sonuçları Görüntüleme

Tanıma bittiğinde pencere sonucu gösterir.

Doğrudan kopyalayabilir veya dışa aktarma formatlarını seçebilirsiniz.

PDF tanıma

Belge sayfalarında dışa aktarılan PDF, sayfa görünümünü korurken metni aranabilir tutabilir. Taramaları arşivlemek ve daha sonra içerik aramak için kullanışlıdır.

Dışa Aktarma Formatı Seçimi

FormatEn uygun kullanım
Markdown (.md)Notlar, dokümantasyon sistemleri ve sonraki düzenleme.
PDF (.pdf)Sayfa görünümünü ve taranmış belge sonucunu koruma.
Word (.docx)Düzeni düzenlemeye devam etme, metin değişikliği ve başkalarına aktarma.
Export allBirden fazla formatı ve özgün görseli kaydeder; önemli arşivler için uygundur.

Yalnızca metne ihtiyacınız varsa Markdown dışa aktarın.

Sayfa görünümü önemliyse PDF veya Word kullanın.

Word Output

Dışa aktarılan Word belgeleri office yazılımlarında açılıp düzenlenebilir.

Word sonucu

Bazı belgeler Word output içinde tanınan görseller, başlıklar ve paragraflar içerebilir.

Tanıma kalitesi özgün görsel netliğine, model seçimine ve belge karmaşıklığına bağlıdır.

OCR İçin En Uygun Dosya Türleri

Dosya TürüÖneri
Net ekran görüntüleriDoğrudan tanıyın.
TaramalarPP-StructureV3 tercih edin.
Fotoğraflanmış belgelerOrientation correction ve document flattening etkinleştirin.
Tablolar, formüller, damgalarStructured models tercih edin.
Basit kısa metin görselleriPP-OCRv5 genellikle yeterlidir.

Daha net ve daha düz metinli görseller genellikle daha iyi sonuç verir.

Yaygın Durumlar

DurumAnlamı
Recognition failsService token veya key kaydedildi mi kontrol edin.
Recognition is slowKarmaşık belgeler ve büyük görseller daha uzun sürer.
Table is incompleteStructured model deneyin.
Text has mistakesBulanıklık, parlama ve eğiklik hataları artırır. Daha net görsel deneyin.
Word output contains many imagesStructured models tanınan bazı görselleri koruyabilir. Bu normaldir.

Google Quota Query Fails

Kontrol edin:

  1. Service account JSON içe aktarıldı.
  2. Service account Monitoring Viewer rolüne sahip.
  3. Projede Cloud Vision API etkin.

Yalnızca OCR gerekiyorsa ve usage query gerekmiyorsa service account JSON kullanmayabilir, yalnızca Google Vision API Key doldurabilirsiniz.

Kısa Akış

text
System Settings aç
-> Other Settings aç
-> OCR service credentials doldur
-> Kaydet
-> File Management'a dön
-> Dosya seç ve OCR tıkla
-> Model seç
-> Tanımayı bekle
-> Sonuçları kopyala veya Markdown / PDF / Word dışa aktar

Released as user documentation for CloudFlare ImgBed.