OCR Seçmek İçin 7 Anahtar Kriter

Özellikle bilgi işlem konusunda sıkça tartışılan bir konu OCR seçmektir. Eğer bu konuda iyi değilseniz, yazılım seçmek zorlu bir mesele haline gelebilir.

1# Türkçe için doğruluğun yüksek olması avantaj sağlar!

Çoğu durumda tanıma hatalarını düzeltmeniz gerekmez. Diğer durumlarda, bazen düzeltmeniz şarttır – profesyonel olmayan bir görünüm sergilemek istemezsiniz, değil mi? Fakat yanlış tanımaları düzeltmek zaman alır. Yani doğruluk oranı ne kadar yüksekse, harcayacağınız zaman da o kadar azalır. Geriye kalanlar ise dil bilgisi otomatik düzeltme işlevleri ile çözülebilir.

Yine de tüm doğruluk değerleri, işinize aynı şekilde yaramaz. OCR programları tüm desteklenen dilleri aynı oranda tanıyamaz. İngilizce’de yüksek doğruluk oranı, otomatik olarak örneğin Türkçe veya Çekçe için de aynı oranda doğruluk olacağı anlamına gelmez. Yani özellikle kullanacağınız dil veya diller için doğruluk oranını kontrol edin. Ayrıca, OCR programının aynı belgede iki veya daha fazla dil kullanılan metinleri tanıma yeteneğini de kontrol edin.

2# Düzenlemesi kolay belgeler, zaman kazandırır

Birçok belge düzenlenmek için dönüştürülür. Sadece hayal edin, orta karmaşıklıkta, yapısı bozulmuş bir tabloyu düzeltmek için ne kadar zaman harcamanız gerekir? Veya 50 sayfalık bir raporu dönüştürdüğünüzü hayal edin. Raporu MS Word programına dönüştürdünüz ve sadece bir sayfa daha eklediniz. Eğer var olan sayfa numarası standart metin olarak oluşturulmuşsa – sayfa eklediğinizde veya çıkardığınızda sayfa numaraları otomatik olarak güncellenmez. Bu yüzden tüm numaralandırmayı elle düzeltmeniz gerekir – moral bozucu, değil mi?

Yani, OCR programı kolaylıkla düzenlenebilir sonuçlar sağlamalı:

  • Çok sayfalı da olsa, belge yapısını dikkatlice çıktı belge formatına uyacak şekilde korumalı: başlıklar, metin düzeyleri ve stilleri, sütunlar, metnin sayfadan sayfaya akışı, üst bilgi ve alt bilgi, sayfa numarası, dipnot gibi özel öğeler
  • Tüm belge öğelerini doğru şekilde yeniden oluşturmalı: tablolar, satırlar ve paragraflar, linkler, açıklamalar, resimler, grafikler, veri grafikleri vs.

3# Tüm virgüller bir önemliyse?

Belgenin yüzde yüz doğru olması gerekiyor. Bir sözleşmeyi metni yeniden kullanmak için dönüştürüyorsanız, tek bir hatayı bile tolere edemezsiniz. Bedeli çok büyük olur. Bunun tek olası çözümü yazım kontrolü için uzun bir belgeyi tamamen kontrol etmek için saatler harcamak mı?

Yok artık! OCR programının yazım kontrolü (doğrulama) aracı olup olmadığını kontrol edin. Teker teker şüpheli karakter ve kelimelerin üzerinden geçmenizi , orijinal belgenin resmi ile karşılaştırarak hatalı olanları düzeltmenizi sağlar.

4# İşi tamamlamak için takip ettiğiniz yolun en hızlısı olduğundan emin olun

En hızlı OCR programı demek, en yüksek OCR hızı demek değil, işi en hızlı tamamlayan anlamına gelir. Oysa görev dönüştürmek değil! Görevler bir sözleşmeyi alarak bir şablon oluşturmak için düzenlemek, bir rapor için alıntılanacak bölümleri bulmak ve almak, bir elektronik arşive eklemek için hazırlamak vs gibi işlerdir. Her görevde yapılacak çok sayıda adım vardır ve dönüştürmek prosesin sadece bir adımıdır.

Yani dönüştürme hızı tek başına yeterli değildir. Genel olarak maksimum verimlilik için, OCR programının diğer karakteristiklerini ve yeteneklerini kontrol edin: doğruluk ve sayfa tasarımı koruma kalitesi, sonucun düzenlenebilmesi ve yazım kontrolü yetenekleri, belirli görevler için geliştirilen çeşitli araçlar ve arayüzün ne kadar kolay olduğudur.

Devamı…

Yorum yapın

teakolik hamza şamlıoğlu blog logo

Wordpress altyapısını kullandığımız bu sistem, Sunucu Çözümleri firmasında yüksek performans sağlayan özel sunucularda barındırılmaktadır. Görüntülemek için en iyi Chrome tarayıcı, 1920x1080 çözünürlük ve Full HD Android telefonlarda çalışır. Ayrıca Sitedeki içeriği istediğiniz gibi çarpabilirsiniz. :)