Windows, Python ve .NET için Tesseract OCR Eğitimi

Son Güncelleme: 10/10/2025
Yazar: isaac
  • Verimli tarama için çoklu dil desteği ve çıktı formatları.
  • Kolay entegrasyon Python (Pytesseract) ve .NET ekosistemi.
  • IronOCR, Tesseract'a ön işleme ve üst düzey API'ler getiriyor.

Tesseract OCR Eğitimi

Karmaşık araçlarla uğraşmadan görüntüleri veya PDF'leri düzenlenebilir metne dönüştürmekle ilgileniyorsanız veya Windows 11'de resimlerden metin çıkarmaİyi haber şu ki bugün Tesseract OCR güçlü, ücretsiz ve oldukça esnek bir çözümdürBu pratik kılavuzda bunun ne olduğunu, nasıl kurulacağını inceliyoruz. Windows, konsoldan nasıl doğrulanacağı ve hem Python (Pytesseract aracılığıyla) hem de .NET ile ve bu ekosistemde yaygın olarak kullanılan bir alternatif olan IronOCR ile nasıl entegre edileceği.

Kurulumun ve düğmeye tıklamanın ötesinde, ortamın nasıl hazırlanacağını, yürütülebilir yolun nereye ekleneceğini, tipik hata ortaya çıkarsa ne yapılacağını göreceksiniz TesseractBulunamadıHatası Python'da ve uygulamalar içerisinde birden fazla dildeki (İspanyolca, İngilizce, Fransızca, Portekizce ve hatta Math gibi paketler) metinlerin nasıl işleneceği. Amacımız, istikrarlı ve üretime hazır bir OCR iş akışına sahip olmanızdır., çizgisinden başlayarak kapsayan komutlar C# dilinde belirli kütüphanelerle kullanıma kadar.

Tesseract OCR nedir?

Tesseract açık kaynaklı bir OCR motorudurApache 2.0 lisansı altında yayınlanmıştır. 80'lerde Hewlett-Packard'da doğmuştur ve şu anda topluluk tarafından güçlü bir şekilde desteklenmektedir. GoogleGörevi açıktır: Bir görüntüdeki (TIFF, PNG, JPEG vb.) pikselleri analiz ederek karakterleri, kelimeleri ve satırları tespit etmek ve içeriği makine tarafından okunabilir metin olarak çıktısını almak.

Komut satırından özgürce kullanılabilir, otomasyonu ve betik oluşturmayı kolaylaştırır. Ayrıca çok sayıda dili destekler ve yeni yazı tipleri veya alfabeler için eğitilebilir.Bu nedenle belge dijitalleştirme, fatura işleme, arşivleme veya erişilebilirlik alanlarında yaygın olarak kullanılmaktadır.

Tesseract'ı Windows'a indirin ve yükleyin

Windows'ta en doğrudan yol önceden derlenmiş bir yükleyici kullanmaktır. Ana kaynak GitHub'daki resmi depodur (tesseract-ocr/tesseract) adresinde imzalı ikili dosyaları ve güncel sürümleri bulabilirsiniz.

Mevcut yükleyiciler arasında, şu tür paketleri görmek yaygındır: tesseract-ocr-w64-kurulum-5.3.0.20221222.exe (64 bit). İndirin ve çalıştırınSihirbaz, kurulum dili ve dil paketlerini seçme dahil olmak üzere kurulumda adım adım size rehberlik edecektir.

Yükleyici dili ve dil verileri

Kurulum sırasında sihirbaz sizden dilinizi seçmenizi isteyecektir. Varsayılan dil genellikle İngilizce'dir, ancak ek paketler ekleyebilirsiniz İspanyolca, Fransızca veya ihtiyaç duymanız halinde Matematik gibi özel modüller gibi. Bu seçim, hangi modellerin veri dizinine (tessdata) kopyalanacağını belirtir.

Lisans, kullanıcılar ve bileşenler

Tesseract şu şekilde dağıtılır: Apache Lisansı 2.0, böylece esnek bir şekilde kullanabilir ve yeniden dağıtabilirsiniz. Yükleyici sizden lisansı kabul etmenizi, tek bir kullanıcı için mi yoksa tüm kullanıcılar için mi kurulum yapacağınızı seçmenizi ve bileşenleri seçmenizi isteyecektir. Varsayılan olarak, aşağıdaki gibi yararlı öğeler seçilidir: ScrollView, eğitim araçları, kısayollar ve dil verileri.

Kurulum yolu ve Başlat menüsü klasörü

Sihirbaz hedef klasörü seçmenize olanak tanıyacaktır. Bu yolu yazın, ortam değişkeni için buna ihtiyacınız olacak. Ardından, kısayolların oluşturulacağı Başlat menüsü klasörüne bir ad verebilirsiniz. İşlem tamamlandığında Yükle'ye tıklayın ve kapatmak için Son'a tıklayın.

  Uygulamaların Android Telefonda Mobil Bilgiyi Kullanmasını Durdurmanın Doğru Yolu

Windows'ta ortam değişkenine Tesseract ekleyin

Tesseract komutunu herhangi bir pencereden çalıştırmak için cmd o PowerShell, uygundur kurulum klasörünü sistem yoluna ekleyinBu şekilde Windows, kesin yollar olmadan çalıştırılabilir dosyanın nerede bulunacağını bilecektir.

Başlat menüsüne gidin ve "ortam değişkenleri" veya "gelişmiş sistem ayarları" yazın. Sistem Özellikleri penceresinde Gelişmiş sekmesine gidin ve tıklayın. Ortam Değişkenleri.

Sistem Değişkenleri bloğunda şunu seçin: YolDüzenle'ye ve ardından Yeni'ye tıklayın. Tesseract'ın kurulduğu yolu yapıştırın (örneğin, C:\Program Files\Tesseract-OCR) ve tüm pencerelerde Tamam'a tıklayarak onaylayın.

Kurulumu konsoldan kontrol edin

Cmd veya PowerShell'i açın ve şunu çalıştırın: teseraktHer şey yolundaysa kullanım mesajını, yüklü sürümü ve yardımcı programın desteklediği seçeneklerin listesini göreceksiniz. Bu test, Yolun doğru olduğunu onaylar ve ikili cevap verir.

Tesseract'ı macOS'a yükleyin

macOS'ta, yardımcı programı paket yöneticilerinden yükleyebilirsiniz. Homebrew ile çalıştırın brew install tesseractMacPorts kullanıyorsanız, eşdeğer komut şudur: sudo port install tesseractHer iki rota da yürütülebilir dosyayı indirin ve kaydedin onu kullanmak için terminal.

Tesseract ve Pytesseract arasındaki farklar

Kavramları ayırmak kolaydır: Tesseract, OCR motorudur, tanıma işlemini yapan ikili. Pytesseract, Python için bir sarmalayıcıdır Bu motoru çağırır ve betiklerinizin çıktısını biçimlendirir. Python ile çalışıyorsanız, sisteminizde Tesseract'ın ve ortamınızda Pytesseract'ın yüklü olması gerekir.

Python ile temel kullanım ve TesseractNotFoundError'a çözüm

Python'a başladığınızda en sık yapılan hatalardan biri şudur: TesseractBulunamadıHatasıBu durum, Pytesseract'ın motor çalıştırılabilir dosyasını bulamaması durumunda meydana gelir; bunun nedeni genellikle dosyanın Yol'da olmaması veya yolun Yol'da ayarlanmamış olmasıdır. senaryo.

Windows'ta bunu önlemek için, kodunuzda yürütülebilir dosyayı işaret ederek yolu açıkça ayarlayabilirsiniz. Pytesseract ile minimal örnek:

import pytesseract
from PIL import Image

# Ajusta esta ruta a tu instalación real en Windows
pytesseract.pytesseract.tesseract_cmd = r'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'

texto = pytesseract.image_to_string(Image.open('mi_imagen.png'), lang='spa')
print(texto)

Ayrıca, ihtiyacınız olan dil paketinin mevcut olduğundan emin olun (örneğin, spa (İspanyolca için). Değilse, traineddata'yı doğru tessdata dizinine yükleyin. Bu, olayların çoğunu çözer. Python'a başladığınızda.

Çok Dilli OCR: Kavramlar ve Uygulama

Çok dilli dokümantasyona sahip projelerde (faturalar, sözleşmeler veya tarihsel arşivler), Tesseract dilleri birleştirmenize olanak tanır Heterojen metinler bir arada bulunduğunda algılamayı iyileştirmek için, tessdata içinde uygun .traineddata dosyalarının bulunması önemlidir.

İçerik örneğin İngilizce, İspanyolca ve Fransızcayı karıştırdığında, motora bunu yapmasını söyleyebilirsiniz. birden fazla alfabeyi ve deseni aynı anda düşününBu durum .NET'teki IronOCR gibi üst düzey kütüphaneler için de geçerlidir.

Visual Studio'da bir proje oluşturun ve Tesseract.NET'i kullanın

Microsoft ortamında çalışıyorsanız, Visual Studio'yu açın ve bir Konsol Uygulaması (veya tercih ettiğiniz herhangi bir şablon). Projenize bir isim verin, .NET sürümünü seçin ve çözümünüz oluşturulduktan sonra, paketleri NuGet ile yönetmeye hazırsınız.

  iPhone ve Android'de WhatsApp Sohbetlerini Arşivleme Yöntemleri

Tesseract'ı bilgisayarınıza kurun (açıkladığımız gibi) ve proje içerisinde paketi ekleyin Tesseract veya Tesseract.NET NuGet Paket Yöneticisi'nden. Bu, C#'tan gelen motorla etkileşim kurmak için sarmalayıcıyı ekler.

Birden fazla dilde bir görseli okumaya yönelik bir örnek şöyle görünebilir: tessdata'ya giden yolu ve dil listesini gösterir:

using System;
using System.Drawing;
using Tesseract;

class Program
{
    static void Main()
    {
        // Ruta a los archivos de datos de idioma (.traineddata)
        string tessDataPath = @"./tessdata";
        // Imagen a procesar
        string imagePath = @"ruta_a_tu_imagen.png";

        using (var img = Pix.LoadFromFile(imagePath))
        using (var engine = new TesseractEngine(tessDataPath, "eng+spa+fra", EngineMode.Default))
        using (var page = engine.Process(img))
        {
            string text = page.GetText();
            Console.WriteLine("Recognized Text:");
            Console.WriteLine(text);
        }
    }
}

Tessdata klasöründe aşağıdakilerin bulunduğundan emin olun: her dil için .traineddata beyan ettiğiniz. Yaygın bir test paketi eng+spa+fra'dır, ancak ihtiyaçlarınıza uyacak şekilde genişletebilirsiniz.

IronOCR: Tesseract tabanlı .NET kitaplığı

.NET ekosisteminde üretkenliğe yönelik bir seçenek vardır. DemirOCRTesseract'a dayanan ancak üst düzey bir API, kapsamlı dokümantasyon ve ön işleme yardımcı programları sunan . Visual Studio'daki NuGet'ten paket bulucu kullanılarak yüklenir.

Bir resmin metnini okumak için temel kullanımı çok doğrudandır. Basit bir örnek:

using IronOcr;

var ocr = new IronTesseract();
string texto = ocr.Read(@"test-files/redacted-employmentapp.png").Text;
Console.WriteLine(texto);

Giriş üzerinde daha fazla kontrole sahip olmayı tercih ederseniz (birden fazla görüntü, ayarlamalar, vb.), bir OcrInput oluşturabilir ve bunu motora geçirebilirsiniz. Desen kullanımıyla örnek:

using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    Input.AddImage("test-files/redacted-employmentapp.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

Önemli bir avantaj şudur ki; IronOCR 120'den fazla dili destekler, otomatik algılamayı entegre eder ve pratikte zor belgelerde doğruluğu artıran görüntü temizleme, gürültü azaltma ve eser düzeltme araçları ekler.

IronOCR'ı NuGet ve dil paketleriyle yükleyin

Çözümünüze eklemek için Visual Studio'yu açın ve Araçlar > NuGet Paket Yöneticisi > Çözüm için Paketleri Yönet'e gidin. “IronOCR”ı arayın ve ana paketi seçinEğer ek dillerle çalışmayı planlıyorsanız, gerekli dil paketlerini de yükleyin.

Çok dilli projelerde, İngilizcenin genellikle varsayılan olarak mevcut olduğunu unutmayın, ancak İspanyolca veya Fransızca için paketlerini eklemelisinizBu, motorda Dil özelliğini ayarlarken size zaman kazandıracaktır.

IronOCR (C#) ile Çoklu Dil Okuma

Aşağıdaki örnek, üç dilin nasıl birleştirileceğini ve bir görüntünün nasıl işleneceğini göstermektedir. Bu, hangi dilin baskın olduğundan emin değilsiniz her belgede:

using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.English + OcrLanguage.Spanish + OcrLanguage.French;

        var inputFile = @"ruta\\a\\tu\\imagen.png";
        using (var input = new OcrInput(inputFile))
        {
            var result = Ocr.Read(input);
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}

Basit API'ye ek olarak, IronOCR şunları içermesiyle öne çıkıyor: görüntü ön işleme (eğikliği giderme, ikilileştirme, kenar temizleme) genellikle taranmış belgelerde veya eşit olmayan ışıklandırmaya sahip fotoğraflarda daha başarılı sonuçlar verir.

IronOCR'nin "saf" Tesseract'a kıyasla avantajları ve değerlendirmeleri

Tesseract ücretsiz ve son derece esnek olsa da IronOCR, .NET'te daha doğrudan deneyim, belgeler, örnekler ve kurumsal düzeyde kullanıma hazır özelliklerle birlikte. Kurumsal kaynaklar, ideal koşullar altında %99,8 civarında algılama doğruluğu, çoklu iş parçacığı desteği ve etkin bakım sağladığını belirtmiştir.

  Konut Windows 10'da bozuk bir tüketici profili nasıl düzeltilir

Ayrıca entegrasyonda daha dost canlısı (sadece kurulum, örnek projeler ve tutarlı API'ler) ve aynı belgede karmaşık ve çok dilli vakalar da dahil olmak üzere 120'den fazla dili destekler. Buna karşılık, IronOCR tescilli ve ücretlidir ve müşteriler için ömür boyu lisanslama ve 7/24 destek seçenekleri sunar.

OCR doğruluğunu artırmak için en iyi uygulamalar

Motor sağlam olsa da sonuçlar büyük ölçüde görüntülerin kalitesine bağlıdır. Yüksek çözünürlükler kullanmaya çalışın, gürültü ve eserlerden kaçınınBelgeyi doğru şekilde hizalayın ve kontrastı artırın. Fotoğraflarla çalışıyorsanız, OCR işlemini gerçekleştirmeden önce aydınlatmaya dikkat edin ve eğriliği düzeltin.

"Saf" Tesseract ile iyi sonuçlar elde etmek için görüntüleri normalleştirmek veya ön filtreler uygulamak gerekebilir. IronOCR gibi araçlar bu ön işlemenin çoğunu otomatikleştirerek yardımcı olur.zorlu senaryolarda temiz metinlerin teslimini kolaylaştıran.

Üretebileceğiniz çıktılar ve biçimler

Düz metne ek olarak, Tesseract şunları üretebilir: seçilebilir metinli HTML/hOCR veya PDF çıktılarıBu, belgelerdeki parçaların indekslenmesine, aranmasına ve vurgulanmasına veya arama yeteneklerinin önemli olduğu dijital arşivleme iş akışlarına entegre edilmesine olanak tanır.

Düz metne ek olarak, Tesseract seçilebilir metin içeren HTML/hOCR çıktısı veya PDF'ler üretebilir ve bu da PDF'yi Word'e dönüştür ve düzenlemeye devam edin.

Özel entegrasyonlarda şunları yapabilirsiniz: sonucu son işlemden geçirin, varlıkları zenginleştirmek, sayıları normalleştirmek ve içeriği hazırlamak için yazım denetimleri veya NLP modelleri uygulayın veritabanları veya analitik araçlar.

Windows'ta Rehberli Kurulum: Sihirbazın Önemli Noktaları

Sihirbazın hızlı bir kontrol listesini istiyorsanız: yükleyici dilini seçin, Apache 2.0 lisansını kabul edin, kurulumun sizin için mi yoksa tüm kullanıcılar için mi olduğuna karar verin ve önerilen bileşenleri etkin bırakın (ScrollView, eğitim araçları, kısayollar ve dil verileri).

Hedef klasörü seçin (bunu Yol'a kopyalamayı unutmayın), varsa Başlat menüsü klasörüne bir ad verin ve Yükle'ye basın. İşiniz bittiğinde konsolda "tesseract" ile doğrulayın Cihazınızda her şeyin doğru şekilde yanıt verdiğinden emin olmak için.

Önceden derlenmiş paketler ve dil seçimiyle kurulum

GitHub'dan indirdiğinizde farklı mimariler için çeşitli yükleyiciler ve derlemeler göreceksiniz. Sisteminiz destekliyorsa 64 bit'i seçin.Sihirbazda belirli dilleri seçebilirsiniz; bu iyi bir fikirdir. kullanacaklarınızı kurun (İspanyolca, Portekizce, Fransızca, Matematik, vb.) sonraki aramalardan kaçınmak için.

Daha sonra diğer dillere genişletmeniz gerekirse, .traineddata dosyasını tessdata klasörüne ekleyebilirsiniz. Modülerlik güçlü noktalardan biridir Motorun farklı alanlara uyum sağlaması.

Düzenleme için PDF'yi Word'e nasıl dönüştürebilirim?
İlgili makale:
Düzenleme için PDF'yi Word'e dönüştürme: çevrimiçi yöntemler, Word ve OCR