- Große Auswahl an OCR: lokal (PowerToys), Desktop (Acrobat/ABBYY/UPDF), Online (Sejda/Docs) und Unternehmen (SharePoint).
- Wichtige Kompatibilität: Bild- und Hybrid-PDFs, über 150 Sprachen und Größen-/Auflösungsbeschränkungen in Umgebungen Microsoft 365.
- Produktivität: Zonenbasierte OCR, Stapelverarbeitung, Export nach Word/Excel und automatische Suche/Indizierung.
- Konfiguration und Genauigkeit: OCR-Sprachpakete in Windows, korrekte Sprachauswahl und Pre-Image-Verbesserung.
Wenn Sie täglich mit gescannten Dokumenten arbeiten, wissen Sie, dass das Extrahieren von Text aus einem PDF Es kann ein kleines Problem sein; mit OCR-Technologie in Windows 11, wird dieser Prozess schnell und zuverlässig. In diesem Handbuch gehen wir ausführlich auf die besten Optionen zum Erkennen von Text in PDFs und Bildern ein., sowohl mit lokalen Tools als auch mit Online-Diensten und Geschäftslösungen.
Wir hören nicht bei den Grundlagen auf: Sie werden alles sehen, von nativen Dienstprogrammen wie PowerToys Text Extractor bis hin zu Editoren wie Adobe Acrobat, kostenlose Alternativen wie Google Text & Tabellen oder Sejda und Unternehmensplattformen wie SharePoint mit Indizierung und Compliance. Darüber hinaus umfassen wir unterstützte Formate, Sprachen, Größenbeschränkungen, wichtige Schritte und Tricks Der Konfiguration damit Sie die größtmögliche Präzision erreichen.
Was ist OCR und warum könnte es für Sie in Windows 11 wichtig sein?
Die optische Zeichenerkennung wandelt Bilder oder gescannte PDFs in bearbeitbaren, durchsuchbaren Text um, sodass Sie Inhalte kopieren, bearbeiten und analysieren können, als hätten Sie sie selbst eingegeben. OCR-Engines analysieren Form, Größe und Verteilung von Zeichen und wandeln sie in maschinenlesbaren Text um., bereit zum Bearbeiten oder Indizieren.
Im täglichen Gebrauch ist es ideal für die Archivierung von Dokumenten im durchsuchbaren PDF-Format, Dokumente auf Ihrem Handy lesen, digitalisieren Sie Bücher oder stellen Sie Informationen in alten Aufzeichnungen wieder her. Obwohl die Genauigkeit erheblich zugenommen hat, spielt die Qualität des Bildes und ob es handschriftlich oder gedruckt ist, immer noch eine Rolle., daher ist es ratsam, das Ergebnis nach der Erkennung zu überprüfen.
Enterprise OCR in Microsoft 365: SharePoint, OneDrive und mehr
In SharePoint werden neben bildbasierten PDFs auch Hybrid-PDFs (eine Mischung aus Text und Bildern) unterstützt, mit automatischer Verarbeitung beim Hochladen. Es erkennt auch in Office-Dateien (docx, pptx, xlsx) eingebettete Bilder und wendet eine Deduplizierung an, um zu vermeiden, dass dasselbe Bild mehrmals verarbeitet wird., wodurch Kosten und Leistung optimiert werden.
Unterstützte Dateitypen nach Speicherort
Die Formatkompatibilität variiert je nach Verbindungspunkt (SharePoint/OneDrive, Exchange, Teams/Windows/macOS). Wir fassen das Wesentliche zusammen und bewahren dabei die technischen Details:
| Verbindungspunkt | Unterstützte Dateitypen |
|---|---|
| SharePoint und OneDrive | .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, y .pdf (escaneados e híbridos). Zusätzlich werden eingebettete Bilder extrahiert docx, pptx, xlsx. |
| Austausch | .jpeg, .jpg, .png, .bmp, .tiff y PDF (gescannt und hybrid). Es verarbeitet auch Bilder innerhalb docx, pptx, xlsx, rar, tar, zip, 7z. |
| Teams, Windows und macOS | .jpeg, .jpg, .png, .bmp, .tiff y PDF (nur Bild). |
Was die Sprachen betrifft, unterstützt der Dienst mehr als 150 Sprachen und Der Umfang umfasst mehrere Microsoft 365-Lösungen und ist mit den Compliance-Optionen von Microsoft Purview verknüpft. für Governance und Datenschutz.
Wichtige Einschränkungen und Anforderungen
Bitte beachten Sie, dass SharePoint OCR bei der Bildverarbeitung gewisse technische Einschränkungen mit sich bringt. Die Dateigröße muss kleiner als 50 MB sein, die Mindestauflösung beträgt 50 x 50 Pixel und die Höchstauflösung 16.000 x 16.000; außerdem werden nur Bilder verarbeitet, die nach der Aktivierung von OCR hochgeladen wurden.
Lokale OCR in Windows 11: PowerToys Text Extractor
Wenn Sie Text aus einem beliebigen Teil des Bildschirms im Handumdrehen extrahieren möchten (einschließlich Videos, Apps oder Spiele), PowerToys Textextraktor es ist ein Wundermittel. Mit der Tastenkombination 'Win + Umschalt + T' erscheint eine Einblendung zur Auswahl eines Bereichs; beim Loslassen wird der erkannte Text in die Zwischenablage.
Die Erfassung wird nach Abschluss automatisch beendet und kann jederzeit mit „Esc“ abgebrochen werden. Um die Auswahl zu verfeinern, halten Sie die Umschalttaste gedrückt, um den Rahmen zu verschieben, ohne seine Größe zu ändern.und lassen Sie die Umschalttaste los, um die Größe erneut anzupassen.
In den Einstellungen können Sie die Aktivierungsverknüpfung und die bevorzugte Sprache anpassen. Das Modul erkennt nur Sprachen, für die Sie das OCR-Paket unter Windows installiert haben., daher ist es ratsam, dies vorher zu überprüfen.
OCR-Sprachpakete prüfen und installieren
So listen Sie die auf Ihrem System verfügbaren OCR-Sprachen unter Windows auf Powershellkönnen Sie Folgendes ausführen: So bestätigen Sie, welche Erkenner in PowerToys einsatzbereit sind..
Liste der verfügbaren Erkenner: ::AvailableRecognizerLanguages
Wenn Sie lieber alle installierbaren OCR-Funktionen ausprobieren möchten: Dieser Filter zeigt Ihnen die Sprach-OCR-Pakete und deren Status (installiert oder nicht).
Installierbare OCR-Pakete anzeigen: Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }
So installieren Sie beispielsweise die Erkennung „en-US“: Sie filtern zuerst die Kapazität und fügen sie dann online hinzu, alles über PowerShell mit Administratorberechtigungen..
Installieren Sie „en-US“ (PowerShell): $Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
$Capability | Add-WindowsCapability -Online
Und wenn Sie das besagte Paket entfernen müssen: Dasselbe Muster der Funktionsauswahl und -entfernung mit Remove-WindowsCapability.
„en-US“ entfernen (PowerShell): $Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
$Capability | Remove-WindowsCapability -Online
Typische Fehlerbehebung
Wenn PowerToys Ihnen mitteilt, dass keine möglichen OCR-Sprachen installiert sind, überprüfen Sie, ob das Paket tatsächlich installiert ist. Auf einigen Computern, bei denen das Systemlaufwerk nicht „C:“ ist, behebt das Kopieren des Ordners „X:/Windows/OCR“ nach „C:/Windows/OCR“ das Problem..
PDFgear: Bereichsbasierte OCR und schnelle Bearbeitung
PDFgear ist ein umfassender kostenloser Editor, der auch zonenbasiertes OCR umfasst, perfekt zum Erfassen nur des Teils, der Sie interessiert. Öffnen Sie das PDF, aktivieren Sie im Hauptreiter „OCR“ und wählen Sie mit der Maus den zu erkennenden Bereich aus., in die Zwischenablage kopieren oder als TXT speichern können.
Über OCR hinaus können Sie mit PDFgear Text bearbeiten, Bilder hinzufügen, Anmerkungen hinzufügen, hervorheben, signieren und Dokumente sichern. Für die Online-Version ist keine Registrierung erforderlich und es werden keine Wasserzeichen auferlegt. Außerdem ist das Desktop-Programm für Windows 11 leicht und stabil., ideal für alltägliche Aufgaben.
Google Docs: Gescannte PDFs kostenlos konvertieren
Mit einem Konto von Google, laden Sie einfach das PDF in Drive hoch, klicken Sie mit der rechten Maustaste und öffnen Sie es mit „Google Docs“. Der Dienst führt die OCR automatisch aus und erstellt mit dem extrahierten Text ein bearbeitbares Dokument., die Sie dann unter herunterladen können Word, PDF oder einfacher Text.
Da es sich um eine Cloud-basierte Konvertierung handelt, bleibt das Layout nicht immer erhalten, insbesondere wenn das PDF komplexe Tabellen oder viele Bilder enthielt. Dennoch ist es eine der effektivsten und zugänglichsten Strategien, um Inhalte schnell zu extrahieren und zu bearbeiten..
Für .NET-Entwickler: IronOCR
Wenn Sie OCR in Ihre Anwendungen integrieren müssen, ist IronOCR eine leistungsstarke C#-Bibliothek. Bietet hohe Genauigkeit, Geschwindigkeit und Echtzeit-Unterstützung für Scannen, Indizieren und Erkennen, mit Kompatibilität in anspruchsvollen Sektoren.
Minimales Anwendungsbeispiel in C# mit seiner High-Level-API: Mit diesem Muster können Sie ein oder mehrere Bilder lesen und den erkannten Text im Speicher abrufen..
Code-Ausschnitt zur Verwendung:
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddImage("Image.jpg");
// puedes añadir más imágenes si lo necesitas
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Die Lizenzierung von IronOCR ist für die Entwicklung kostenlos und es gibt eine Testversion. Kommerzielle Lizenzen sind nach Anzahl der Entwickler gestaffelt und es gibt ein gemeinsames Paket mehrerer Produkte mit Ersparnis gegenüber Einzelkauf.
Praktischer Vergleich und Tipps zur Werkzeugauswahl
Wenn Sie Wert auf maximale Wiedergabetreue und erweiterte PDF-Bearbeitung legen, sind Acrobat Pro DC und ABBYY FineReader eine sichere Wahl. Das erste zeichnet sich durch sein PDF-Ökosystem aus und das zweite durch seine Präzision und Bildsteuerung., beide mit umfangreichen Stapelverarbeitungsoptionen und Sprachen.
Für gemischte Arbeitsabläufe und ein gutes Verhältnis zwischen Preis und Funktionen sind UPDF und EaseUS PDF Editor sehr kompetent. UPDF bietet Cloud und Automatisierung, während EaseUS OCR und umfassende Bearbeitung mit einer sanften Lernkurve bietet. das auch Einsteiger überzeugt.
Wenn Sie nichts ausgeben möchten, decken FreeOCR, Google Docs und PDFgear eine große Bandbreite ab. FreeOCR konvertiert problemlos, Docs übernimmt schnelle Cloud-Konvertierungen und PDFgear fügt bereichsbasierte OCR und markupfreie Bearbeitung hinzu., alles ohne zu bezahlen.
In einer Unternehmensumgebung reduziert SharePoint/OneDrive mit integrierter OCR die Reibung und ermöglicht Suchfunktionen und Compliance. Außerdem verfügen Sie mit dem PowerToys Text Extractor unter Windows 11 über ein „Schweizer Taschenmesser“, um im Handumdrehen Text vom Bildschirm zu erfassen., etwas, das süchtig macht, wenn man es probiert.
Tipps zur Verbesserung der OCR-Genauigkeit
Stellen Sie sicher, dass Ihre Bilder die Grenzwerte nicht überschreiten und eine angemessene Auflösung beibehalten, um verschwommene oder schattige Fotos zu vermeiden. Wählen Sie immer die richtige Sprache für das Dokument aus und verbessern Sie, wenn möglich, den Kontrast und richten Sie die Seite aus, bevor Sie erkennen um die OCR-Engine zu unterstützen.
Verwenden Sie für PDFs mit Tabellen Tools, die Tabelleneditoren (ABBYY/Readiris) oder eine Ausgabe nach Excel bieten. Wenn Sie nur ein Fragment benötigen, spart die zonale OCR von PDFgear oder die manuelle Auswahl in einigen Editoren später Zeit und Aufräumarbeiten. in den Ergebnissen.
Wenn das Dokument handschriftlich verfasst ist, testen Sie es mit Engines, die dies ausdrücklich anzeigen, und gehen Sie von einer gründlichen anschließenden Überprüfung aus. Aktivieren Sie für große Stapel die Verarbeitungswarteschlangen und prüfen Sie die Optionen für Multithreading oder Cloud-Verarbeitung, wenn Ihr Hardware ist begrenzt.
Wenn bei den Sprachen in PowerToys etwas schiefgeht, überprüfen Sie die OCR-Pakete und installieren Sie sie von PowerShell aus neu. Denken Sie daran, dass ohne das installierte Sprachpaket keine Erkennung erfolgt, auch wenn der Rest des Systems in dieser Sprache ist..
Denken Sie abschließend an den Datenschutz: Bei vertraulichen Dokumenten sollten Sie lokalen oder Unternehmenslösungen (SharePoint) den Vorzug vor Onlinediensten geben. Überprüfen Sie immer die Datenrichtlinien und arbeiten Sie, wenn möglich, lokal oder in kontrollierten Umgebungen mit Dateien. um die Vorschriften einzuhalten.
Mit all diesen Optionen, von der in Microsoft 365 integrierten OCR bis hin zu kostenlosen Dienstprogrammen und Entwicklerbibliotheken, steht Ihnen das gesamte Arsenal zur Verfügung, um PDFs und Bilder in Windows 11 in nützlichen Text umzuwandeln; Wählen Sie entsprechend Ihrem Szenario (schnelle Konvertierung, vollständige Bearbeitung, Volumen oder Erfüllung) und Sie werden es gleich beim ersten Mal richtig machen..
Leidenschaftlicher Autor über die Welt der Bytes und der Technologie im Allgemeinen. Ich liebe es, mein Wissen durch Schreiben zu teilen, und genau das werde ich in diesem Blog tun und Ihnen die interessantesten Dinge über Gadgets, Software, Hardware, technologische Trends und mehr zeigen. Mein Ziel ist es, Ihnen dabei zu helfen, sich auf einfache und unterhaltsame Weise in der digitalen Welt zurechtzufinden.