Tekst uit PDF-bestanden extraheren met OCR in Windows 11: een complete handleiding

Laatste update: 10/10/2025
Auteur: Isaac
  • Breed scala aan OCR: lokaal (PowerToys), desktop (Acrobat/ABBYY/UPDF), online (Sejda/Docs) en zakelijk (SharePoint).
  • Belangrijkste compatibiliteit: afbeeldingen en hybride PDF's, meer dan 150 talen en beperkingen voor de grootte/resolutie in omgevingen Microsoft 365.
  • Productiviteit: OCR op basis van zones, batchverwerking, export naar Word/Excel en automatisch zoeken/indexeren.
  • Configuratie en nauwkeurigheid: OCR-taalpakketten in Windows, correcte taalselectie en verbetering van de afbeelding vooraf.

OCR in Windows 11

Als u dagelijks met gescande documenten werkt, weet u dat het extraheren van tekst uit een PDF Het kan een kleine hoofdpijn zijn; met OCR-technologie in Windows 11, wordt dit proces snel en betrouwbaar. In deze gids bespreken we uitgebreid de beste opties voor het herkennen van tekst in PDF's en afbeeldingen., zowel met lokale tools als met online diensten en zakelijke oplossingen.

We beperken ons niet tot de basis: u ziet alles van native hulpprogramma's zoals PowerToys Text Extractor tot editors zoals Adobe Acrobat, gratis alternatieven zoals Google Docs of Sejda en bedrijfsplatformen zoals SharePoint met indexering en naleving. Bovendien nemen we ondersteunde formaten, talen, groottebeperkingen, belangrijke stappen en Tricks Van configuratie zodat u de grootst mogelijke precisie bereikt.

Wat is OCR en waarom is het belangrijk voor Windows 11?

Met optische tekenherkenning worden afbeeldingen of gescande PDF's omgezet in bewerkbare, doorzoekbare tekst, zodat u de inhoud kunt kopiëren, bewerken en analyseren alsof u de tekst zelf hebt getypt. OCR-engines analyseren de vorm, grootte en verdeling van tekens en zetten deze om in machineleesbare tekst., klaar om te bewerken of te indexeren.

In het dagelijks gebruik is het ideaal voor het archiveren van documenten in doorzoekbaar PDF-formaat, documenten lezen op je mobiel, boeken digitaliseren of informatie uit oude archieven terughalen. Hoewel de nauwkeurigheid aanzienlijk is verbeterd, is de kwaliteit van de afbeelding en het feit of deze handgeschreven of gedrukt is, nog steeds van belang.Het is daarom raadzaam om het resultaat na herkenning te beoordelen.

Enterprise OCR in Microsoft 365: SharePoint, OneDrive en meer

In SharePoint is er naast PDF's op basis van afbeeldingen ook ondersteuning voor hybride PDF's (een mix van tekst en afbeeldingen), met automatische verwerking bij het uploaden. Het herkent ook afbeeldingen die zijn ingesloten in Office-bestanden (docx, pptx, xlsx) en past deduplicatie toe om te voorkomen dat dezelfde afbeelding meerdere keren wordt verwerkt., kosten en prestaties optimaliseren.

Ondersteunde bestandstypen per locatie

De compatibiliteit van het formaat varieert per verbindingspunt (SharePoint/OneDrive, Exchange, Teams/Windows/macOS). We vatten de basisprincipes samen, maar houden de technische details in het achterhoofd:

Verbindingspunt Ondersteunde bestandstypen
SharePoint en OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, y .pdf (escaneados e híbridos)Bovendien worden ingebedde afbeeldingen geëxtraheerd docx, pptx, xlsx.
uitwisseling .jpeg, .jpg, .png, .bmp, .tiff y PDF (gescand en hybride). Het verwerkt ook afbeeldingen binnen docx, pptx, xlsx, rar, tar, zip, 7z.
Teams, Windows en macOS .jpeg, .jpg, .png, .bmp, .tiff y PDF (alleen afbeelding).
  De juiste manier om Bluetooth-hoofdtelefoons te koppelen aan Mac

Wat talen betreft, ondersteunt de service meer dan 150 talen, en Het toepassingsgebied omvat verschillende Microsoft 365-oplossingen, gekoppeld aan Microsoft Purview-nalevingsopties. voor governance en gegevensbescherming.

Belangrijke beperkingen en vereisten

Houd er rekening mee dat SharePoint OCR bepaalde technische beperkingen oplegt bij het verwerken van afbeeldingen. De bestandsgrootte moet kleiner zijn dan 50 MB, de minimale resolutie is 50 x 50 pixels en de maximale resolutie is 16.000 x 16.000; bovendien worden alleen afbeeldingen verwerkt die zijn geüpload nadat OCR is geactiveerd.

Lokale OCR in Windows 11: PowerToys-tekstextractor

Als u tekst uit een willekeurig deel van het scherm wilt halen (inclusief video's, apps of spelletjes), PowerToys Tekst Extractor het is een wondermiddel. Met de sneltoets 'Win + Shift + T' verschijnt een overlay om een ​​gebied te selecteren; wanneer u deze loslaat, wordt de herkende tekst naar de klembord.

Zodra de opname voltooid is, wordt deze automatisch gesloten. U kunt deze op elk gewenst moment met 'Esc' annuleren. Om de selectie te verfijnen, houdt u de Shift-toets ingedrukt om het kader te verplaatsen zonder de grootte ervan te wijzigen.en laat Shift los om de grootte opnieuw aan te passen.

In de instellingen kunt u de activeringssnelkoppeling en de voorkeurstaal aanpassen. De module herkent alleen talen waarvoor u het OCR-pakket op Windows hebt geïnstalleerd., dus het is raadzaam om dit vooraf te controleren.

Controleer en installeer OCR-taalpakketten

Om een ​​lijst te maken van de OCR-talen die beschikbaar zijn op uw systeem vanuit Windows PowerShell, kunt u het volgende uitvoeren: Zo weet u welke herkenners klaar zijn voor gebruik in PowerToys..

Lijst met beschikbare herkenners: ::AvailableRecognizerLanguages

Als u liever alle installeerbare OCR-mogelijkheden wilt bekijken: Met dit filter ziet u de OCR-pakketten voor talen en hun status (geïnstalleerd of niet).

Bekijk installeerbare OCR-pakketten: Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }

Om bijvoorbeeld de 'en-US'-herkenning te installeren: Eerst filtert u de capaciteit en vervolgens voegt u deze online toe, allemaal via PowerShell met beheerdersrechten..

Installeer 'en-US' (PowerShell): $Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
$Capability | Add-WindowsCapability -Online

En als u het pakket moet verwijderen: Hetzelfde patroon van capaciteitsselectie en verwijdering met Remove-WindowsCapability.

'en-US' verwijderen (PowerShell): $Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
$Capability | Remove-WindowsCapability -Online

Typische probleemoplossing

Als PowerToys de melding 'Geen mogelijke OCR-talen geïnstalleerd' geeft, controleer dan of het pakket daadwerkelijk is geïnstalleerd. Op sommige computers waarvan de systeemschijf niet 'C:' is, wordt het probleem opgelost door de map 'X:/Windows/OCR' naar 'C:/Windows/OCR' te kopiëren..

  De camera kan de verbinding niet tot stand brengen

PDFgear: gebiedsgebaseerde OCR en snelle bewerking

PDFgear is een uitgebreide gratis editor die ook zone-gebaseerde OCR bevat, ideaal om alleen het deel vast te leggen waarin u geïnteresseerd bent. Open het PDF-bestand, activeer 'OCR' in het hoofdtabblad en selecteer met de muis het gebied dat u wilt herkennen., en kan het naar het klembord kopiëren of opslaan als TXT.

Naast OCR kunt u met PDFgear tekst bewerken, afbeeldingen toevoegen, aantekeningen maken, markeren, ondertekenen en documenten beveiligen. Voor de onlineversie is geen registratie vereist en worden er geen watermerken geplaatst. Bovendien is het desktopprogramma voor Windows 11 licht en stabiel., ideaal voor dagelijkse taken.

Google Docs: converteer gratis een gescande PDF

Met een account van Google, upload de PDF naar Drive, klik met de rechtermuisknop en open het met 'Google Docs'. De service voert de OCR automatisch uit en maakt een bewerkbaar document met de geëxtraheerde tekst., die u vervolgens kunt downloaden op Woord, PDF of platte tekst.

Omdat dit een cloudgebaseerde conversie is, blijft de lay-out niet altijd behouden, vooral niet als de PDF complexe tabellen of veel afbeeldingen bevat. Toch is het een van de meest effectieve en toegankelijke strategieën om snel inhoud te extraheren en te bewerken..

Voor .NET-ontwikkelaars: IronOCR

Als u OCR in uw applicaties moet integreren, is IronOCR een krachtige C#-bibliotheek. Biedt hoge nauwkeurigheid, snelheid en realtime-ondersteuning voor scannen, indexeren en herkenning, met compatibiliteit in veeleisende sectoren.

Voorbeeld van minimaal gebruik in C# met zijn geavanceerde API: Met dit patroon kunt u één of meerdere afbeeldingen lezen en de herkende tekst in het geheugen opslaan..

Codefragment voor gebruik:

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
  Input.AddImage("Image.jpg");
  // puedes añadir más imágenes si lo necesitas
  var Result = Ocr.Read(Input);
  Console.WriteLine(Result.Text);
}

Wat de licentie betreft, is IronOCR gratis te ontwikkelen en heeft het een proefversie; Commerciële licenties zijn gelaagd op basis van het aantal ontwikkelaars en er is een gezamenlijk pakket van verschillende producten met besparingen ten opzichte van individuele aankopen.

Praktische vergelijking en hoe u uw gereedschap kiest

Bent u op zoek naar maximale getrouwheid en geavanceerde PDF-bewerking, dan zijn Acrobat Pro DC en ABBYY FineReader veilige keuzes. De eerste valt op door het PDF-ecosysteem en de tweede door de precisie en de beeldinstellingen., beide met uitgebreide batchverwerkingsopties en talen.

Voor gemengde workflows en een goede balans tussen prijs en functionaliteit zijn UPDF en EaseUS PDF Editor zeer geschikt. UPDF biedt cloud en automatisering, terwijl EaseUS OCR en uitgebreide bewerking biedt met een soepele leercurve. die beginnende gebruikers overtuigt.

  Hoe u het Windows 11-installatieprogramma kunt gebruiken om een ​​reeds geïnstalleerd systeem te herstellen

Als u helemaal niets wilt uitgeven, zijn FreeOCR, Google Docs en PDFgear ook een goede optie. FreeOCR converteert zonder gedoe, Docs verwerkt snelle cloudconversies en PDFgear biedt gebiedsgebaseerde OCR en bewerking zonder markeringen., allemaal zonder te betalen.

In een zakelijke omgeving zorgt SharePoint/OneDrive met geïntegreerde OCR voor minder frictie en voegt zoek- en nalevingsfuncties toe. En met PowerToys Text Extractor op Windows 11 beschikt u over een 'Zwitsers zakmes' waarmee u in een handomdraai tekst van het scherm kunt halen., iets dat verslavend werkt als je het probeert.

Tips om de OCR-nauwkeurigheid te verbeteren

Zorg ervoor dat uw afbeeldingen de limieten niet overschrijden en dat u een geschikte resolutie hanteert. Vermijd wazige of schaduwrijke foto's. Selecteer altijd de juiste taal voor het document en verbeter indien mogelijk het contrast en zet de pagina recht voordat u de tekst herkent. om de OCR-engine te helpen.

Voor PDF's met tabellen gebruikt u hulpmiddelen die tabelbewerkingen bieden (ABBYY/Readiris) of voert u de gegevens uit naar Excel. Als u slechts een fragment nodig hebt, bespaart de zonale OCR van PDFgear of de handmatige selectie in sommige editors u tijd en hoeft u later niets meer op te ruimen. bij de resultaten.

Wanneer het document handgeschreven is, test het dan met zoekmachines die dit expliciet aangeven en ga ervan uit dat het document vervolgens grondig wordt gecontroleerd. Schakel voor grote batches verwerkingswachtrijen in en bekijk de opties voor multithreading of cloudverwerking als u dat wilt. hardware is gelimiteerd.

Als er iets misgaat met de talen in PowerToys, controleer dan de OCR-pakketten en installeer ze opnieuw via PowerShell. Houd er rekening mee dat er geen herkenning plaatsvindt als het taalpakket niet is geïnstalleerd, ook al is de rest van het systeem in die taal..

Denk ten slotte aan uw privacy: geef bij vertrouwelijke documenten voorrang aan lokale of bedrijfsoplossingen (SharePoint) boven onlineservices. Controleer altijd het gegevensbeleid en werk indien mogelijk met bestanden lokaal of in gecontroleerde omgevingen. om te voldoen aan de regelgeving.

Met al deze opties, van de ingebouwde OCR in Microsoft 365 tot gratis hulpprogramma's en ontwikkelaarsbibliotheken, hebt u de volledige beschikking over de middelen om PDF's en afbeeldingen om te zetten in bruikbare tekst in Windows 11; Kies op basis van uw scenario (snelle conversie, volledige bewerking, volume of uitvoering) en u zult het in één keer goed doen..

Hoe u een afbeelding naar tekst (OCR) in Windows 11 kunt converteren zonder iets te installeren
Gerelateerd artikel:
Hoe u een afbeelding naar tekst (OCR) in Windows 11 kunt converteren zonder iets te installeren