- 幅広いOCR:ローカル(PowerToys)、デスクトップ(Acrobat/ABBYY/UPDF)、オンライン(Sejda/Docs)、企業向け(SharePointの).
- 主な互換性: 画像とハイブリッドPDF、150以上の言語、環境におけるサイズ/解像度の制限 Microsoft 365.
- 生産性: ゾーンベースの OCR、バッチ処理、Word/Excel へのエクスポート、自動検索/インデックス作成。
- 設定と精度:OCR言語パック Windows、正しい言語選択と事前画像強化。

スキャンした文書を日常的に扱う人なら、文書からテキストを抽出するのは PDF これはちょっとした頭痛の種になるかもしれないが、OCR技術が Windows 11、このプロセスは高速かつ信頼できるものになります。 このガイドでは、PDF や画像内のテキストを認識するための最適なオプションを詳細に説明します。ローカル ツールとオンライン サービスおよびビジネス ソリューションの両方を活用します。
基本的なものだけでは終わりません。PowerToys Text Extractorのようなネイティブユーティリティから、次のようなエディタまで、あらゆるものを見ることができます。 Adobe Acrobatの、無料の代替品など Googleドキュメント または Sejda、およびインデックス作成とコンプライアンスを備えた SharePoint などの企業プラットフォーム。 さらに、サポートされているフォーマット、言語、サイズ制限、重要な手順などについても記載しています。 トリック 構成の 最大限の精度を実現します。
OCR とは何ですか? Windows 11 で OCR が重要な理由は何ですか?
光学文字認識により、画像やスキャンした PDF が編集可能かつ検索可能なテキストに変換され、自分で入力したかのようにコンテンツをコピー、編集、分析できるようになります。 OCR エンジンは、文字の形状、サイズ、分布を分析し、機械が読み取り可能なテキストに変換します。編集またはインデックス作成の準備が整いました。
日常的な使用では、検索可能なPDF形式で書類をアーカイブするのに最適です。 モバイルで文書を読む書籍をデジタル化したり、古い記録の情報を復元したりできます。 精度は大幅に向上しましたが、画像の品質や手書きか印刷かによって依然として違いが生じます。ですので、認識後に結果を確認することをお勧めします。
Microsoft 365 のエンタープライズ OCR: SharePoint、OneDrive など
SharePoint では、画像ベースの PDF に加えて、ハイブリッド PDF (テキストと画像の組み合わせ) もサポートされており、アップロード時に自動的に処理されます。 また、Office ファイル (docx、pptx、xlsx) に埋め込まれた画像を認識し、重複排除を適用して同じ画像を複数回処理しないようにします。コストとパフォーマンスを最適化します。
場所別にサポートされているファイル形式
フォーマットの互換性は接続ポイントによって異なります (SharePoint/OneDrive、Exchange、Teams/Windows/macOS)。技術的な詳細を維持しながら、重要な点をまとめます。
| 接続ポイント | サポートされているファイル形式 |
|---|---|
| SharePoint と OneDrive | .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, y .pdf (escaneados e híbridos)さらに、埋め込まれた画像も抽出されます docx, pptx, xlsx. |
| 応募者と | .jpeg, .jpg, .png, .bmp, .tiff y PDF (スキャンとハイブリッド)。 また、画像も処理します docx, pptx, xlsx, rar, tar, zip, 7z. |
| チーム、Windows、macOS | .jpeg, .jpg, .png, .bmp, .tiff y PDF (画像のみ)。 |
言語に関しては、このサービスは150以上の言語をサポートしており、 その範囲には、Microsoft Purview コンプライアンス オプションにリンクする複数の Microsoft 365 ソリューションが含まれます。 ガバナンスとデータ保護のため。
重要な制限と要件
SharePoint OCR では、画像の処理時に特定の技術的な制限が課されることに注意してください。 ファイルサイズは50MB未満、最小解像度は50×50ピクセル、最大解像度は16.000×16.000です。; さらに、OCR が有効になった後にアップロードされた画像のみが処理されます。
Windows 11のローカルOCR:PowerToys Text Extractor
画面上の任意の部分からテキストを即座に抽出したい場合(ビデオ、 apps またはゲーム)、 PowerToys テキスト抽出ツール それは奇跡の治療法です。 ショートカット「Win + Shift + T」を使用すると、オーバーレイが表示され、領域を選択できます。これを離すと、認識されたテキストがコピーされます。 クリップボード.
キャプチャは終了すると自動的に閉じられ、いつでも「Esc」キーで中止できます。 選択範囲を絞り込むには、Shift キーを押しながらフレームのサイズを変更せずに移動します。をクリックし、Shift キーを放してサイズを再度調整します。
設定では、アクティベーションショートカットと優先言語をカスタマイズできます。 このモジュールは、Windows に OCR パッケージがインストールされている言語のみを認識します。ですので、事前に確認しておくことをお勧めします。
OCR言語パックを確認してインストールする
Windowsからシステムで利用可能なOCR言語を一覧表示するには PowerShellの、以下を実行できます: これは、PowerToys でどの認識機能が使用できる状態になっているかを確認する方法です。.
利用可能な認識機能のリスト: ::AvailableRecognizerLanguages
インストール可能な OCR 機能をすべて確認したい場合は、以下をご覧ください。 このフィルターは言語OCRパックとそのステータスを表示します (インストールされているかどうか)。
インストール可能な OCR パッケージを表示します。 Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }
たとえば、「en-US」認識をインストールするには、次のようにします。 最初に容量をフィルターし、次に管理者権限を持つ PowerShell からオンラインで追加します。.
'en-US' をインストールします (PowerShell): $Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
$Capability | Add-WindowsCapability -Online
上記のパッケージを削除する必要がある場合は、次のようにします。 Remove-WindowsCapability と同じ機能の選択と削除のパターン.
'en-US' を削除します (PowerShell): $Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
$Capability | Remove-WindowsCapability -Online
一般的なトラブルシューティング
PowerToys に「可能な OCR 言語がインストールされていません」というメッセージが表示される場合は、パッケージが実際にインストールされているかどうかを確認してください。 システム ドライブが 'C:' ではない一部のコンピューターでは、'X:/Windows/OCR' フォルダーを 'C:/Windows/OCR' にコピーすると問題が解決します。.
PDFgear: エリアベースのOCRと高速編集
PDFgear は、ゾーンベースの OCR も備えた包括的な無料エディターで、関心のある部分だけをキャプチャするのに最適です。 PDF を開き、メインタブで「OCR」を有効にして、認識する領域をマウスで選択します。クリップボードにコピーしたり、TXT として保存したりできます。
PDFgear では、OCR 以外にも、テキストの編集、画像の追加、注釈の付け方、強調表示、署名、ドキュメントの保護などを行うことができます。 オンライン版では登録は必要なく、透かしも表示されません。また、Windows 11 用のデスクトップ プログラムは軽量で安定しています。日常の作業に最適です。
Googleドキュメント: スキャンしたPDFを無料で変換
のアカウントで グーグルPDF をドライブにアップロードし、右クリックして「Google ドキュメント」で開くだけです。 このサービスは OCR を自動的に実行し、抽出されたテキストを使用して編集可能なドキュメントを作成します。からダウンロードできます。 Word、PDF またはプレーンテキスト。
これはクラウドベースの変換であるため、特に PDF に複雑な表や多数の画像が含まれている場合、レイアウトが必ずしも保持されるとは限りません。 それでも、コンテンツをすばやく抽出して編集するには、最も効果的でアクセスしやすい戦略の 1 つです。.
.NET開発者向け: IronOCR
OCR をアプリケーションに統合する必要がある場合、IronOCR は高性能な C# ライブラリです。 スキャン、インデックス作成、認識において高い精度、速度、リアルタイムサポートを提供します要求の厳しい分野でも互換性を備えています。
高レベル API を使用した C# での最小限の使用例: このパターンを使用すると、1 つ以上の画像を読み取り、認識されたテキストをメモリに取得できます。.
使用するコードスニペット:
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddImage("Image.jpg");
// puedes añadir más imágenes si lo necesitas
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
ライセンスに関しては、IronOCR は開発用に無料で、試用版もあります。 商用ライセンスは開発者の数によって階層化されており、複数の製品を統合したパッケージもあります。 個別に購入するよりもお得です。
実用的な比較とツールの選び方
最高の忠実度と高度な PDF 編集機能をお求めの場合は、Acrobat Pro DC と ABBYY FineReader が最適です。 最初のものは PDF エコシステムで際立っており、2 番目のものは精度と画像コントロールで際立っています。豊富なバッチ処理オプションと言語を備えています。
混合ワークフローと価格と機能のバランスが取れたソフトウェアとしては、UPDF と EaseUS PDF Editor が非常に優れています。 UPDF はクラウドと自動化をもたらし、EaseUS は OCR と、容易な学習曲線による包括的な編集をもたらします。 初心者ユーザーも納得できるもの。
費用を一切かけたくない場合は、FreeOCR、Google Docs、PDFgear で十分な機能が得られます。 FreeOCR は手間をかけずに変換し、Docs は高速クラウド変換を処理し、PDFgear は領域ベースの OCR とマークアップフリーの編集を追加します。すべて無料でご利用いただけます。
企業環境では、OCR が統合された SharePoint/OneDrive により、摩擦が軽減され、検索機能とコンプライアンスが向上します。 さらに、Windows 11 の PowerToys Text Extractor を使用すると、画面からテキストを瞬時にキャプチャできる「スイス アーミー ナイフ」が手に入ります。一度試してみると病みつきになるもの。
OCRの精度を向上させるためのヒント
画像が制限を超えないようにし、適切な解像度を維持し、ぼやけた写真や影のある写真を避けてください。 常に文書の正しい言語を選択し、可能であればコントラストを改善し、認識する前にページをまっすぐにしてください。 OCR エンジンを支援します。
表を含む PDF の場合は、表エディター (ABBYY/Readiris) または Excel への出力機能を備えたツールを使用します。 フラグメントのみが必要な場合は、PDFgear のゾーン OCR または一部のエディターでの手動選択により、後で時間とクリーンアップを節約できます。 結果で。
文書が手書きの場合は、それを明示的に示すエンジンでテストし、その後の徹底的なレビューを想定します。 大規模なバッチの場合は、処理キューを有効にし、マルチスレッドまたはクラウド処理オプションを確認してください。 ハードウェア 制限されています.
PowerToys の言語に問題が発生した場合は、OCR パッケージを確認し、PowerShell から再インストールしてください。 言語パックがインストールされていない場合、システムの残りの部分がその言語であっても認識されないことに注意してください。.
最後に、プライバシーを考慮してください。機密文書の場合は、オンライン サービスよりもローカル ソリューションまたはエンタープライズ ソリューション (SharePoint) を優先します。 常にデータ ポリシーを確認し、可能であれば、ファイルをローカルまたは制御された環境で操作します。 規制を遵守するため。
Microsoft 365 に組み込まれた OCR から、無料のユーティリティや開発者ライブラリまで、これらすべてのオプションを使用すると、Windows 11 で PDF や画像を便利なテキストに変換するための完全なツールが手に入ります。 シナリオ(高速変換、完全編集、ボリュームまたはフルフィルメント)に応じて選択すると、最初から正しく実行できます。.
バイトの世界とテクノロジー全般についての情熱的なライター。私は執筆を通じて自分の知識を共有するのが大好きです。このブログでは、ガジェット、ソフトウェア、ハードウェア、技術トレンドなどについて最も興味深いことをすべて紹介します。私の目標は、シンプルで楽しい方法でデジタル世界をナビゲートできるよう支援することです。