PDFの特定部分だけを抽出してOCR読み取りする方法｜無料・有料ツール別に徹底解説

PDFの中の「特定の部分」だけを抽出してテキスト化したい、というニーズは多くの場面であります。
たとえば、請求書の金額欄だけを読み取りたい、申請書の氏名欄だけを取り出したいなどです。
しかし、PDFは画像データとして保存されていることも多く、そのままではテキストをコピーできません。
この記事では、OCR（文字認識）技術を使って、PDFの特定部分のみを抽出・読み取る方法を、無料・有料ツール、そしてプログラミングでの自動処理まで幅広く紹介します。
作業効率を上げたい方、帳票処理を自動化したい方は必見です。

PDFの特定部分を抽出するとは？
方法①：Adobe Acrobatを使う（有料・精度重視）
方法②：無料OCRツールを使う（Googleドライブ・Microsoft OneNoteなど）
1. ①Googleドライブ＋Googleドキュメント
2. ②Microsoft OneNote
方法③：Python＋ライブラリで自動抽出する（プログラマー向け）
方法④：AI-OCRサービスを利用する（精度重視・業務向け）
1. メリット
2. デメリット
方法⑤：RPA＋OCRツールで自動化（ノーコードで実現）
OCR精度を上げるコツ
まとめ：目的に合わせて最適な方法を選ぼう
結論

PDFの特定部分を抽出するとは？

PDFは大きく分けて「テキスト型PDF」と「画像型PDF」の2種類があります。
テキスト型は文字情報をそのまま保持しているため、範囲選択してコピーするだけで抽出可能です。
一方、スキャンされた書類などは画像型PDFであり、OCR（Optical Character Recognition＝光学文字認識）を使って文字を認識させる必要があります。

「特定部分の抽出」とは、PDFの全体ではなく、たとえば右上の表、日付欄、署名欄など、特定の位置だけを切り出して解析することを意味します。
これは、AI-OCRやプログラムを使うと非常に効率的に実現できます。

方法①：Adobe Acrobatを使う（有料・精度重視）

最も正確で手軽な方法が、Adobe Acrobat Pro DCを使う方法です。
AcrobatにはOCR機能が内蔵されており、次の手順で特定領域の文字を抽出できます。

手順

PDFをAdobe Acrobatで開く。
「ツール」→「スキャン補正」→「テキスト認識」→「このファイルでテキストを認識」を選択。
OCR処理を実行すると、画像がテキスト化される。
「スナップショットツール」を使って特定の範囲を選択し、コピー。
その部分だけをWordやExcelに貼り付ける。

メリット

認識精度が非常に高い。
レイアウト保持も優れている。
一括処理も可能。

デメリット

有料（月額プランあり）。
処理速度はやや遅め。

業務で頻繁にPDFを扱う場合は、コストに見合うメリットがあります。

方法②：無料OCRツールを使う（Googleドライブ・Microsoft OneNoteなど）

無料で特定部分のOCRを行いたい場合は、次の2つの方法が代表的です。

①Googleドライブ＋Googleドキュメント

GoogleドライブにPDFをアップロード。
右クリックして「アプリで開く」→「Googleドキュメント」を選択。
自動的にOCRが実行され、文字データ化される。
その中から必要な部分だけをコピー。

GoogleのOCRは精度が高く、画像内の日本語にも対応しています。
ただし、特定の領域をピンポイントで抽出する機能はないため、部分抽出は手動になります。

②Microsoft OneNote

PDFをOneNoteに貼り付ける。
右クリックして「画像からテキストをコピー」。
必要な箇所のみ貼り付けて利用。

手軽にOCRを行いたい人におすすめの無料手段です。

方法③：Python＋ライブラリで自動抽出する（プログラマー向け）

大量のPDFから特定領域を自動抽出したい場合、Pythonを使ったスクリプト処理が最も効率的です。
次のようなライブラリを組み合わせて利用します。

PyMuPDF（fitz）：PDFのページや座標を扱うライブラリ
Pillow：画像の切り抜き・変換用
Tesseract OCR：Googleが開発した無料のOCRエンジン

サンプルコード

import fitz
from PIL import Image
import pytesseract

pdf_path = "sample.pdf"
page_number = 0  # 1ページ目
x0, y0, x1, y1 = 100, 200, 300, 250  # 抽出範囲の座標（px）

doc = fitz.open(pdf_path)
page = doc.load_page(page_number)
pix = page.get_pixmap()
img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)

# 特定領域を切り抜き
crop = img.crop((x0, y0, x1, y1))

# OCR実行
text = pytesseract.image_to_string(crop, lang="jpn")
print(text)

このコードは、PDFの1ページ目の特定領域を座標指定で切り抜き、Tesseractで文字を抽出します。

メリット

完全自動化が可能。
数百枚のPDFを一括処理できる。
CSVやDBへの出力も容易。

デメリット

座標指定の調整が必要。
初期セットアップ（Python＋Tesseract）がやや難しい。

方法④：AI-OCRサービスを利用する（精度重視・業務向け）

近年はクラウド型のAI-OCRサービスが登場しており、手書き文字にも対応しています。
特定領域を自動検出し、帳票処理を行う機能が豊富です。

代表的なサービスは以下の通りです。

サービス名	特徴	価格帯
Google Cloud Vision API	高精度のOCR、位置情報も取得可能	従量課金制
AWS Textract	フォーム・表形式も認識可	従量課金制
Azure Cognitive Services OCR	画像中のテキストを構造化して取得	従量課金制
AI inside DX Suite	日本語帳票に特化	月額型（法人向け）

これらのサービスは、単なる文字認識だけでなく、「どこに何の情報があるか」を座標付きで返してくれます。
たとえば「右上の金額欄」「左下の日付欄」といった指定も可能になります。

メリット

手書き文字にも強い。
自動で領域判定可能。
クラウドでスケーラブルに処理。

デメリット

API連携の知識が必要。
無料枠を超えると課金が発生。

方法⑤：RPA＋OCRツールで自動化（ノーコードで実現）

プログラミングが難しい場合、RPA（Robotic Process Automation）ツールを使う方法もあります。

代表的なものは以下の通りです。

Power Automate for Desktop（Microsoft）
UiPath
WinActor（NTT）

これらでは「PDFを開く→特定範囲をスクリーンショット→OCRで認識→Excelに転記」という流れをGUI操作で自動化できます。
ノーコードで構築できるため、非エンジニアでも実用的です。

OCR精度を上げるコツ

高解像度のPDFを使用する（150dpi以上推奨）
背景を白に近づける（ノイズを減らす）
明朝体・ゴシック体のフォントを優先
手書きは太字・大きめに書く
OCRエンジンの言語設定を「日本語」にする

OCRの結果が不安定な場合、これらを改善するだけでも認識精度が大幅に向上します。

まとめ：目的に合わせて最適な方法を選ぼう

目的	おすすめ手段	特徴
手軽に1枚だけ抽出したい	Adobe Acrobat／OneNote	高精度・簡単
無料でOCRしたい	Googleドライブ	手軽だが手動多め
自動処理・大量データ	Python＋Tesseract	自動化に最適
手書きや帳票処理	AI-OCR（Google Vision等）	高精度・クラウド対応
ノーコードで自動化	Power Automate／UiPath	企業導入向け