「毎月100枚以上の請求書PDFを手作業で確認して金額を転記している」「契約書の期限管理が追いつかず、更新を見落とすことがある」「社内の報告書PDFが増え続けて、必要な情報が見つからない」——法務・経理・管理部門でよく聞く悩みです。Claude Codeを使うと、PDFの解析・テキスト抽出・データ構造化を自動化できます。実際にある会計事務所では、毎月処理していた請求書PDF100件の確認作業が手作業の150分から30分に短縮されています。この記事では、Claude CodeでPDFを一括処理する方法を、法務・経理の実用例を交えて解説します。
目次
- Claude CodeがPDFで何をできるか
- PDF処理の基礎:テキスト抽出の仕組み
- 請求書PDFの一括処理:金額・発行元・期日を自動抽出
- 契約書PDFの管理:期限・当事者・条件をデータベース化
- 報告書PDFの要約:複数レポートを1枚のサマリーに
- Claude Codeでコードを生成する手順
- 実際の活用事例と削減効果
1. Claude CodeがPDFで何をできるか
Claude Codeは、PDFファイルを読み込んで内容を解析し、必要な情報を抽出・整理できます。具体的にできることは次のとおりです。
テキスト抽出: PDFからテキストを取り出します。テキスト形式で作成されたPDF(電子書類)はほぼ完全に抽出できます。スキャンした紙の書類(画像PDF)はOCR処理が追加で必要ですが、Claude Codeがそのコードも生成してくれます。
特定情報の抽出: 「請求金額」「支払期日」「発行会社名」「契約期間」など、文書の中から指定した情報だけを取り出してスプレッドシートに整理できます。
内容の要約: 長文の報告書や契約書を読んで、要点を箇条書きでまとめられます。10ページの報告書を1ページのサマリーにする処理を自動化できます。
比較・分析: 複数のPDFを比較して差異を見つけたり、傾向を分析したりできます。複数の見積書を並べて最安値を自動で見つける処理も可能です。
PDF処理でよく使われる用途と効果の目安をまとめます。
| 用途 | 手作業時間(100件) | 自動化後 | 削減率 |
|---|---|---|---|
| 請求書の金額転記 | 150分 | 30分 | 80% |
| 契約書の期限リスト化 | 200分 | 20分 | 90% |
| 報告書の要約作成 | 300分 | 45分 | 85% |
| 見積書の比較表作成 | 120分 | 15分 | 88% |
2. PDF処理の基礎:テキスト抽出の仕組み
PDFのテキスト抽出には、大きく2種類の方法があります。
テキスト形式PDFの場合: ExcelやWordから書き出したPDF、電子契約書など、最初からデジタルで作成されたPDFです。PyPDF2 や pdfplumber というPythonライブラリを使えば、ほぼ完全なテキスト抽出ができます。Claude Codeがこれらのライブラリを使うコードを自動生成します。
画像形式PDFの場合(スキャン書類): 紙をスキャンしたPDF、FAXで受け取ってスキャンした書類などです。文字が「画像」として保存されているため、OCR(光学文字認識)処理が必要です。Google Cloud Vision APIやTesseract(無料)を組み合わせる方法をClaude Codeが提案・実装してくれます。
Claude Codeへの最初の確認プロンプトとして、「処理するPDFがテキスト形式か画像形式かを確認して、適切なテキスト抽出方法を選んでください」と伝えると、ファイルを確認した上で最適な方法を提案してくれます。
3. 請求書PDFの一括処理:金額・発行元・期日を自動抽出
請求書PDFから「発行会社名」「請求金額」「支払期日」「請求書番号」を自動で抽出してGoogleスプレッドシートに記録する自動化です。
会計事務所での実際の処理規模として、月100件の請求書処理が手作業で150分かかっていたケースを紹介します。
Claude Codeへのプロンプト例:
フォルダ内の請求書PDFを一括処理するPythonスクリプトを作ってください。
処理内容:
- 指定フォルダ(./invoices/)内の全PDFを処理する
- 各PDFから以下の情報を抽出する:発行会社名・請求金額(税込)・支払期日・請求書番号・発行日
- 抽出結果をGoogleスプレッドシート(ID: XXXXXXXX)の「請求書一覧」シートに1行ずつ追記する
- 処理済みファイルは./processed/フォルダに移動する
- 抽出できなかったファイルは./error/フォルダに移動してエラーログを記録する
必要なライブラリ:pdfplumber(テキスト抽出)、Google Sheets API(書き込み)、Anthropic API(内容解析)
このスクリプトを使った処理の流れは次のとおりです。
- 経理担当者が請求書PDFを
./invoices/フォルダに入れる - スクリプトを実行する(ダブルクリックで起動できるよう設定可能)
- 2〜3分で全件処理が完了してスプレッドシートに自動入力される
- 担当者はスプレッドシートの内容を確認して支払処理を進める
手作業150分が30分(スクリプト実行後の確認作業のみ)になった計算です。入力ミスもゼロになりました。
4. 契約書PDFの管理:期限・当事者・条件をデータベース化
契約書の管理では、「いつ終わる契約か」「自動更新条件はあるか」「どの会社との契約か」を素早く把握することが重要です。
ある会社では、締結済み契約書が200件以上あり、それがPDFフォルダに保管されているだけで期限管理をしていませんでした。その結果、契約終了3ヶ月前に気づかず自動更新されてしまうケースが年2〜3件発生していました。
Claude Codeへのプロンプト例:
契約書PDFの情報を抽出してデータベース化するスクリプトを作ってください。
抽出する情報:
- 契約名称
- 甲(自社)・乙(相手方)の会社名
- 契約開始日・終了日
- 自動更新の有無(「自動更新」「自動的に更新」などの文言を検索)
- 自動更新の場合、解約通知期限(終了〇ヶ月前など)
- 月額・年額の金額(あれば)
出力先:Googleスプレッドシート(ID: YYYYYYYY)
終了日が90日以内の契約にはセルを黄色、30日以内は赤色でハイライトする
週1回スクリプトを実行して、終了日が迫っている契約をSlackに通知する
このシステムを導入した会社では、200件の契約書データベースが一気に構築されました。初回の処理は自動化によって約40分で完了しています。手作業で全件確認する場合の10時間以上と比べると、95%の時間削減です。
現在は毎週1回スクリプトが自動実行されてSlack通知が届くため、契約の見落としがなくなっています。
5. 報告書PDFの要約:複数レポートを1枚のサマリーに
毎月届く取引先・社内各部門からの報告書PDFを、1枚のサマリーにまとめる自動化です。
ある経営企画部では、毎月15社からの月次報告書PDFが届いており、役員報告用にサマリーを作成するのに半日(約4時間)かかっていました。
Claude Codeへのプロンプト例:
複数の月次報告書PDFを要約してサマリーを作成するPythonスクリプトを作ってください。
処理内容:
- 指定フォルダ内の全PDFを読み込む
- 各PDFから「先月比較」「課題・リスク」「翌月の計画」の3点を抽出する
- 全社分をまとめた1ページのサマリードキュメントをGoogle Docs(フォルダID: DDDDDDDD)に作成する
- サマリーのフォーマット:会社名・要点(箇条書き3項目以内)・特記事項
- 全文字数は2,000字以内に収める
このスクリプトで15社分のサマリーが20分で完成します。担当者が費やしていた4時間の作業が20分になりました(削減率92%)。
6. Claude Codeでコードを生成する手順
PDF処理の自動化コードを生成する際の手順を整理します。
事前に確認することのリスト
- 処理するPDFがテキスト形式かスキャン(画像)形式か
- 抽出したい情報の項目名と、その情報がPDF内のどこに書かれているか
- 出力先(スプレッドシート・ドキュメント・CSV等)
- 処理するファイル数の規模(10件以下か、100件規模か)
これらを明確にしてClaude Codeに伝えると、精度の高いコードが生成されます。
コードの実行環境
生成されたPythonスクリプトは、パソコンにPythonがインストールされていれば動かせます。インストール方法はClaude Codeが説明してくれます。
初回実行前に「このスクリプトを動かすために必要なインストール手順を日本語で教えてください」と質問すれば、コマンドプロンプト(Windows)またはターミナル(Mac)でのセットアップ手順を案内してくれます。
7. 実際の活用事例と削減効果
事例1: 不動産管理会社(物件報告書100件/月)
毎月100件の物件点検報告書PDFから修繕事項を抽出して優先度別に整理する作業が、手作業の8時間から1.5時間(スクリプト実行30分+確認作業60分)になりました。
事例2: 人材紹介会社(応募者の職務経歴書)
求職者から届く職務経歴書PDF(月500件)から経験業種・スキル・希望条件を抽出してデータベース化しています。人材担当者が手作業でいた転記作業(月40時間)が月5時間に削減されました。
事例3: コンサルティング会社(競合調査レポート)
クライアントへの提案準備で複数の調査レポートPDFをまとめる作業に使っています。5〜10本のレポートを読んで要点を抽出・比較する作業が半日から1時間に短縮され、提案書のクオリティも上がったとのことです。
Claude Code道場では、PDF処理の自動化を実践的なカリキュラムで学べます。「紙の書類が多くてデジタル化が追いついていない」「PDFの管理・転記作業に時間を取られている」という方に特に役立つ内容です。実際に自分のPDFを使って処理を自動化するまでを体験できます。ぜひClaude Code道場で学んでみてください。


