最新情報への対応とLLMの限界...
もう“書き写すだけ”に時間を奪われない!Docsumoで変わる弁護士の定型業務
はじめに
弁護士の日々の業務の多くは、膨大な量の資料処理に費やされています。契約書の整理、タイムカードの集計、登記簿の情報整理などの作業により、本来注力すべき法律的な判断や戦略立案の時間が制限されているのが現状です。具体例を見てみましょう。
財産目録作成に必要な情報の転記
相続や遺産分割、成年後見などの案件では、通帳や登記簿情報を裁判所指定のフォーマットへ転記する作業が必要です。誤転記は重大な問題につながりかねないため慎重さが求められますが、その分時間も要し、専門家として肝心の法的検討にフォーカスしづらい状況です。
買収デューデリジェンスにおける契約書確認
企業買収の法務デューデリジェンスでは、買収対象となる企業の契約書一式を精査する必要があります。一つひとつ確認しながら契約条件や相手方などの情報をリスト化するのは大変な作業で、法的判断や買収ストラクチャーの検討に割ける時間が限られてしまいがちです。
労働関係の相談におけるタイムカードの集計
長期間におよぶ未払い残業代の調査などでは、手書きのタイムカードやExcelで管理されたデータを集計・検証する工程に時間がかかります。データ形式がバラバラで、数が多ければ多いほど手作業は煩雑になり、入力ミスのリスクも高まります。
これらの作業はすべて高い正確性が求められますが、このような事務作業に時間を取られることで、案件に対する法的判断や戦略立案に十分な時間を確保できない状況が生じています。実際、事務作業の負担増大により、新規案件の受任を断らざるを得ないケースも発生しているようです。
Docsumoとは?
本記事では、こうした定型的な事務作業の効率化をサポートするAIドキュメント解析サービス「Docsumo」をご紹介します。Docsumoは、紙ベースの資料やPDFファイルから必要な情報を自動で読み取り、テキストデータとして抽出できるクラウドサービスです。主な特長は:
- 豊富なテンプレート 請求書、領収書、銀行明細などの書類に応じたテンプレートがあらかじめ用意されており、データ抽出の設定が容易です。
- 自由なカスタマイズ テンプレートにとらわれず、書類の「読み取り項目」を柔軟に設定できます。日本語の書類にも対応しており、抽出項目やフィールドを自由に追加・修正できます。
- 外部サービスとの連携 DropboxやBox、OneDriveなどと連携し、特定フォルダにアップロードされたファイルを自動的に取り込み・解析できます。解析結果はエクセルなどの形式で出力できるため、既存の業務フローにスムーズに導入できます。
無料プランでは月に100ページまで利用できるため、小規模なテスト導入から始められます。
例えば、予め用意されたテンプレートと中で、「Invoice」(請求書)を選択して請求書をアップロードすると、システムが請求書に一般的に記載される項目を自動的に認識し、スムーズにデータを抽出してくれます。
用意されているテンプレートの多くはアメリカで使用されている類型ですが、Docsumoは、自身で書類の読み込みとデータ抽出の型を自由に設定できる、それが非常に直感的なUIで構築されていることが特徴です。実際には画面のように「Create Custom Document Type」を選択して設定を行います。具体的な使い方を説明するために、以下の3つの例を見ていきましょう。
- 通帳の写真から財産目録作成に必要な情報を抽出
- 契約書から必要項目を抜き出す
- スキャンされたタイムカードのPDFファイルをデジタル化
通帳の写真から財産目録作成に必要な情報を抽出
Step 1: 「Name your document type」に任意の名前をつけてください。わかりやすい名前を自由に設定できます。
Step 2: サンプルとなるファイルを1つアップロードしてください。今回は通帳のJPEGファイルをアップロードします。アップロード後、右下の「Set up fields」をクリックして次に進みます。
Step 3: システムが自動的にファイルの読み込みを開始し、しばらくすると左側に「Edit Fields」、右側にアップロードしたファイルが表示されます。
Step 4: 「Edit Fields」で項目を編集します。初期状態では、アップロードしたファイルに対して抽出候補項目が表示されています。必要な項目を追加したり、不要な項目を削除したりして調整します。なお、項目名は英語で設定する必要があります。今回は以下の項目を設定しました。
- Company Name:社名
- Branch Number:店番
- Account Number:口座番号
- Bank Name:銀行名
- Branch Name:口座名
- Phone Number:電話番号
Step 5: 抽出したい項目を決定したら、左下の「Save & Extract」をクリックして抽出を開始します。数秒後に処理が完了すると、次の画面で抽出された情報を確認できます。左側に設定した抽出項目の横に実際のデータが表示され、そのデータがどの部分から抽出されたのかが視覚的にハイライトされます。
Step 6: 抽出されたデータはエクセルファイルとしてダウンロードでき、そのデータを財産目録に転記することができます。
より効率的な使用方法として、無料版ではMicrosoft OneDrive、Dropbox、Boxとの連携機能があります。今回はDropboxとの連携をデモとして紹介します。まず、Dropbox上にフォルダを作成(通帳をアップロードするフォルダ)し、DocsumoとDropboxの連携設定を行います。連携させておくと、Dropboxフォルダに新しいファイルをアップロードするたびに、先ほど設定した自動抽出が実行されるようになります。
契約書から必要項目を抜き出す
操作の流れは上記と同様です。Step 4で示した通り、システムは最初にアップロードされたファイルから抽出項目を提案してきますが、この提案には若干のばらつきがあります。そのため、先生方自身で抽出項目を適切に設定することが重要です。なお、設定した項目は後から追加・修正が可能で、ファイルの再読み込みもできます。今回は以下の項目を設定して抽出を試みました。
- Contract Signatory Company:署名者
- Contract Signatory Lawyer:署名者
- Contract Date:締結日
- Validity Period:契約期間
- Termination Notice Period:解約通知
- Monthly Basic Usage Fee:月額料金
- Payment Method:支払方法
- Confidentiality Obligation:秘密保持
- Third Party Disclosure:第三者への情報開示
- Modification and Termination Notice:契約の変更、解除
日本語の契約書に対しても、設定した項目をほぼ完璧な精度で抽出できています。
このように、Docsumoは想定外の資料に対してもカスタム設定が可能です。Docsumoの説明書には「Upload and process 10 documents. To accurately evaluate Docsumo's extraction capabilities, upload and process at least 10 documents and observe the extraction.」と記載があるため、本番使用前に複数のサンプルをアップロードして精度を向上させることをお勧めします。
スキャンされたタイムカードのPDFファイルをデジタル化
次にタイムカードの読み込みを試してみました。エクセルで作成したデータを紙に印刷してスキャンしたものを取り込みます。実行手順は先ほどと同様で、以下の項目を抽出対象として設定しました。
- Employee Number:従業員番号
- Employee Name:氏名
- Branch:支店
- Date:日
- Attendance time:出勤時刻
- Closing time:退勤時刻
- Break time:休憩時間
- Working hours:勤務時間
処理を実行したところ、1ヶ月分のタイムカードデータのうち、最初の1行(2025/01/01分)しか表示されませんでした。
この対策として、Step 4で抽出項目を設定する際に「データの型」を指定できます。例えば「Employee Number」という抽出項目に対して、データの型を「Number(数字)」と設定できます。このデータの型の選択肢の中に「Table」があり、下記の設定画面のように、Working hoursのデータ型をTableに設定し、その下位項目として
- Start Time:出勤時刻
- Close Time:退勤時刻
- Break Time:勤務時間
を設定しました。この設定で再度実行すると、31日分全ての項目が正しくデータ化され、エクセルでダウンロードして集計できるようになりました。
ここまで、Docsumoの機能について、任意の資料から設定項目を抽出する方法をご説明してきました。本記事執筆時点で月100ページ分まで無料で利用できますので、ぜひ皆様の日常業務で効率化できる資料がないか、探してみてはいかがでしょうか。
このようなサービスの今後の展開として期待したいのは、項目の抽出に加えて出力フォーマットの指定機能です。例えば、今回取り上げた「財産目録」のケースでは、抽出した項目を裁判所指定のフォーマットで自動出力し、そのまま提出できるようになれば、業務効率は大幅に向上するでしょう。
定型作業を削減することで、弁護士として本来取り組むべき戦略立案や相談対応により多くの時間を充てられ、新しい案件も断ることなく受けられるようになるかもしれません。事務処理のデジタル化による効率向上は、今後の法律事務所にとって避けては通れない流れです。この機会に、Docsumoの無料プランを試してみてはいかがでしょうか。