「AI-OCRの精度99%」。こう書いてあっても、実際の領収書でどこまで正確に読み取れるのか、疑問に思う方は多いはずです。
Resitolyでは、16業種・10撮影条件のテスト画像50枚を使い、AI-OCRの領収書読み取り精度を社内検証しました。フィールド別の総合正解率は98.9%。この記事では、フィールドごとの精度から苦手な撮影条件まで、検証結果をすべて公開します。
テストの概要
検証に使ったのは、日常で遭遇するほぼすべてのタイプのレシートと領収書です。
16業種(コンビニ、カフェ、スーパー、ドラッグストア、ホームセンター、ガソリンスタンド、ホテル、居酒屋、タクシー、駅、駐車場、病院、薬局、宅配便、クレジットカード明細、海外レシート)をカバーし、撮影条件は以下の10パターンを設定しました。
| 条件 | 内容 |
|---|---|
| Clean | 良好な状態 |
| Angle | 斜めから撮影 |
| Blur | ピントがぼけた状態 |
| Faded | 感熱紙の退色 |
| LowLight | 暗所での撮影 |
| Shadow | 影がかかった状態 |
| Wrinkled | しわのあるレシート |
| Folded | 折り目がついたレシート |
| Partial | 一部が欠損した状態 |
| BgClutter | 背景にノイズがある状態 |
「きれいに撮れた写真」だけでなく、ぼやけた写真、薄くなったレシート、折り目のあるレシートも含めたテストです。
フィールド別の精度
50枚のテスト画像に対する、フィールドごとの正解率がこちらです。
| フィールド | 正解率 | 正解数/判定対象 |
|---|---|---|
| 日付 | 100.0% | 48/48 |
| 金額 | 98.0% | 49/50 |
| 通貨 | 100.0% | 50/50 |
| 取引先 | 97.9% | 47/48 |
| 明細分割(税率別) | 100.0% | 9/9 |
| 勘定科目 | 97.9% | 47/48 |
| 全体 | 98.9% | 282/285 |
日付、通貨、税率別の明細分割は100%でした。金額で1件、取引先で1件、勘定科目で1件の誤りがあり、285項目中のミスは計3件です。
228枚の大規模テストでも検証
50枚とは別に、228枚・10条件の大規模テストも実施しました。
| フィールド | 正解率 |
|---|---|
| 日付 | 98.0% |
| 金額 | 98.7% |
| 通貨 | 99.6% |
| 取引先 | 97.9% |
| インボイス登録番号 | 100.0% |
規模を4倍以上に増やしても、各フィールドの正解率は98%前後を維持しています。インボイス登録番号(T+13桁の数字列)は228枚すべてで正確に抽出できました。
撮影条件ごとの傾向
10パターンのテストで、精度に影響する要因がはっきりしました。
ほぼ影響がなかったのは、軽い折れ・しわ(Wrinkled、Folded)と背景ノイズ(BgClutter)です。レシートの物理的な劣化は、文字が読める状態であれば精度に響きません。
一方、精度が落ちやすかったのは次の3パターンです。
- Blur(ピンぼけ) — 文字の輪郭が失われ、金額や取引先の誤認識が発生しやすい
- Partial(一部欠損) — 端が切れていると、そもそも情報が存在しない
- Faded(退色) — 感熱紙が薄くなると、店名や品目から先に読めなくなる
処理速度
精度だけでなく速度も計測しました。
| 指標 | 値 |
|---|---|
| 平均処理時間 | 3.4秒/枚 |
| 90パーセンタイル | 2.1秒/枚 |
大半のレシートは2秒前後で処理が完了します。スマホで撮影してからAI解析が終わるまで、体感としてはほぼ待ち時間がありません。
「候補提示→人が確定」のワークフロー
98.9%は高い数字ですが、100%ではありません。残り1.1%のエラーをどうするか。
Resitolyの設計は「AIが候補を提示し、人が確定する」フローです。AI解析の結果を鵜呑みにせず、必ず人がチェックしてから確定します。
ゼロから手入力するのと、AIが読み取った候補をサッと確認するのでは、作業時間がまるで違います。AI-OCRに求めるのは「完璧な自動化」ではなく「手入力の手間を9割減らすこと」です。
Resitolyが1回の解析で抽出するフィールド
AI-OCRは文字を読み取るだけではありません。Resitolyでは以下のフィールドを1回の解析で抽出します。
| フィールド | 内容 |
|---|---|
| 日付 | 取引日を自動認識 |
| 金額 | 合計金額を抽出 |
| 通貨 | 日本円・外貨を判定 |
| 取引先 | 店名・社名を推定 |
| 税率別明細 | 8%と10%を自動分割 |
| 勘定科目 | 取引内容から科目を推定 |
| インボイス登録番号 | T+13桁を正確に抽出 |
「コンビニで1,080円」であれば、消耗品費か会議費かを文脈から推定し、軽減税率と標準税率が混在していれば明細行を自動分割します。
よくある質問
AI-OCRの精度はどのくらいですか?
Resitolyの内部テスト(50枚、16業種、10撮影条件)では、全フィールドの総合正解率は98.9%です。日付・通貨・税率別明細は100%、金額は98.0%でした。
手書きの領収書も読み取れますか?
金額(数字)は筆跡がはっきりしていれば読み取れるケースが多いです。ただし、崩し字や走り書きの宛名・但し書きは誤認識が増えます。手書き領収書は「AIの候補をサッと確認する」前提で使うのが現実的です。
感熱紙のレシートが薄くなっていても大丈夫ですか?
やや薄い程度なら問題なく読み取れます。かなり薄くなると店名や品目から欠落しやすくなるため、もらったその日に撮影するのが確実です。
読み取り精度を上げるコツは?
明るい場所で撮る、影を入れない、まっすぐ全体がフレームに入るようにする。この3点を意識するだけで精度は安定します。
まとめ
AI-OCRの領収書読み取り精度は、撮影条件やレシートの状態によって差が出ます。ただし、適切に撮影すればフィールド単位で98〜100%の正解率を達成できることが、50枚・228枚のテストで確認できました。
残りのエラーは「候補提示→人が確定」のワークフローでカバーする設計です。
14日間の無料トライアルで、実際の読み取り精度を試せます。カード登録は不要です。