最新のマルチモーダルAIを活用した次世代OCRシステム。宅急便伝票・発注書・製造業図面など、手書き・印刷問わず高精度に読み取り、Excel一発出力を実現。クラウド版・オンプレ版の両方に対応。
プロジェクト概要
紙の帳票から必要な情報をAIで自動抽出する次世代OCRシステム「AI-OCR-Z」を開発しました。
課題
宅急便伝票・発注書・図面など、紙帳票の手入力作業が大量に発生
従来のOCRでは手書き文字や複雑なレイアウトの精度が低い
帳票フォーマットが取引先ごとに異なり、汎用OCRでは対応しきれない
ソリューション
マルチモーダルAI による高精度認識(手書き・印刷・図面問わず)
一括・並列処理 — 複数PDFをドラッグ&ドロップ、数百ページも高速解析
結果確認・修正UI — 認識結果を画面上で直接編集可能
Excel一発出力 — 確認後ワンクリックでExcelダウンロード
帳票タイプ追加対応 — 顧客の帳票フォーマットに合わせたカスタマイズ
対応帳票タイプ
宅急便伝票 — 佐川急便・ヤマト運輸等の伝票から伝票番号・依頼主氏名を一括読取
発注書 — ヘッダー情報と明細テーブルを構造的に読取
製造業図面 — 表題欄・寸法・材質・図面番号を抽出、紙図面の検索・管理をデジタル化
提供方式
クラウド版 — Vercel + GCP Vertex AI(SaaS型、即利用可能)
オンプレ版 — Ollama + Qwen3-VL(社内ネットワークで完結、機密データ対応)
成果
平均処理時間:約12秒/ページ(GPU使用時)
手入力作業を最大90%削減
オンプレ版により機密性の高い帳票にも対応
技術スタック
AI — GCP Vertex AI(クラウド版)、Qwen3-VL + Ollama(オンプレ版)
フロントエンド — Next.js, TypeScript
画像処理 — PyMuPDF, Pillow
UI(オンプレ) — Streamlit