【概要】
農業ベンチャー様が保有するトマト検出AIモデルをベースに、さらなる検出精度向上を実現するための研究開発プロジェクト。データセットの拡充、最適な学習手法の選定、そして複数の最新AIモデルの性能を比較検証することで、実践的な環境下での認識精度を向上させました。
【お客様の課題】
農業分野の自動化を農業ベンチャー様より、AIによるトマトの自動認識・収穫システムの中核となる物体検出モデルについて、ご相談をいただきました。提供いただいた既存の学習済みモデル(YOLOv8)は一定の性能を有していましたが、実用化に向けて更なる精度向上が課題となっていました。
【チームゼットのソリューション】
私たちは3ヶ月にわたる検証と開発を通じ、体系的なアプローチでAIモデルの精度向上に取り組みました。
1. データセットの品質と量の拡充
アノテーションの実施: 1,033枚に及ぶ画像データに対し、トマト(赤・緑)の正確な位置情報を付与(アノテーション)する作業を実施しました。
品質の担保: ダブルチェックやIoU(Intersection over Union)を用いた整合性チェックプロセスを導入し、高品質な学習データを整備しました。
2. 最適な学習・推論手法の確立
ファインチューニングによる精度向上: 拡充した1,033枚のデータセットで追加学習(ファインチューニング)を実施。その結果、モデルの性能指標であるmAP(mean Average Precision)は 0.488 から 0.780 へと大幅に向上しました。
スライス推論の導入: 4Kなどの高解像度画像に対して、画像を小さな領域に分割してから推論を行う「スライス推論」を検証。特に640×640ピクセルでのスライスが検出精度向上に極めて有効であることを突き止めました。
3. 最新AIモデルによる性能比較検証
ベースのYOLOv8に加え、YOLOv11やRT-DETRといった複数の最新物体検出モデルで学習・評価を実施。
PythonとHTMLで独自の比較検証用ビューワーを開発し、定量的・定性的な評価を行いました。これにより、いずれのモデルにおいても、元のモデルから大幅な精度向上を確認しました。
【プロジェクトの成果】
本プロジェクトを通じて、トマト検出AIモデルの精度を大幅に改善し、農業DXの実用化に大きく貢献しました。特に、以下の技術的知見を確立できたことが大きな成果です。
体系的な精度向上プロセスの確立: 「データセット拡充 → ファインチューニング → 最新モデルでの比較検証」という一連のプロセスにより、着実にAIの性能を高めるノウハウを実証しました。
実践的な推論手法の確立: 高解像度画像に対する「スライス推論」の有効性を証明し、実運用に耐えうる検出精度を実現しました。
多様なAIモデルへの対応力: YOLOシリーズだけでなく、RT-DETRといったTransformerベースの最新モデルにも対応できる高い技術力を示しました。
私たちチームゼットは、お客様の課題に応じて最適なAI技術を選定し、ビジネスの現場で真に価値を生むソリューションを開発・提供してまいります。
【使用技術・ツール】
AIモデル: YOLOv8, YOLOv11, RT-DETR
開発言語: Python
ライブラリ: Ultralytics YOLO API
アノテーションツール: RoboFlow