YOLOv8：リアルタイム物体検出の最新モデル

2024/7/11 AI Deep Learning PyTorch Python Object Detection 機械学習，AI 人工知能，深層学習，物体検出，YOLO リアルタイム検出

YOLO アーキテクチャの概要

YOLO（You Only Look Once）は、2016 年に Joseph Redmon らによって提案されたワンステージ型の物体検出アルゴリズムです。従来の物体検出手法とは異なり、YOLO は画像全体を一度だけ評価して、直接物体の位置とクラスを予測します。この「一度だけ見る」というアプローチにより、極めて高速な処理速度を実現しています。

YOLOv8 アーキテクチャ

YOLOv8 のアーキテクチャは、主に以下の 3 つの部分で構成されています：

バックボーン（Backbone）：入力画像から特徴量を抽出する役割を担います。YOLOv8 では、CSPDarknet をベースに改良された構造が採用されており、C2f モジュールによって効率的な特徴抽出を実現しています。
ネック（Neck）：バックボーンで抽出された特徴量をさらに強化し、異なるスケールの特徴を統合します。PAN-FPN（Path Aggregation Network - Feature Pyramid Network）構造を用いることで、マルチスケールの物体検出性能を向上させています。
ヘッド（Head）：最終的な物体の位置（バウンディングボックス）とクラス確率を予測します。YOLOv8 ではアンカーフリー方式が採用されており、事前に定義したアンカーボックスに依存せず、直接物体の中心座標と幅・高さを予測します。

LOADING

YOLOv8：リアルタイム物体検出の最新モデル

YOLO アーキテクチャの概要