LOADING

読み込みが遅い場合はキャッシュを有効にしてください。ブラウザはデフォルトで有効になっています

YOLOv8:リアルタイム物体検出の最新モデル

YOLO アーキテクチャの概要

YOLO(You Only Look Once)は、2016 年に Joseph Redmon らによって提案されたワンステージ型の物体検出アルゴリズムです。従来の物体検出手法とは異なり、YOLO は画像全体を一度だけ評価して、直接物体の位置とクラスを予測します。この「一度だけ見る」というアプローチにより、極めて高速な処理速度を実現しています。

YOLOv8 アーキテクチャ

YOLOv8 のアーキテクチャは、主に以下の 3 つの部分で構成されています:

  1. バックボーン(Backbone):入力画像から特徴量を抽出する役割を担います。YOLOv8 では、CSPDarknet をベースに改良された構造が採用されており、C2f モジュールによって効率的な特徴抽出を実現しています。

  2. ネック(Neck):バックボーンで抽出された特徴量をさらに強化し、異なるスケールの特徴を統合します。PAN-FPN(Path Aggregation Network - Feature Pyramid Network)構造を用いることで、マルチスケールの物体検出性能を向上させています。

  3. ヘッド(Head):最終的な物体の位置(バウンディングボックス)とクラス確率を予測します。YOLOv8 ではアンカーフリー方式が採用されており、事前に定義したアンカーボックスに依存せず、直接物体の中心座標と幅・高さを予測します。

avatar
lijunjie2232
個人技術ブログ
My Github
目次0