MY BLOG

2026/5/23

LangChainの基本使い方

AI 2025/8/30

Deep Learning 機械学習 AI 人工知能深層学習 machine learning LLM 大規模言語モデル

LangChainの基本的な使い方について解説しており、LLM（大規模言語モデル）が人間のようにテキストを解釈・生成できる強力なAIツールであることを紹介し、コンテンツ作成、言語翻訳、要約、質問応答など多様なタスクに活用できることを述べています。記事では、メッセージ（HumanMessage、AIMessage、SystemMessage）、モデル（OllamaLLM、init_chat_modelなど）、ツール（@toolデコレーターを使ったカスタムツール定義）、エージェント（create_agentによる作成）、ストリームモード（updates、messages、customモード）、出力構造化（ToolStrategy、ProviderStrategy）、短期記憶（checkpointerによる会話履歴の保存）など、LangChainの主要な構成要素について詳細なコード例を交えて説明しています。

YOLOv8 リアルタイム物体検出2（高度技術解析：Anchor-Free Object Detection / DFL / TAL）

AI 2024/7/17

Deep Learning PyTorch Python 機械学習 AI 人工知能深層学習 Object Detection 物体検出 YOLO リアルタイム検出

YOLOv8の高度な機能と技術的詳細を解説します。検出ヘッド、Distribution Focal Loss (DFL)、Task-Aligned Assigner (TOOD/TAL) などの先進的な概念について深く掘り下げます。

YOLOv8 リアルタイム物体検出1 (基礎)

AI 2024/7/11

Deep Learning PyTorch Python 機械学習 AI 人工知能深層学習 Object Detection 物体検出 YOLO リアルタイム検出

YOLOv8 は、2023 年に Ultralytics によってリリースされた最新のリアルタイム物体検出モデルです。アンカーフリー方式を採用し、バックボーンネットワークに C2f モジュールを導入することで、精度と速度の両面で大幅な改善を実現しました。本記事では、YOLOv8 のアーキテクチャ、新機能、および実装について詳しく解説します。

SVDとPCAの本質

AI 2024/6/14

Deep Learning 機械学習 AI 人工知能深層学習 machine learning

PCAの本質は、元のデータにPCAを適用した後、得られる結果の共分散行列の各方向の分散を最大限にし、共分散をゼロにすることにあると説明されています。これは、座標系の変換により、第1主成分に第1の分散が集中し、第2主成分に第2の分散が集中することを意味します。

MobileNetシリーズの説明

AI 2024/5/11

Deep Learning 機械学習 AI 人工知能深層学習 CNN 画像認識画像分類 image classification mobilenet

MobileNetは、モバイル機器や組み込み機器向けの効率的なCNNモデルシリーズで、V1では計算コストを大幅に削減するDepthwise Separable Convolution（DSC）を導入し、V2ではInverted Residual BlockとLinear Bottleneckにより精度と効率のバランスを改善、V3ではSE Blockとh-swish活性化関数を活用してさらに性能を向上させている。

ConvNeXt解読

AI 2024/5/10

Deep Learning 機械学習 AI 人工知能深層学習 CNN 画像認識画像分類 image classification

ConvNeXtは、特に新しい構造やイノベーションがあるわけではなく、既存のネットワークで使われている細かい設計要素を適切に組み合わせることで、ImageNetのTop-1精度を向上させました。この設計の動機は非常にシンプルで、「TransformerやSwin-Transformerがどのようにしているかを参考にして、効果があれば採用する」という方針に従っています。

Swin Transformer

AI 2024/4/11

Deep Learning 機械学習 AI 人工知能深層学習画像処理画像認識画像分類 Computer Vision transformer swin transformer image classiftion

Microsoft Researchが開発したSwin Transformer（Shifted Window Transformer）について詳しく解説しています。従来のVision Transformerが抱える計算複雑性と局所特徴捕捉の問題を解決するために、ウィンドウベースのアテンションメカニズムと階層的な特徴処理を導入したモデルです。ブログでは、Patch Embedding、Window Partition、W-MSA、SW-MSA、PatchMergingなどの中核コンポーネントを図解とコード例を交えて詳細に説明し、Swin Transformerがどのようにして計算効率と性能のバランスを実現しているかを分かりやすく紹介しています。

Vision Transformer(ViT)

AI 2024/4/10

Deep Learning 機械学習 AI 人工知能深層学習画像認識画像分類 image classification transformer ViT

Vision Transformer（ViT）が画像認識において空間的な局所性や平移等価性といった帰納的バイアスを明示的に持たないことによる課題を指摘しつつも、大規模データでの学習を通じてAttention機構がこれらの問題を補完できると述べています。また、モデルの性能は構造だけでなくデータ量にも依存しており、十分なデータがあればTransformer系のモデルでも優れた結果が得られると強調しています。要するに、「ViTは帰納的バイアスが弱いが、データがあればその欠点を克服できる」という主張がまとめられます。

遅延バインディング (late binding)

Python 2024/4/9

Python

遅延バインディング (late binding) についての記事です。Pythonでよく見かける問題と、それを解決する方法を紹介します。

LOADING

MY BLOG

個人技術ブログ

LangChainの基本使い方

YOLOv8 リアルタイム物体検出2（高度技術解析：Anchor-Free Object Detection / DFL / TAL）

YOLOv8 リアルタイム物体検出1 (基礎)

SVDとPCAの本質

MobileNetシリーズの説明

ConvNeXt解読

Swin Transformer

Vision Transformer(ViT)

遅延バインディング (late binding)