【DS検定対策】画像認識の要！CNNを構成する「2つの層」の役割とは？

画像認識の分野で驚異的な精度を発揮する「畳み込みニューラルネットワーク（CNN）」。その最大の特徴は、画像の特徴を抽出するために特殊な2つの層を交互に積み重ねる構造にあります。

1. 【問題】

画像認識などに用いられる「畳み込みニューラルネットワーク（CNN）」は、主にどのような役割を持つ2つの層を交互に積み重ねた構造を指すでしょうか？

① 入力層と出力層
② 畳み込み層とプーリング層
③ 回帰層と分類層
④ 活性化層と損失層

2. 【解答】

正解： ② 畳み込み層とプーリング層

3. 整理：CNNを支える「2つのエンジン」

CNNは、人間の視覚野の仕組みをモデルにしており、「特徴を見つける作業」と「情報を凝縮する作業」を繰り返します。

【 CNNの構造イメージ】

[ 1. 畳み込み層 (Convolution Layer) ]

→ 「特徴を抽出する」

フィルタ（カーネル）を画像に滑らせ、エッジ（輪郭）などの特徴を抜き出します。

[ 2. プーリング層 (Pooling Layer) ]

→ 「情報を圧縮・頑健にする」

抽出した特徴の位置ズレを許容し、データを小さくします（Maxプーリングなど）。

--------------------------

◎ このセットを何度も繰り返した後、最後に「全結合層」で何の画像かを分類します。

4. なぜこの構造が必要なのか？

1. 局所的な特徴の把握: 画像全体を一度に見るのではなく、小さな領域（フィルタ）ごとに見ることで、複雑な形を捉えられます。
2. 位置不変性: 対象物が画像の中央にあっても端にあっても、正しく「同じもの」だと認識できるようになります（プーリング層の功績）。

5. DS検定形式：実戦4択クイズ

問：畳み込み層において、画像から特徴を抽出するために使用される小さな行列のことを何と呼ぶか。

① ニューロン ② カーネル（フィルタ） ③ バイアス ④ 重み減衰

【正解： ② 】

解説： 画像の上をスライドさせながら計算を行う小さな行列を「カーネル」または「フィルタ」と呼びます。このカーネル内の数値を学習によって最適化していくのが、CNNの学習プロセスです。

6. まとめ

DS検定において「CNNの構造」を問われたら、まずは「畳み込み層」と「プーリング層」のセットを思い出しましょう。「畳み込みで特徴を見つけ、プーリングでまとめる」という一連の流れを理解しておくことが、深層学習攻略の第一歩です！