忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】好みを予測する!「協調フィルタリング」の仕組み

「自分と好みが似ているあの人が買ったなら、私も好きかも」。そんな直感を計算式に落とし込んだのが協調フィルタリングです。

1. 【 問題 】

レコメンドシステムにおいて、多くのユーザーの行動履歴(購入、閲覧、評価など)を蓄積し、対象ユーザーと行動パターンが似ている他のユーザーのデータを用いて商品を推奨する手法を何と呼ぶでしょうか?

① コンテンツベースフィルタリング
② 協調フィルタリング
③ 決定木分析
④ 主成分分析


2. 【 解答 】

正解: ② 協調フィルタリング

3. 整理:2つの主要なアプローチ

協調フィルタリングには、何を基準に「似ている」と判定するかで2つの形式があります。

【 協調フィルタリングの分類 】

[ 1. ユーザーベース ]
あなたと「購買履歴が似ているAさん」を探し、Aさんが買ってあなたがまだ買っていないものを勧める。

[ 2. アイテムベース ]
商品Aを買った人は商品Bも買う傾向がある場合、商品Aを買ったあなたに商品Bを勧める。

--------------------------

特徴: 商品の中身(色や形、スペック)を知らなくても、ユーザーの「行動」さえあればレコメンドできるのが強みです。

4. 覚えておくべき課題「コールドスタート」

協調フィルタリングには最大の弱点があります。それは、「データが少ない新規ユーザーや新商品にはレコメンドができない」という点です。これを「コールドスタート問題」と呼び、DS検定の頻出キーワードとなっています。


5. DS検定形式:実戦4択クイズ

問:ユーザーの属性や商品の特徴(色、ジャンル、テキスト説明など)そのものを分析してレコメンドを行う、協調フィルタリングとは異なる手法はどれか。

① ユーザーベース法   ② アイテムベース法   ③ 内容ベース(コンテンツベース)フィルタリング   ④ 行列分解法

【 正解: ③ 】

解説: 「好みが似ている人」ではなく「商品そのものの特徴」に注目するのが内容ベース(コンテンツベース)です。両者を組み合わせた「ハイブリッド型」も実務ではよく使われます。


6. まとめ

DS検定において「ユーザーの行動履歴」「似たユーザーのパターン」という記述が出たら「協調フィルタリング」です。新米ユーザーには効かない「コールドスタート問題」とセットで覚えておきましょう!


PR