【DS検定対策】好みを予測する!「協調フィルタリング」の仕組み
「自分と好みが似ているあの人が買ったなら、私も好きかも」。そんな直感を計算式に落とし込んだのが協調フィルタリングです。
1. 【 問題 】
レコメンドシステムにおいて、多くのユーザーの行動履歴(購入、閲覧、評価など)を蓄積し、対象ユーザーと行動パターンが似ている他のユーザーのデータを用いて商品を推奨する手法を何と呼ぶでしょうか?
① コンテンツベースフィルタリング
② 協調フィルタリング
③ 決定木分析
④ 主成分分析
2. 【 解答 】
正解: ② 協調フィルタリング
3. 整理:2つの主要なアプローチ
協調フィルタリングには、何を基準に「似ている」と判定するかで2つの形式があります。
【 協調フィルタリングの分類 】
[ 1. ユーザーベース ]
あなたと「購買履歴が似ているAさん」を探し、Aさんが買ってあなたがまだ買っていないものを勧める。
[ 2. アイテムベース ]
商品Aを買った人は商品Bも買う傾向がある場合、商品Aを買ったあなたに商品Bを勧める。
--------------------------
◎ 特徴: 商品の中身(色や形、スペック)を知らなくても、ユーザーの「行動」さえあればレコメンドできるのが強みです。
あなたと「購買履歴が似ているAさん」を探し、Aさんが買ってあなたがまだ買っていないものを勧める。
[ 2. アイテムベース ]
商品Aを買った人は商品Bも買う傾向がある場合、商品Aを買ったあなたに商品Bを勧める。
--------------------------
◎ 特徴: 商品の中身(色や形、スペック)を知らなくても、ユーザーの「行動」さえあればレコメンドできるのが強みです。
4. 覚えておくべき課題「コールドスタート」
協調フィルタリングには最大の弱点があります。それは、「データが少ない新規ユーザーや新商品にはレコメンドができない」という点です。これを「コールドスタート問題」と呼び、DS検定の頻出キーワードとなっています。
5. DS検定形式:実戦4択クイズ
問:ユーザーの属性や商品の特徴(色、ジャンル、テキスト説明など)そのものを分析してレコメンドを行う、協調フィルタリングとは異なる手法はどれか。
① ユーザーベース法 ② アイテムベース法 ③ 内容ベース(コンテンツベース)フィルタリング ④ 行列分解法
【 正解: ③ 】
解説: 「好みが似ている人」ではなく「商品そのものの特徴」に注目するのが内容ベース(コンテンツベース)です。両者を組み合わせた「ハイブリッド型」も実務ではよく使われます。
6. まとめ
DS検定において「ユーザーの行動履歴」「似たユーザーのパターン」という記述が出たら「協調フィルタリング」です。新米ユーザーには効かない「コールドスタート問題」とセットで覚えておきましょう!
PR