【DS検定対策】サブスクビジネスの命綱!顧客の離脱を防ぐ「チャーン分析」
新規顧客を獲得するよりも、既存の顧客に長く続けてもらう方がコストを低く抑えられます。顧客がサービスを解約(離脱)する予兆をデータから予測する手法が、チャーン分析です。
1. 【 問題 】
サブスクリプション型のサービスや会員制ビジネスにおいて、顧客が契約を解除したりサービスを利用しなくなったりする「解約・離脱」の行動やその確率を、過去の利用履歴データ(アクセス頻度、契約期間、サポートへの問い合わせ回数など)から予測・分析する手法を何と呼ぶでしょうか?
① バスケット分析
② チャーン分析(解約・離脱分析)
③ アソシエーション分析
④ ABC分析
2. 【 解答 】
3. 整理:チャーン分析で「予測の手がかり」となるデータ(特徴量)
顧客が解約する前には、高確率で行動に「サイン(変化)」が現れます。データサイエンティストは以下のような特徴量をモデルに投入して予測を行います。
| データカテゴリ | 解約の予兆(フラグ)となりやすい変化 |
|---|---|
| 1. 利用頻度の減少 | 「ログイン回数が先月比で急激に減った」「動画の視聴時間が短くなった」など、サービスへのエンゲージメント(熱量)の低下。 |
| 2. 顧客属性・契約プラン | 「無料トライアル期間の終了間際」「特定のキャンペーン経由で入会した」など、元からの定着度の低さ。 |
| 3. ネガティブな体験 | 「システムの不具合(エラー)を何度も経験した」「カスタマーサポートに複数回クレームや問い合わせを入れている」など。 |
★ データサイエンティストの戦い方:
これまでに学んだ「LightGBM」や「ロジスティック回帰」などの機械学習アルゴリズムを用いて、「この顧客はあと1ヶ月以内に80%の確率で解約する」といった予測を算出します。マーケティングチームはその予測を基に、解約されそうなユーザーだけに限定してクーポンを配信する、といった効率的な引き止め施策を打ちます。
5. DS検定形式:実戦4択クイズ
問:チャーン予測モデルを構築した際、すでに解約してしまった過去のユーザーのデータだけを分析対象とし、途中でプランを変更したユーザーや現在も継続しているユーザーの行動ログを除外してモデルを評価した。このときに警戒すべき、以前の講義で学んだデータの偏り(バイアス)として最も適切なものはどれか。
① 自己選択バイアス ② 脱落バイアス ③ 出版バイアス ④ 確定バイアス
【 正解: ② 】
解説: 解約という「途中の離脱(脱落)」が起きた結果のデータだけを後から見て、そのプロセス(時間の経過に伴う変化)や現役ユーザーとの違いを無視して集計すると、正しい予測ルールが作れなくなります。まさに脱落バイアスへの配慮が必要な典型例です。
6. まとめ
DS検定において「顧客の解約・離脱を予測・分析する手法」という主旨の問題が出たら、迷わず「チャーン分析」を選択しましょう。実務において、機械学習モデルが企業の売上守備を固めるための最たる応用例ですので、ビジネス理解とセットでしっかりと押さえておきましょう!