【DS検定対策】言葉の裏の「感情」を読み解く!センチメント分析
テキストデータから「嬉しい」「悲しい」「不満」といった感情の傾向を抽出する。顧客の声をビジネスに活かすための必須技術が、センチメント分析です。
1. 【 問題 】
テキストマイニングにおいて、文章の中から書き手の主観的な感情や態(ポジティブ、ネガティブ、ニュートラルなど)を判定する手法を何と呼ぶでしょうか?
① 形態素解析
② センチメント分析(感情分析)
③ 構文解析
④ トピックモデル
2. 【 解答 】
正解: ② センチメント分析(感情分析)
3. 整理:どうやって「感情」を判定するのか?
センチメント分析には、大きく分けて「辞書ベース」と「機械学習ベース」の2つのアプローチがあります。
【 感情分析の仕組み 】
[ 1. 感情極性辞書による方法 ]
「美味しい」「速い」=ポジティブ (+1)
「壊れた」「遅い」=ネガティブ (-1)
といった辞書を用意し、文章内の単語の合計スコアで判定する。
[ 2. 機械学習による方法 ]
大量の「ポジティブな文章」と「ネガティブな文章」をAIに学習させ、新しい文章の傾向を予測させる。
--------------------------
◎ 活用例:
・新商品のTwitter(X)での評判調査
・コールセンターへの問い合わせ内容の自動仕分け
・アンケートの自由記述欄の満足度スコア化
「美味しい」「速い」=ポジティブ (+1)
「壊れた」「遅い」=ネガティブ (-1)
といった辞書を用意し、文章内の単語の合計スコアで判定する。
[ 2. 機械学習による方法 ]
大量の「ポジティブな文章」と「ネガティブな文章」をAIに学習させ、新しい文章の傾向を予測させる。
--------------------------
◎ 活用例:
・新商品のTwitter(X)での評判調査
・コールセンターへの問い合わせ内容の自動仕分け
・アンケートの自由記述欄の満足度スコア化
4. 分析の落とし穴
1. 皮肉や二重否定: 「最高に最悪だ」のような皮肉や、「悪くない」といった表現は、単語レベルの辞書だけでは誤判定しやすいため、文脈の理解が求められます。
2. ドメイン(分野)依存: 映画のレビューでの「ヤバい」はポジティブかもしれませんが、医療データでの「ヤバい」は深刻なネガティブです。
5. DS検定形式:実戦4択クイズ
問:センチメント分析において、単語ごとにポジティブ・ネガティブの度合いを数値化したリストのことを何と呼ぶか。
① ストップワードリスト ② 感情極性辞書 ③ 逆文書頻度 ④ コーパス
【 正解: ② 】
解説: 単語に「感情の極性(プラス・マイナス)」を持たせた辞書です。日本語では「日本語評価極性辞書」などが有名です。
6. まとめ
DS検定において「主観的な感情」「ポジネガ判定」というキーワードが出たら「センチメント分析」です。テキストデータの「量」だけでなく「質」を測るための手法として、しっかりマスターしておきましょう!
PR