忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】言葉の裏の「感情」を読み解く!センチメント分析

テキストデータから「嬉しい」「悲しい」「不満」といった感情の傾向を抽出する。顧客の声をビジネスに活かすための必須技術が、センチメント分析です。

1. 【 問題 】

テキストマイニングにおいて、文章の中から書き手の主観的な感情や態(ポジティブ、ネガティブ、ニュートラルなど)を判定する手法を何と呼ぶでしょうか?

① 形態素解析
② センチメント分析(感情分析)
③ 構文解析
④ トピックモデル


2. 【 解答 】

正解: ② センチメント分析(感情分析)

3. 整理:どうやって「感情」を判定するのか?

センチメント分析には、大きく分けて「辞書ベース」と「機械学習ベース」の2つのアプローチがあります。

【 感情分析の仕組み 】

[ 1. 感情極性辞書による方法 ]
「美味しい」「速い」=ポジティブ (+1)
「壊れた」「遅い」=ネガティブ (-1)
といった辞書を用意し、文章内の単語の合計スコアで判定する。

[ 2. 機械学習による方法 ]
大量の「ポジティブな文章」と「ネガティブな文章」をAIに学習させ、新しい文章の傾向を予測させる。

--------------------------

活用例:
・新商品のTwitter(X)での評判調査
・コールセンターへの問い合わせ内容の自動仕分け
・アンケートの自由記述欄の満足度スコア化

4. 分析の落とし穴

1. 皮肉や二重否定: 「最高に最悪だ」のような皮肉や、「悪くない」といった表現は、単語レベルの辞書だけでは誤判定しやすいため、文脈の理解が求められます。
2. ドメイン(分野)依存: 映画のレビューでの「ヤバい」はポジティブかもしれませんが、医療データでの「ヤバい」は深刻なネガティブです。


5. DS検定形式:実戦4択クイズ

問:センチメント分析において、単語ごとにポジティブ・ネガティブの度合いを数値化したリストのことを何と呼ぶか。

① ストップワードリスト   ② 感情極性辞書   ③ 逆文書頻度   ④ コーパス

【 正解: ② 】

解説: 単語に「感情の極性(プラス・マイナス)」を持たせた辞書です。日本語では「日本語評価極性辞書」などが有名です。


6. まとめ

DS検定において「主観的な感情」「ポジネガ判定」というキーワードが出たら「センチメント分析」です。テキストデータの「量」だけでなく「質」を測るための手法として、しっかりマスターしておきましょう!

PR