忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

TF-IDF処理


・文章の特徴量として、文章ベクトルを利用する

・文章ベクトルは、TFとIDFの値の組

・TF(Term Frequenc )処理は、多く出現する単語は重要である

という前提に基づく

・IDF(Inverse Document Frequency)処理は、ある安吾が

出現する文書の数が少ないほど、より大きな値を与えるもの



PR