交差検証 5-2.データ前処理と評価指標 2025年07月05日 0 データを分割し、一部でモデルを作成し(訓練データ)、残るデータでテスト評価を行う(評価用データ)。1.ホールドアウト法データを訓練用データ(例:全体のデータの70%)、評価用データ(例:全体のデータの30%)に2分割する。2. k分割法・学習用データをk個に分割・k個のうち、1つを評価用データ、残りを学習用データとして、学習・評価をk回実行する。 PR
CRISP-DM 3-1.データマイニングの概要 2025年07月05日 0 データマイニングの標準的なプロセス。次のようなライフサイクルとなる。1.ビジネスの理解プロジェクトの目的や要求を、ビジネスの視点から理解する。それをデータマイニングの問題として定義する。2.データの理解データを集め、データの品質向上や、利用するデータの特定を行う。3.データの準備データのクリーニングなどを行い、データセットを準備する。4.モデリングいろいろなモデルで、いろいろなパラメータでの施行を行う。5.評価6.ディプロイメント
名義尺度、順序尺度、間隔尺度、比例尺度 40統計・統計分析 2025年06月25日 0 データの種類を表す。このデータの種類により、分析手法も異なってくる1.名義尺度・「男性には1、女性には2」の「1」「2」・ラベルとしては、機能するが、大小比較等、数字には、意味がない・カテゴリーデータとも呼ばれる・2つの値をとるとき、二値データとも呼ばれる・四則演算は、できない・例としては、性別、○○分類、背番号、血液型、天気2.順序尺度・「理解できたは1、少し理解できたは2、理解できないは3」の「1」「2」「3」・順番には意味があるが、「1と2の差」と「2と3の差」が同じ程度か、どうかには、意味がない3.間隔尺度・順番と間隔に意味がある・華氏の温度が例 10度と20度の差は、15度と25度の違いに等しい・加減には意味があるが、乗法や除法には、意味がない・例としては、知能指数4.比例尺度・間隔尺度に、自然数の0が加わる・年齢があてはまる・加減乗除が可能なデータ・例としては 長さ、重さ、時間、体重、身長、売上高、費用・長さは比例尺度であり、温度は間隔尺度である 4mは、2mの2倍という言い方ができる 摂氏4℃の気温は、2℃の2倍暑いという言い方はできない
クロニクル Visual Studio code で Python #--クロニクル 2025年06月25日 0 windwos10です。Visual Studio code と Python は、インストール済みとします。1.拡張機能のインストールVisual Studio codeでPython extention Packを拡張機能で検索して、インストールしました<h3>2.設定</h3>Visual Studio codeの[ファイル]-[ユーザ設定]-[設定]メニュで[拡張機能]-[Python]を選択以下を設定しました2.Python Pathコマンドプロンプトでwhere pythonで出力されたC:\Users\・・・\Anaconda3\python.exeを指定しました。<h3>3.確認</h3>次のようなコードを、Visual Studio codeで作成し、保存します。(sample1.py)print("hello world")Visual Studio codeの[実行]-[デバグの開始]を選択すると[デバグの構成の選択]が上がってくるのでPython File を選択しました。Visual Studio codeのターミナルにhello worldが表示されました。