忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【実習】RとRStudioのセットアップ!「環境構築」が分析のスタートライン

データ分析の第一歩は、道具を揃えることです。この記事では、Windows 11環境にRとRStudioをインストールし、最初のプログラムを動かすまでの手順を解説します。

1. 実習:R本体のインストール

【 手順 】 まずは計算エンジンとなる「R」をインストールします。最新版(4.5.1)を導入しましょう。

[ R本体のセットアップ ]

1.ダウンロード
 → CRAN公式サイトからWindows用を保存

2.実行ファイル
 → R-4.5.1-win.exe を起動

3.設定
 → すべて「デフォルト」のまま完了させる

2. 実習:RStudioのインストール

【 手順 】 次に、Rを使いやすくする画面(IDE)である「RStudio」を導入します。

[ RStudioのセットアップ ]

1.ダウンロード
 → Posit公式サイトから保存

2.実行ファイル
 → RStudio-2025.05.1-513.exe を起動

3.確認
 → スタートメニューから「RStudio」が起動すればOK!

3. 初めてのコード:Rのコメント文法

プログラムの中にメモを残す「コメント」の使い方を確認しましょう。Rでは #(シャープ)を使います。

【 サンプルコード 】

# ここは、コメントです(実行されません)

a <- 1
print(a)

【 実行結果 】

[1] 1


4. まとめ

環境構築ができれば、あとはデータを読み込んで分析するだけです!RStudioの画面上で # を使ってメモを残しながら、少しずつコードに慣れていきましょう。

PR

【DS検定対策】コイン投げの確率を攻略!「パターンの列挙」が合格のカギ

数字だけで説明されると難しく感じる確率の問題も、分解して整理してみると驚くほどスッと頭に入ります。この記事では、コインを5回投げる問題を題材に、DS検定の頻出項目である「反復試行」の考え方を解説します。

1. 問題:コインを5回投げる

【 問題 】 10円玉を5回投げたとき、表が「ちょうど3回だけ」出る確率はいくらでしょうか? ① 3/16 ② 5/16 ③ 1/2 ④ 5/32

2. 整理:5回中3回が「表」になる世界

確率を解くコツは、まず「全パターンの数(分母)」と「ターゲットの数(分子)」を正確に把握することです。

【 世界の切り出し 】

[ 全体の世界(分母) ]
2の5乗(2×2×2×2×2)= 32通り

[ ターゲット(分子):5回中3回が表 ]
・(表,表,表,裏,裏)
・(表,表,裏,表,裏)
・(表,裏,表,表,裏)
 ……(中略)……

組み合わせ(5C3): 10通り

--------------------------

確率: 10 / 32 = 5 / 16

3. 計算プロセス

1. 分母を出す: 1回ごとに2通りなので、5回投げると 32通り。 2. 分子を出す: 5つの場所から、表が入る3カ所を選ぶ「組み合わせ」を考えます。  5C3 = (5×4×3) / (3×2×1) = 10通り。 3. 答えを出す: 10/32 を約分して 5/16


4. DS検定形式:実戦4択クイズ

問:このように「結果が2つしかない試行(コインの表裏など)」を独立に繰り返すことを、統計学で何と呼ぶか。

① ポアソン試行 ② ベルヌーイ試行 ③ 正規分布 ④ カイ二乗試行

【 正解: ② 】

解説: コイン投げのように、結果が2通りしかない試行を「ベルヌーイ試行」と呼びます。これを繰り返したときの確率分布が「二項分布」であり、DS検定の超重要ワードです。


5. まとめ

DS検定では「5C3」のような計算が突然出てきますが、基本は「全パターンのうち、何通りあるか」という数え上げです。図やボックスで世界を整理する癖をつけましょう!



【DS検定対策】セキュリティの3要素を攻略!「CIA」はアメリカの機関だけじゃない?

文字だけで覚えると忘れやすいセキュリティ用語も、インパクトのある略称とセットで整理すれば、驚くほどスッと頭に入ります。この記事では、情報セキュリティの基本中の基本である「3要素(CIA)」について解説します。

1. 問題:セキュリティの3要素

【 問題 】 情報セキュリティの3要素(CIA)に当てはまらないものは、次のうちどれでしょうか?

① 機密性 (Confidentiality) ② 完全性 (Integrity) ③ 可用性 (Availability) ④ 効率性 (Efficiency)

2. 整理:アメリカの機関と同じ?「CIA」の正体

セキュリティの世界には「CIA」という超重要な3要素があります。アメリカの中央情報局(CIA)と同じ略称なので、セットで覚えるのが合格への近道です!

【 セキュリティの世界:CIA 】

[ 3要素の頭文字 ]

1. Confidentiality(機密性)
 → 許可された人だけが見れる「秘密」を守る

2. Integrity(完全性)
 → 改ざんされず「完璧(正しい)」な状態を保つ

3. Availability(可用性)
 → 必要な時に「いつでも(Available)」使える

--------------------------

× 効率性などは、この「CIA」には含まれません。

3. 確認プロセス

1. 機密性(C): 情報を「秘密」に保つこと。パスワード管理や暗号化がこれにあたります。 2. 完全性(I): 情報が「正確(インテリ)」であること。勝手に書き換えられないよう守ります。 3. 可用性(A): サービスを「止めない」こと。いつでも利用可能な状態を維持する力です。


4. DS検定形式:実戦4択クイズ

問:システム障害やサイバー攻撃によって、サービスが停止して使えなくなってしまうことは、セキュリティ3要素のどれが損なわれた状態か。

① 機密性 ② 完全性 ③ 可用性 ④ 効率性

【 正解: ③ 】

解説: 「いつでも使えること」を指すのが「可用性(アベイラビリティ)」です。システムがダウンして使えなくなることは、この可用性が損なわれた状態を指します。


5. まとめ

DS検定では、この「CIA」という言葉が非常によく出てきます!「アメリカの情報機関と同じ名前」として、その3つの柱をセットで覚えておきましょう。



【DS検定対策】「サイコロ2個の和」を図解で攻略!「世界の全列挙」が合格のカギ

数字だけで説明されると難しく感じる確率の問題も、図にしてみると驚くほどスッと理解できます。この記事では、サイコロ2個を題材に、DS検定の基本である「場合の数(全パターン)」の数え上げを解説します。

1. 問題:2個のサイコロの合計

【 問題 】 大小2個のサイコロを同時に投げて、目の和が10になるのは、何通りあるでしょうか?

2. 図解:「和が10」になる世界の書き出し

確率や場合の数を解くコツは、まず「条件に合うパターン」を漏れなく、重複なく並べることです。

【 図解イメージ 】

[ 大の目 ] + [ 小の目 ] = 10

1.【 4 】+【 6 】── ◎ターゲット
2.【 5 】+【 5 】── ◎ターゲット
3.【 6 】+【 4 】── ◎ターゲット

--------------------------

合計: 3通り

--------------------------

※【 3 】+【 7 】などは存在しないため除外

3. 計算プロセス

1. 大きいサイコロを基準にする: 1〜3では、小さい方が7以上必要なので作れません。 2. パターンを書き出す: 4が出たとき(6)、5が出たとき(5)、6が出たとき(4)の3つです。 3. 答えを出す: 図の通り 3通り


4. DS検定形式:実戦4択クイズ

問:大小2個のサイコロを投げたとき、起こりうるすべての結果(分母)は何通りあるか。

① 12通り ② 24通り ③ 36通り ④ 48通り

【 正解: ③ 】

解説: 1個目が6通り、2個目も6通りなので、6 × 6 = 36通りが「世界(分母)のすべて」になります。今回の「和が10になる確率」を問われた場合は、3/36 = 1/12 となります。


5. まとめ

DS検定では「何通りか?」という問いに対して、図を書いて丁寧に数え上げることが大切です!「大きい方を固定して考える」など、自分なりのルールで世界を整理しましょう。




【DS検定対策】「転職確率」を図解で攻略!「重なりの引き算」が合格のカギ

数字だけで説明されると難しく感じる確率の問題も、図にしてみると驚くほどスッと理解できます。この記事では、転職を題材に、DS検定の頻出項目である「和事象(AまたはB)」の重なりを解説します。

1. 問題:AさんとBさんの転職

【 問題 】 Aさん、Bさんが転職を考えています。Aさんが転職する確率は 0.3、Bさんが転職する確率も 0.3 です。また、両方が転職する確率は 0.1 です。このとき、少なくとも1人が転職する確率はいくらでしょうか?

2. 図解:「少なくとも」は世界の切り出し

確率を解くコツは、まず「すべてのパターン(世界)」を整理して、重なっている部分を正しく引くことです。

【 図解イメージ 】

[ 全体の世界 ]

1.【 Aさんのみ転職 】── 0.2
2.【 Bさんのみ転職 】── 0.2
3.【 両方が転職 】──── 0.1 (重なり)

--------------------------

◎【 少なくとも1人 】── 0.5

--------------------------

4.【 誰も転職しない 】── (0.5)

3. 計算プロセス

1. 単純に足してみる: A(0.3) + B(0.3) = 0.6。これでは「両方」が2回数えられています。

2. 重なりを引く: 0.6 から両方の 0.1 を引きます。

3. 答えを出す: 0.3 + 0.3 - 0.1 = 0.5


4. DS検定形式:実戦4択クイズ

問:事象Aと事象Bが同時に起こる確率(今回なら両方の転職)がある場合、P(A ∪ B) = P(A) + P(B) - P(A ∩ B) という公式で計算する。この「重なり」を引く必要がある考え方を何と呼ぶか。

① 条件付き確率 ② 加法定理(かほうていり) ③ 独立試行 ④ 期待値


【 正解: ② 】

解説: 「AまたはB」の確率を求める際、重なりがある場合はその重複分を引かなければなりません。図解で見ると、真ん中の「0.1」を引くことで、正しく世界の合計(0.5)が算出できることがわかります。


5. まとめ

DS検定では「少なくとも」や「または」が出た際、それらが重なっているかどうかが分かれ道です!図を書いて、重なりを1回分引くことを忘れないようにしましょう。