R
Rは、統計分析やデータ可視化に強い言語です。大学や研究、医療、ビジネス分析など、データから傾向を読み取る場面で使われます。
何ができる?
- アンケートや実験データを分析する
- 平均、分散、相関などの統計量を計算する
- グラフでデータを見やすくする
- 予測や比較を行う
- レポートや研究資料を作る
学習ゴール
- ベクトルとデータフレームを説明できる
- 基本的な集計ができる
- CSVファイルを読み込める
ggplot2でグラフを作れる- Pythonとの使い分けをざっくり理解できる
開発環境の準備
| 方法 | 向いている人 |
|---|---|
| RStudio | Rを本格的に学びたい人 |
| Posit Cloud | ブラウザで試したい人 |
| Jupyter Notebook | Pythonと一緒に使いたい人 |
| R Markdown | 分析結果をレポート化したい人 |
Rを学ぶなら、RStudioから始めるとグラフやデータを確認しやすいです。
基本文法
message <- "こんにちは、R"
print(message)
Rでは、代入に <- を使うことが多いです。
ベクトル
scores <- c(80, 95, 72, 88)
mean(scores)
max(scores)
min(scores)
c() は複数の値をまとめる関数です。平均や最大値を簡単に求められます。
データフレーム
students <- data.frame(
name = c("太郎", "花子", "次郎"),
score = c(85, 92, 70)
)
print(students)
データフレームは、表形式のデータです。ExcelやCSVに近い感覚で扱えます。
条件で取り出す
high_scores <- students[students$score >= 80, ]
print(high_scores)
80点以上の行だけを取り出しています。
グラフを作る
ggplot2 を使うと、きれいなグラフを作りやすくなります。
library(ggplot2)
ggplot(students, aes(x = name, y = score)) +
geom_col()
棒グラフ、散布図、折れ線グラフなど、分析結果を見やすく伝えられます。
ライブラリ・関連技術
| 技術 | できること |
|---|---|
| ggplot2 | グラフ作成 |
| dplyr | データ加工 |
| tidyr | データ整形 |
| readr | CSV読み込み |
| R Markdown | 分析レポート作成 |
| Shiny | データ分析アプリ作成 |
Pythonとの使い分け
| 観点 | R | Python |
|---|---|---|
| 得意分野 | 統計分析、可視化、研究 | AI、自動化、Web、分析 |
| 学習対象 | 統計を深く扱いたい人 | 幅広くプログラミングしたい人 |
| グラフ | ggplot2が強い | matplotlibやseaborn |
| 実務 | 研究・分析寄り | 開発・AI寄りにも広い |
どちらが上というより、目的によって選びます。統計レポートや研究寄りならR、AIや自動化も含めて広く使いたいならPythonが選ばれやすいです。
ミニ演習: 平均点とグラフ
scores <- c(80, 95, 72, 88)
average <- mean(scores)
print(average)
次に、名前付きのデータフレームを作って棒グラフにしてみましょう。
よくあるエラーと直し方
| 困ったこと | 原因の例 | 確認すること |
|---|---|---|
| オブジェクトがない | 変数名が違う | スペル |
| パッケージがない | インストールしていない | install.packages |
| CSVが読めない | パスが違う | ファイルの場所 |
| グラフが出ない | データ指定が違う | aes の中身 |
| 結果が想定と違う | 欠損値がある | NA の扱い |
チェックリスト
-
<-で代入できる - ベクトルを作れる
- データフレームを作れる
- 平均や最大値を計算できる
- 条件で行を取り出せる
-
ggplot2の役割を説明できる
次に学ぶこと
Rに慣れたら、統計学の基礎、dplyr、ggplot2、R Markdownを学びましょう。データを集める部分ではSQL、AIや自動化ではPythonと組み合わせると便利です。