メインコンテンツまでスキップ

R

Rは、統計分析やデータ可視化に強い言語です。大学や研究、医療、ビジネス分析など、データから傾向を読み取る場面で使われます。

何ができる?

  • アンケートや実験データを分析する
  • 平均、分散、相関などの統計量を計算する
  • グラフでデータを見やすくする
  • 予測や比較を行う
  • レポートや研究資料を作る

学習ゴール

  • ベクトルとデータフレームを説明できる
  • 基本的な集計ができる
  • CSVファイルを読み込める
  • ggplot2 でグラフを作れる
  • Pythonとの使い分けをざっくり理解できる

開発環境の準備

方法向いている人
RStudioRを本格的に学びたい人
Posit Cloudブラウザで試したい人
Jupyter NotebookPythonと一緒に使いたい人
R Markdown分析結果をレポート化したい人

Rを学ぶなら、RStudioから始めるとグラフやデータを確認しやすいです。

基本文法

message <- "こんにちは、R"
print(message)

Rでは、代入に <- を使うことが多いです。

ベクトル

scores <- c(80, 95, 72, 88)

mean(scores)
max(scores)
min(scores)

c() は複数の値をまとめる関数です。平均や最大値を簡単に求められます。

データフレーム

students <- data.frame(
name = c("太郎", "花子", "次郎"),
score = c(85, 92, 70)
)

print(students)

データフレームは、表形式のデータです。ExcelやCSVに近い感覚で扱えます。

条件で取り出す

high_scores <- students[students$score >= 80, ]
print(high_scores)

80点以上の行だけを取り出しています。

グラフを作る

ggplot2 を使うと、きれいなグラフを作りやすくなります。

library(ggplot2)

ggplot(students, aes(x = name, y = score)) +
geom_col()

棒グラフ、散布図、折れ線グラフなど、分析結果を見やすく伝えられます。

ライブラリ・関連技術

技術できること
ggplot2グラフ作成
dplyrデータ加工
tidyrデータ整形
readrCSV読み込み
R Markdown分析レポート作成
Shinyデータ分析アプリ作成

Pythonとの使い分け

観点RPython
得意分野統計分析、可視化、研究AI、自動化、Web、分析
学習対象統計を深く扱いたい人幅広くプログラミングしたい人
グラフggplot2が強いmatplotlibやseaborn
実務研究・分析寄り開発・AI寄りにも広い

どちらが上というより、目的によって選びます。統計レポートや研究寄りならR、AIや自動化も含めて広く使いたいならPythonが選ばれやすいです。

ミニ演習: 平均点とグラフ

scores <- c(80, 95, 72, 88)

average <- mean(scores)
print(average)

次に、名前付きのデータフレームを作って棒グラフにしてみましょう。

よくあるエラーと直し方

困ったこと原因の例確認すること
オブジェクトがない変数名が違うスペル
パッケージがないインストールしていないinstall.packages
CSVが読めないパスが違うファイルの場所
グラフが出ないデータ指定が違うaes の中身
結果が想定と違う欠損値があるNA の扱い

チェックリスト

  • <- で代入できる
  • ベクトルを作れる
  • データフレームを作れる
  • 平均や最大値を計算できる
  • 条件で行を取り出せる
  • ggplot2 の役割を説明できる

次に学ぶこと

Rに慣れたら、統計学の基礎、dplyrggplot2、R Markdownを学びましょう。データを集める部分ではSQL、AIや自動化ではPythonと組み合わせると便利です。