-
-
Notifications
You must be signed in to change notification settings - Fork 0
/
index.qmd
102 lines (66 loc) · 5.73 KB
/
index.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
# 前書き {.unnumbered}
このページは徳島大学[デザイン型AI教育研究センター](https://www.tokushima-u.ac.jp/ai/)が
開催する、**小中高生を対象にした「とくぽんAI塾 2023」のコースの一つである「データ分析入門」**
の資料置き場です。
コースは基礎編と発展編の2つに分けられます。基礎編では、データ分析に必要な知識・背景の理解のための
素養を身につけることを目指します。発展編ではデータ分析の問題への挑戦として、回帰と分類問題について
取り組みます。
このコースでは、基礎から発展まで通して{{< fa brands r-project >}} [R言語](http://cran.r-project.org)を使ったデータ分析を行います。
まずデータ分析についての大まかな内容とデータ分析で扱われる課題について[第1章](intro.qmd)で学びます。
次に[第2章](data.qmd)では、データの種類と扱い方、表現方法を身につけます。
[第3章](summary_statistics.qmd)ではデータを<ruby>要約<rt>ようやく</rt></ruby>し、伝えやすくするための方法を紹介します。
ここでは特に1つの<ruby>変数<rt>へんすう</rt></ruby>について扱います。
[第4章](correlation.qmd)は2つの変数の関係を調べるための相関について理解を深めます。
基礎編の最終章となる[第5章](visualization.qmd)では、データ分析に欠かせないデータのグラフ化、可視化のノウハウを学びます。
ここでは一般的な統計グラフの他に地図による表現についても紹介します。
続く発展編では、[回帰](regression.qmd)と[分類](classification.qmd)についてそれぞれ課題を設定し、Rによるプログラミングとその出力の理解を目指します。
**一部の内容・概要を[スライド](https://speakerdeck.com/s_uryu/tokupon-ds2022)として用意しています**。こちらもご覧ください。
## 想定する読者
高等学校情報科における共通必履修科目「情報Ⅰ」を学習する高校生、また将来学習することになる中学生。
データ分析について簡易な内容で学びたい社会人
### ここでは扱わない内容
- 統計の基礎となる確率
- データ分析に欠かせない行列、線形代数
- Rプログラムの解説... [付録](r_intro.qmd)で簡単なR言語の導入を行いますが、コース内でのRコードの説明は最小限にとどめています。Rについて詳しく知りたい方は[付録](r_intro.qmd)および[付録の参考文献](r_intro.qmd#参考文献url)をご覧ください。
初歩の数学の範囲で説明可能な内容を扱うことを目指します。
## 登場する動物について
過去に行ったとくぽんAI塾2022のテーマは「動物園」でした。
そこでこのコースでも動物が登場します。
## とくぽんによる解説
徳島大学マスコットキャラクターの「[とくぽん](https://www.tokushima-u.ac.jp/about/profile/univ_mascot/index.html)」が解説を行います。
とくぽんによる解説には次の種類があります。
::: {.callout-note .tokupon}
全般的な補足をコメントするよ。
:::
::: {.callout-tip .tokupon_none}
#### 練習問題
とくぽんからの問題だよ。これまでの内容をおさらいして考えてみてね。
:::
::: {.callout-warning .tokupon_none}
注意が必要な事柄がある場合に説明をするよ。
:::
## ご意見募集
この内容が分かりにくかった、読めない漢字があったときには
気軽にコメントいただけると改善のために役立ちます。
コメントは{{< fa brands github >}} [GitHub issues](https://github.com/uribo/tokupon_ds/issues/new)もしくは[フォーム](https://docs.google.com/forms/d/e/1FAIpQLScsdOwAHDCj2eFg-PCLayWSQKViWO-BnzRWHCxsZPn_lVf6_A/viewform?usp=sf_link)から投稿をお願いします。
## {{< fa brands r-project >}} Rコードおよび実行環境
- R version 4.2.3
- macOS Ventura 13.4
このページは[Quarto](https://quarto.org)を使って作成されています。
[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/uribo/tokupon_ds/main?urlpath=rstudio)
このコースで扱っているRプログラムの内容は、binderによってウェブブラウザ上で試せます。
上記のボタンをクリックすることでbinder上のRStduio Serverが起動します。
(起動に時間がかかることがあります)
これによりブラウザ上でRを動かすことができます。
必要なデータ、パッケージはすでにインストールされている状態です。
資料のqmdファイルを開き、内容をなぞる、変更してRを動かしてみてください。
ウェブブラウザで行った変更はブラウザを閉じるとリセットされます。
ページ中のRのコードは下記のようにコードブロックで表示しています。
このコードブロックは右上にカーソルを移動させたときに表示されるアイコンをクリックすることで
内容がコピーされます。また、一部のコードについては非表示の状態のものもあります。
`コードを表示`とある場合、クリックによってコードが表示されます。
![](images/code_block.gif)
renvによるパッケージ管理、GitHub actionsによるページのビルドを行っています。
## ライセンス
コンテンツ中のコード、本文はMITライセンスです。
なお[とくぽん](https://www.tokushima-u.ac.jp/about/profile/univ_mascot/)(徳島大学マスコットキャラクター)の著作権は徳島大学に帰属します。