- インストール
- 基本操作
- 電子工作向けプログラミングの基本
- Excel向けプログラミングの基本
- scikit-learnでの機械学習
- matplotlibでのデータの可視化
- Web関連プログラミング
- RPA関連プログラミング
- その他の各種プログラミング
- リファレンス
データの準備
このページでは、学習用のデータを用意する手順を解説します。
1.scikit-lean組み込みのデータセットの利用
scikit-learnによる機械学習を初めて行う方は、まずscikit-learn組み込みのデータセットを使って、学習を練習すると良いでしょう。
以下のデータセットを利用することができます。
- iris
- wine
- diabetes
- breast_cancer
- california_housing
データセットはExcelに読み込んで利用します。
セル範囲にデータセットを読み込むブロックをドラッグし、読込先のセルを指定します。
2.データセットを自分で用意
実際的なデータ分析の際には、自分で用意したデータセットを利用する形になります。
Excelのワークシートに、データを入力します。
先頭の行には系列の名前を入力し、2行目以降に実際のデータを入力していきます。
例えば、身長と体重の関係を回帰で分析したい場合だと、以下の画面のようにデータを入力します。
