データの準備

English page

このページでは、学習用のデータを用意する手順を解説します。

1.scikit-lean組み込みのデータセットの利用

scikit-learnによる機械学習を初めて行う方は、まずscikit-learn組み込みのデータセットを使って、学習を練習すると良いでしょう。
以下のデータセットを利用することができます。

  • iris
  • wine
  • diabetes
  • breast_cancer
  • california_housing

データセットはExcelに読み込んで利用します。
セル範囲にデータセットを読み込むブロックをドラッグし、読込先のセルを指定します。

scikit-learn組み込みのデータセットを読み込む

2.データセットを自分で用意

実際的なデータ分析の際には、自分で用意したデータセットを利用する形になります。
Excelのワークシートに、データを入力します。
先頭の行には系列の名前を入力し、2行目以降に実際のデータを入力していきます。
例えば、身長と体重の関係を回帰で分析したい場合だと、以下の画面のようにデータを入力します。

身長と体重のデータセットの例