こじかメモ

メモ魔こじかの雑多メモ

重回帰分析の演習問題

みなさんこんにちは!こじかです。

 

今回は無料講座第9回「演習問題」を勉強します。第9回まで来ましたねぇ。

無料講座の残りセクションを数えてみたら今回を含めて後3回。

右も左も分からなかった第1回から振り返ると数学はちょこちょこ勉強してるし、英語はまぁこれからですが、かなり理解が深まってきたのではないでしょうか。

 

今回は実際のcsvファイルに格納された本格的なデータを利用して分析する方法を勉強しました。

データを読み込んだ後はまずはPandasとMatPlotlibを使ってデータを可視化して分析します。

ヒストグラムといういわゆる度数分布表を表示して、正規分布になっているか、外れ値はないかなどを確認したり、散布図を表示して変数同士に相関関係があるかどうかを可視化して確認しました。度数分布表。なつかしい。

 

次にScikit-learnでデータ分析するためにデータを切り分けるする方法、Scikit-learnで重回帰分析する方法を再度勉強しました。

今回は本格的なデータを分析するため前回の講座では出てこなかった分析手法が追加されていて、ここからがちょっと大変でした。

プログラム実行のために入力するコード量が増えたので講座のスピードについていけず動画ストップしてコード書いて実行したらエラーが出てどこ書き間違えてるか小さな文字を追ってコード書き直して動画再生してコード書いて・・の無限ループ。

コード書くだけでいっぱいいっぱいでこれまでの講座の中で一番のイライラポイントだったかもしれませんねー

かなり時間もかかり疲労もピークを迎えましたので、消化不良でしたがもう今日の勉強は終了!保留保留!

 

今回の講義ではあらかじめ用意されたデータを分析する方法を中心に勉強しましたが、次回は「統計」というセクションで、その分析するデータそのものを整理する方法を勉強するようです。

唐突の数学パート再開・・まだあったんですね・・