データサイエンス

データサイエンス

scikit-learn0.22.0から実装されたスタッキングクラスを試してみた

こんにちわ。見習いデータ分析屋のやじろべえです。データ分析コンペで上位を取ろうとしたらマストテクニックになるスタッキング(stacking)ですが、これまではお手軽に使えるクラスが無かったので、パイプラインを作るのが非常に面倒でした。そんな中、scikit-learnのバージョン0.22.0からスタッキングクラスが実装されたと聞いて、早速どれだけお手軽か試してみました。
データサイエンス

kaggleにチャレンジ!ケプラー衛星のデータを使って第二の地球を機械学習で探してみた

今回はkeplerのデータを使って第二の地球を機械学習を使って探してみたいと思います。kepler衛星とは2009年にNASAが打上げた大型の人工衛星で、地球型の太陽系外惑星を見つけることをメインミッションとしていました。kepler衛星は打上げられてから9年間で50万個以上の星を観測し、2600個以上の惑星を発見しています。残念ながら2018年10月に燃料が尽きたため運用を終了したとNASAは発表しました。
データサイエンス

kaggleにチャレンジ!NASAのデータを使って太陽の日射量を機械学習で予測してみた

kaggleで宇宙に関係する面白そうなコンペをあるイベントを通して知ったので、早速チャレンジしてみました。今回挑戦するコンペは太陽の日射量を地球の気象データから予測する内容になります。機械学習を使ってどこまで精度が出るか計算してみました。
データサイエンス

PyTorchを用いてディープラーニングによるワイン分類をしてみた

PyTorchを用いてニューラルネットワークによるワイン分類を行いました。また、層を深くしたとき(ディープラーニング)の精度向上検証も行いました。今回用いたデータセットはscikit-learnに含まれているデータセットを使用しています。
データサイエンス

ボストン市の住宅価格をScikit-learnの重回帰分析で予測

以前の記事では単回帰分析でボストンの住宅価格を予測しました。今回は重回帰分析で予測してみたいと思います。単回帰分析では説明変数が一つのみでしたが、重回帰分析では説明変数が複数扱うことができます。
タイトルとURLをコピーしました