データ分析反事実モデルを生成する機械学習の解釈性ライブラリDiCEを試す 最近は機械学習の解釈性がよく聞かれますが、そんな中でMicrosoft Researchがとても面白いかつ今後有用になりそうなライブラリを発表していました。本記事ではkaggleにあるローン審査のデータセットとDiCEを使ってローン審査の反事実を生成してみます。なお、現時点ではDiCEは実装がまだしっかりと整備されていないため、今後実装が進んだ際は現時点とは使い方等が変わるかもしれませんのでご了承下さい。 2020.05.08データ分析プログラミング技術忘備録機械学習
データ分析機械学習の自動化ライブラリ「PyCaret」を使ってみた こんにちわ!都内のベンチャー企業でデータ分析屋しているやじろべえです!今回はPyCaretという機械学習の自動化ライブラリを使ってみたのでその忘備録になります。PyCaretはイメージ的にはDataRobotのような感じですね。詳細は公式ホームページを見てみてください。 2020.04.18データ分析プログラミング技術忘備録機械学習
データ分析機械学習の解釈性技術の一つであるSHAPを試してみた こんちにわ!都内のスタートアップでデータ分析しているやじろべえです。最近は機械学習の解釈性がよく話題になっていますが、今回はこの機械学習の解釈性について一つのソリューションを与えてくれるSHAPについて試してみました(もうN番煎じなんだよって感じですが・・・)。 2020.04.08データ分析プログラミング技術忘備録機械学習
データ分析勾配ブースティングで顧客離反予測 こんにちわ!やじろべえです!最近、職場の蓄積したデータを使って顧客が離反するかしないかについて予測したいとビジネスサイドの方がフラグを立てている(?)らしいので、予習がてらにオープンデータセットを用いて機械学習的なアプローチで分析してみました。 2020.02.24データ分析プログラミング技術忘備録機械学習
データ分析scikit-learn0.22.0から実装されたスタッキングクラスを試してみた こんにちわ。見習いデータ分析屋のやじろべえです。データ分析コンペで上位を取ろうとしたらマストテクニックになるスタッキング(stacking)ですが、これまではお手軽に使えるクラスが無かったので、パイプラインを作るのが非常に面倒でした。そんな中、scikit-learnのバージョン0.22.0からスタッキングクラスが実装されたと聞いて、早速どれだけお手軽か試してみました。 2020.02.04データ分析プログラミング技術忘備録機械学習
データ分析kaggleにチャレンジ!ケプラー衛星のデータを使って第二の地球を機械学習で探してみた はじめに 「この広大な宇宙に地球と似たような惑星はあるの?」 「もしあるのあればそこに住んでいる生命体はどんな姿をしているの?」 そんなことを考えたことはありませんか? この人類最大の謎に挑戦していたのがNASAの打上げた人工衛... 2019.03.11データ分析プログラミング宇宙開発技術忘備録機械学習
データ分析kaggleにチャレンジ!NASAのデータを使って太陽の日射量を機械学習で予測してみた はじめに kaggleで宇宙に関係する面白そうなコンペをあるイベントを通して知ったので、早速チャレンジしてみました。 今回チャレンジしたコンペは既に終了していますが、大変興味深く面白かったので記事に残しました。 kaggleとは 世... 2019.03.05データ分析プログラミング宇宙開発技術忘備録機械学習
データ分析ボストン市の住宅価格をScikit-learnの線形回帰で予測 はじめに 機械学習は最近ではすっかりメジャーな言葉になってきましたね。 機械学習やディープラーニングに興味があってこれから本格的に勉強していきたい方は下の記事もオススメです! ・【初心者向け】AI(人工知能)について初心者が最初に... 2019.02.10データ分析プログラミング技術忘備録機械学習