データ分析Python, Numpyで片対数グラフの回帰直線を良い感じに描く 片対数グラフの回帰直線をPythonで求めようとして少しハマったのでそのメモ。仮想データを準備して、X軸を対数変換して回帰直線を求めた。 2020.06.14データ分析プログラミング技術忘備録
データ分析反事実モデルを生成する機械学習の解釈性ライブラリDiCEを試す 最近は機械学習の解釈性がよく聞かれますが、そんな中でMicrosoft Researchがとても面白いかつ今後有用になりそうなライブラリを発表していました。本記事ではkaggleにあるローン審査のデータセットとDiCEを使ってローン審査の反事実を生成してみます。なお、現時点ではDiCEは実装がまだしっかりと整備されていないため、今後実装が進んだ際は現時点とは使い方等が変わるかもしれませんのでご了承下さい。 2020.05.08データ分析プログラミング技術忘備録機械学習
データ分析機械学習の自動化ライブラリ「PyCaret」を使ってみた こんにちわ!都内のベンチャー企業でデータ分析屋しているやじろべえです!今回はPyCaretという機械学習の自動化ライブラリを使ってみたのでその忘備録になります。PyCaretはイメージ的にはDataRobotのような感じですね。詳細は公式ホームページを見てみてください。 2020.04.18データ分析プログラミング技術忘備録機械学習
データ分析機械学習の解釈性技術の一つであるSHAPを試してみた こんちにわ!都内のスタートアップでデータ分析しているやじろべえです。最近は機械学習の解釈性がよく話題になっていますが、今回はこの機械学習の解釈性について一つのソリューションを与えてくれるSHAPについて試してみました(もうN番煎じなんだよって感じですが・・・)。 2020.04.08データ分析プログラミング技術忘備録機械学習
データ分析統計的因果推論(バイアスの影響を測る回帰分析) こんにちわ!やじろべえです。今回は因果推論シリーズの第三弾として、回帰分析を使ってバイアスの影響を測定してみます。これまでと同様に教科書は下記の書籍を参考にしています。因果推論をビジネス利用する観点で書かれており、現場でデータ分析する人は読んでおいて損は無いと思います。 2020.03.11データ分析プログラミング因果推論技術忘備録
データ分析統計的因果推論(対応が無い2標本t検定)バイアスのあるデータの効果検証 こんにちわ!やじろべえです。今回は因果推論シリーズの第二弾として、バイアスのあるデータを疑似的に作り、その効果検証をしてみました。今回も教科書は効果検証入門を参考にしています。内容の多くが因果推論をビジネス利用する観点で書かれており、現場でデータ分析する人は読んでおいて損は無いと思います。 2020.03.08データ分析プログラミング因果推論技術忘備録
データ分析統計的因果推論(対応が無い2標本t検定)RCTによるメールマーケティングの効果検証 こんにちわ!やじろべえです。今回は統計的因果推論ということで、おそらく一番有名であろうRCT(Randomized Controlled Trial)による効果検証についてPythonで分析してみました。因果推論を学習するにあたり、何か参考書籍は無いか探していたところ良さげな一冊を発見しました。データ分析界隈で有名な方々もこちらの書籍を一押ししていたので、早速私も購入してみました。 2020.03.01データ分析プログラミング因果推論技術忘備録
データ分析勾配ブースティングで顧客離反予測 こんにちわ!やじろべえです!最近、職場の蓄積したデータを使って顧客が離反するかしないかについて予測したいとビジネスサイドの方がフラグを立てている(?)らしいので、予習がてらにオープンデータセットを用いて機械学習的なアプローチで分析してみました。 2020.02.24データ分析プログラミング技術忘備録機械学習
データ分析scikit-learn0.22.0から実装されたスタッキングクラスを試してみた こんにちわ。見習いデータ分析屋のやじろべえです。データ分析コンペで上位を取ろうとしたらマストテクニックになるスタッキング(stacking)ですが、これまではお手軽に使えるクラスが無かったので、パイプラインを作るのが非常に面倒でした。そんな中、scikit-learnのバージョン0.22.0からスタッキングクラスが実装されたと聞いて、早速どれだけお手軽か試してみました。 2020.02.04データ分析プログラミング技術忘備録機械学習
データ分析Python, Janomeで名作「銀河鉄道の夜」を形態素解析してみた 皆さんは宮沢賢治の名作「銀河鉄道の夜」という小説を読んだことがありますか?私は子どもの頃一度読んだのですが、よく意味が分からなくて断念した記憶があります。さて、今回はこの名作で登場する主人公と友人どのくらいの頻度で登場するか、Python, Janome, 形態素解析を行って単語の出現回数をカウントしてみます。 2019.05.25データ分析プログラミング技術忘備録自然言語処理