プログラミング

データサイエンス

機械学習の解釈性技術の一つであるSHAPを試してみた

こんちにわ!都内のスタートアップでデータ分析しているやじろべえです。最近は機械学習の解釈性がよく話題になっていますが、今回はこの機械学習の解釈性について一つのソリューションを与えてくれるSHAPについて試してみました(もうN番煎じなんだよって感じですが・・・)。
データサイエンス

統計的因果推論(バイアスの影響を測る回帰分析)

こんにちわ!やじろべえです。今回は因果推論シリーズの第三弾として、回帰分析を使ってバイアスの影響を測定してみます。これまでと同様に教科書は下記の書籍を参考にしています。因果推論をビジネス利用する観点で書かれており、現場でデータ分析する人は読んでおいて損は無いと思います。
データサイエンス

統計的因果推論(対応が無い2標本t検定)バイアスのあるデータの効果検証

こんにちわ!やじろべえです。今回は因果推論シリーズの第二弾として、バイアスのあるデータを疑似的に作り、その効果検証をしてみました。今回も教科書は効果検証入門を参考にしています。内容の多くが因果推論をビジネス利用する観点で書かれており、現場でデータ分析する人は読んでおいて損は無いと思います。
データサイエンス

統計的因果推論(対応が無い2標本t検定)RCTによるメールマーケティングの効果検証

こんにちわ!やじろべえです。今回は統計的因果推論ということで、おそらく一番有名であろうRCT(Randomized Controlled Trial)による効果検証についてPythonで分析してみました。因果推論を学習するにあたり、何か参考書籍は無いか探していたところ良さげな一冊を発見しました。データ分析界隈で有名な方々もこちらの書籍を一押ししていたので、早速私も購入してみました。
データサイエンス

勾配ブースティングで顧客離反予測

こんにちわ!やじろべえです!最近、職場の蓄積したデータを使って顧客が離反するかしないかについて予測したいとビジネスサイドの方がフラグを立てている(?)らしいので、予習がてらにオープンデータセットを用いて機械学習的なアプローチで分析してみました。
データサイエンス

scikit-learn0.22.0から実装されたスタッキングクラスを試してみた

こんにちわ。見習いデータ分析屋のやじろべえです。データ分析コンペで上位を取ろうとしたらマストテクニックになるスタッキング(stacking)ですが、これまではお手軽に使えるクラスが無かったので、パイプラインを作るのが非常に面倒でした。そんな中、scikit-learnのバージョン0.22.0からスタッキングクラスが実装されたと聞いて、早速どれだけお手軽か試してみました。
プログラミング

Windows環境でKeras実装されたYOLOv3を使って一般物体検出をお手軽に試してみた

今回は一般物体検出で有名な手法であるYOLOv3をサクッとに試してみたいと思います。Windows環境でも簡単に動かせますよ。YOLOは画像に写った物体が何であるかを認識して、更にその物体が画像中のどこにあるかを推定してくれます。こういった技術のことを物体検出と呼びます
プログラミング

Python,OpenCVでHSV色空間を用いて肌色領域を抽出

HSVとは、色を「色相(Hue)」,「彩度(Saturation)」,「明度(Value・Brightness)」の3要素で表現する方法です。RGBとの違いとして、RGBは原色の組み合わせで色を表現していますが、HSVは「鮮やかさ」や「明るさ」といった人間が直感的にわかりやすい方法で方法で表現されています。今回はPythonとOpenCVを使ってカラー画像から肌色領域を抽出する方法を実装しました。
プログラミング

Python,OpenCVで画像を回転させてテンプレートマッチングを試してみた

PythonとOpenCVを使ってテンプレートマッチングを行う方法を実装しました。また、画像を回転したときのマッチング結果も実験してみました。ソースコードと計算結果を解説します。テンプレートマッチングとは、入力画像に対してテンプレート画像をスライドさせながら、両者の類似度を計算し、類似度が最も高い位置を探すことが出来ます。
プログラミング

Python, Janomeで名作「銀河鉄道の夜」を形態素解析してみた

皆さんは宮沢賢治の名作「銀河鉄道の夜」という小説を読んだことがありますか?私は子どもの頃一度読んだのですが、よく意味が分からなくて断念した記憶があります。さて、今回はこの名作で登場する主人公と友人どのくらいの頻度で登場するか、Python, Janome, 形態素解析を行って単語の出現回数をカウントしてみます。
タイトルとURLをコピーしました