こんにちわ!見習いデータ分析屋のやじろべえです。
今回はデータサイエンティストを目指す方へおすすめのUdemy講座をご紹介します。
私自身、今でも足りないスキルはUdemyで独学し、現在は都内にあるスタートアップ企業でデータサイエンティストとして勤務しています。
そんな私がこれまでの体験も交えながら効率よくデータサイエンスを学ぶノウハウを紹介します、是非最後までお付き合い下さいませ。
目次
データサイエンティストとは?
この記事を見ている人はきっとデータサイエンティストに興味がある方が多いと思います。
データサイエンティストは、統計学やAI(人工知能)といった技術を使ってビジネス課題を解決したり、AIが搭載されたアプリケーションの開発を行うエンジニアのことを指します。
もしAI(人工知能)についてあまり詳しくない方はこちらの記事もおすすめです。
特に最近はビッグデータ時代と言われるように、多くの企業が自社のデータを使って分析を行いビジネスに生かそうとしています。
このようなニーズに応えることが仕事であるデータサイエンティストは具体的には下記のスキルが求められます。
- プログラミング(PythonまたはR)
- 統計学
- 機械学習(深層学習)
また、統計学や機械学習を学ぶ上で数学の知識も必須となりますし、解析した結果をビジネスサイドにわかりやすく伝えるためのコミュニケーション能力といったソフトスキルも必要です。
データサイエンティストになるためには?
データサイエンティストになるためにはまずは下記のステップに従って勉強していきましょう!
- 基礎的な数学知識を付ける
- PythonまたはRによるプログラミング言語を学ぶ
- 統計学を学ぶ
- 機械学習(深層学習)を学ぶ
- ビジネスアナリティクス / アプリケーション実装を学ぶ
え?ディープラーニングがすごいって聞いたけどディープラーニングを最初に勉強すべきじゃないの?
確かに、最近はディープラーニング技術のブームによってデータサイエンティストが社会的にすごく注目されるようになりました。
しかし、実はディープラーニングの技術はデータサイエンティストの仕事の中でほんのごく一部なのです。
人によっては全くディープラーニングを使わないデータサイエンティストもいます。
それほどデータサイエンティストという職業は幅が広く様々なスキルが要求される職種なのです。
「そんなにたくさんのスキルが必要なのか、大変そう。。。」
きっと多くの方がこう思いますが、実務で使う内容に限って言えばある程度限られてきます。
最初から完璧に全てを理解しようとすると確実に挫折しますので、まずは身の丈にあった内容をしっかり理解していきましょう。
そして勉強する際にいきなり専門書等で勉強することはあまりおすすめ出来ません。専門書だと数式のオンパレードで大抵の人は積読で終わりますw
スクールに通うというのも選択肢としてありますが、スクールに通う前にまずは低コストでしかも基礎的な内容が身に付くUdemyで勉強することをおすすめします。
未経験からデータサイエンティストになりたい方はこちらの記事も参考になると思います。
Udemyとは?
Udemyとは、アメリカのオンライン教育プラットフォームで動画で学習できるサービスです。プログラミングやIT教育に関するコンテンツも数多く公開されていて、データサイエンティストになるために必要な統計学や機械学習といったコンテンツもたくさんあります。
Udemyはパソコンだけでなくスマホでも見れますし、受講講座は事前にスマホの端末にダウンロードしておくことでオフラインの状態でも見れますのでかなり便利です。
私はよく電車での移動時間といった隙間時間を利用して勉強しています。
Udemyの講座は通常価格だと1講座あたり1万円以上するのがほとんどですが、実はセールを頻繁に実施しておりセール期間中は1講座あたり1300円程度で購入できますよ!
私はよく気になる講座はお気に入りリストに追加しておいて、セール期間になったら一気に購入したりしています。
Udemyでは一度購入した講座の受講期限は無く、いつでも何回でも講座を見ることが可能です。
また、私の感覚的にはお気に入りリストに登録しておくと、その登録講座限定でセールになったりすることが多い気がします。
なので、気になる講座があるけどセール期間やってないなぁと思っても、まずはお気に入り登録しちゃいましょう。そうすると意外とすぐに安く購入出来るかもしれません。
おすすめのUdemy講座8選
では、早速データサイエンティストになるためのおすすめのUdemy講座を先ほど紹介した勉強のステップ順で紹介していきますね。
ステップ1 : 基礎的な数学知識
まずは有名な株式会社キカガクさんの機械学習に必須である数学講座の初級・中級編です。
微分や線形代数といった超重要な分野を基礎から学べます。
この講座は、数学に自信が無い人にもとてもわかりやすいように解説されています。
初学者にとっては微分や線形代数を参考書でいきなり学ぶよりも遥かに効率的かつ理解しやすいのでおすすめです。
この講座で基礎を学んだあとに専門書や問題演習を通して数学力を身に着けていきましょう。
ステップ2 : プログラミング言語(PythonまたはR)を学ぶ
プログラミング言語については、PythonかRの二択ですが、初学者であればPythonを選んでおけば問題ないと思います。
シリコンバレーでエンジニアとして活躍されている酒井潤先生の講座です。
こちらの講座では、Pythonの環境構築・基本文法・オブジェクトとクラスの概念といった、Pythonでプログラミングをするための知識がほぼ全て網羅されています。
この講座が理解出来れば、すぐに実務で活躍出来るレベルになると思います。
私は酒井先生の講座をいくつか購入していますが、各講座でシリコンバレーの有名IT企業に行ってみたシリーズがあって個人的にはそれがとても楽しいんですよね。
講座を始める前に見ることで、自分もスキルを向上させていつかはシリコンバレーに挑戦したい!という感じでとてもモチベーションアップに繋がるんです!
是非モチベーションを上げてPythonを自由自在に使いこなせるようになりましょう!
ステップ3 : 統計学を学ぶ
株式会社データミックスの代表である堅田先生の統計学講座です。
この講座は何と言っても統計学の基礎の基礎からわかりやすく解説してくれていて、初学者にはかなりおすすめです。
内容的には記述統計、確率、仮設検定という統計学の最もポピュラーな内容となっています。
もちろんこの講座だけで統計学を全て網羅出来るわけではないですが、統計学を今まで一度も勉強したことない人や昔勉強したけど忘れたっという方はまずはこの講座を聞いて統計学のイメージを持ちましょう。
講座中の演習問題はエクセルを用いて理解を深めることができるのもポイントです。
ステップ4 : 機械学習(深層学習)を学ぶ
Shingo Tsuji先生のPythonを使ったデータ分析・機械学習の講座です。
この講座では、Pythonを使ってデータの集計、分析、可視化といった実務で必須となる手法をかなりの時間を使ってわかりやすくかつ学ぶことが出来ます。
その一方、機械学習についてはこの講座だけでは少し物足りない感じがします。
そこで、次の我妻先生の講座も一緒に勉強することをおすすめします。
この講座は、機械学習さらには深層学習(ディープラーニング)について知識が深まると思います。
特に理論的な解説も詳しくされていて、専門書を読むと挫折しそうなレベルでもこの講座であれば最後まで勉強出来ると思います。
最後に機械学習の定番中の定番ライブラリであるscikit-learnを使った分析も実習出来るのでこちらも初学者にとってはおすすめです。
ステップ5 : ビジネスアナリティクス/アプリケーション実装を学ぶ
ステップ4までしっかりと身に着ければあとは応用です。皆さんが統計学や機械学習の知識を使ってどんなことをしたいかで勉強すべき内容は変わってきますが、ここでは私がとても役に立った講座を二つを紹介します。
まずは、ビジネスアナリティクスという観点で統計学を使った実践的な講座です。
Ichiro Takahashi先生のR言語を使ったビジネスデータ分析の講座です。
こちらの講座ではPythonではなくRというプログラミング言語であることにご注意ください。
私は元々Pythonをメインで実務をしてきましたが、データサイエンティストであるならば最終的にはPythonとR両方とも使えるようになっておいた方が良いと思います。
また、私は最近経営に直結するデータ分析にもとても興味があり、ビジネスデータ分析の勉強もしています。
ビジネスデータ分析はあまり良い教材が無いのですが、こちらの動画は実務でもすぐに使えそうな例をあげなら手を動かすことが出来るのでおすすめです。
次にアプリケーション実装という観点でおすすめの講座です。
こちらの講座は超有名講師である井上先生の画像認識AIを作る講座です。
私もデータサイエンティストに転身する前はこの動画で一生懸命ポートフォリオを作っていました。
この講座の良いところは、機械学習モデルを作るだけでなく、そのモデルをFlaskを使ってウェブアプリにしたり、iOSアプリ化するところまで学ぶことで出来るんです!
大抵の人は機械学習モデルを作るところまでしか勉強していないですが、そのモデルを実際にアプリに実装出来るようなスキルも身に着けて周りのライバルと差別化しましょう!
おまけ
私がUdemyで出したデータ分析の基礎とインタラクティブダッシュボード作成入門講座もおすすめです!
Streamlit, Pandas, Pythonで学ぶ!データ分析の基礎とインタラクティブダッシュボード作成入門
この講座は、オープンデータ(日本国民の賃金データ)を用いたデータ分析の基礎(データの整形・基礎集計・可視化)、更には今話題となっているStreamlitを使った動的なデータ分析Webアプリの開発からデプロイまでをステップバイステップで学んでいきます。
他にもオンラインコースを出していますので、興味がある方は下記リンクをご覧ください。
最後に
勉強というとほとんどの人は参考書といった書籍で勉強しようとします。
もちろんそれ自体は悪いことではありません。しかし、最近はわかりやすくかつ安価な動画学習サービスがたくさんあります。
初学者はこういった入門ハードルを下げられるようなプラットフォームを上手く使いながらスキルアップしていきましょう。
最後に、今回ご紹介した講座一覧はこちらです。
- 【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 –
- 【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 中級編 –
- 現役シリコンバレーエンジニアが教えるPython 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイル
- 【ゼロからおさらい】統計学の基礎
- 【世界で5万人が受講】実践 Python データサイエンス
- みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習
- 超実践!「Rで学ぶビジネスデータ分析」講座
- 【画像判定AIアプリ開発・パート1】TensorFlow・Python・Flaskで作る画像判定AIアプリ開発入門
- Streamlit, Pandas, Pythonで学ぶ!データ分析の基礎とインタラクティブダッシュボード作成入門