未経験・30代からデータサイエンティストになる方法とおすすめしない理由【経験談です】

キャリア・転職
こんにちわ!見習いデータ分析屋のやじろべえです。
今回は、未経験・30代からデータサイエンティストを目指している方に向けて、データサイエンティストになる具体的な方法と目指す前に今一度考えななくてはならないことについて解説します。
初学者がスクールに行くべきかについても私なりの考えをまとめていますので、こちらもあわせてどうぞ!

 

”AI・機械学習・データサイエンティスト”

これらの言葉は最近メディアでもしょっちゅう取り上げられ、高給で将来性がある仕事のイメージがあります。そういった影響もあり、最近では機械学習エンジニアやデータサイエンティストを目指す方が増えています。
私自身、33歳という年齢で全く違う業界から独学やスクールを経て、現在は都内のスタートアップ企業のデータサイエンス部門で勤務することが出来ました。
現在データサイエンティストを目指している方にとっては、私のキャリアは順風満帆に見えるかもしれません。しかし、実際は自分自身の知識不足・周りの優秀なエンジニアとの競争・AutoMLといった機械学習ツールの自動化の波といった様々な要素もあり、将来長きにわたってデータ分析を仕事としてやっていられるかはかなり不透明だと思っています。
この記事では、未経験かつ30代という年齢からデータサイエンティストを目指している就職・転職希望者に参考になる記事です。是非最後まで読んでいただき、自身のキャリアについて改めて考えてもらえる良いきっかけになれれば幸いです。

未経験・30代からデータサイエンティストになれるの?

結論から言うと、「なれる」と私は思います。
ただし、人並み以上の努力が必要なのは言うまでもありませんし慎重に考えた方が良いと個人的には思っています。
まず大前提として、どんな職業であっても未経験の人をポテンシャル採用するほど世の中は甘くありません。
そのことを認識した上で、とにかく行動して何かしらの結果を出すことが必須条件となります。
例えば、機械学習や統計学といった書籍を片っ端から読み込み、GitHubにアウトプットしたり、最近ではKaggleといったコンペが人気ですので、そこで入賞するだけのスキルを身に着けてようやく土俵に立てるといったところでしょうか。
厳しい条件だなぁとこの時点で怯んでしまう人は正直、データサイエンティストにはならない方が良いかもしれません。
なぜなら、データサイエンティストになってからが更に大変になるからです。業務以外のプライベートでも常にスキル向上のために勉強を続ける必要があり、数学・統計学・機械学習・プログラミング・SQL・英語論文の読解力、これは最低ラインとなります。
これらの知識をベースとして、その上に専門知識(画像、自然言語、音声など)で差別化を図らないと生き残っていけません。
未経験に加えてもし30歳以上でデータサイエンティストにチャレンジしたい方は一層慎重に考えた方が良いと思います。
理由は、これからは上記スキルを持った優秀な新卒の学生がどんどん市場に参入してくるからです。最近は日本の大学でもデータサイエンスを学ぶ専門の学部がどんどん出来てきています。
例えば、立教大学は2020年4月にAIに特化した大学院を開設予定です。
滋賀大学では2019年4月から既にデータサイエンスを専門で学ぶ学部を開設しています。
こういった専門的な知識を身に着けた若い学生と近い将来同じ環境で仕事をしていくことになるわけです。もし彼らと同じようなスキルであった場合はかなり厳しい状況になることは言うまでもありません。企業からすれば同じ能力であれば、若くて人件費が安い人を選びますよね。
どうでしょうか?結構しんどいなぁと思った方が大半だと思います。逆に言えばこれだけ大変だったとしてもデータサイエンティストになりたい!と思った方のみ挑戦すべき職業だということを認識しておきましょう。

データサイエンティストの仕事内容

どういう分野のデータサイエンティストであるかで仕事内容も変わってきますので一概には言えませんが、大きく分けるとエンジニアリング寄りかコンサル寄りかに分けられます。
  • エンジニア寄り
どちらかというと機械学習エンジニアに近い仕事内容になると思います。
具体的には、機械学習モデルの作成・パラメータチューニング・デプロイ・運用といった仕事になります。
  • コンサル寄り
ビジネス課題がどこにあるかを企業の経営陣やビジネスサイドからヒアリングして、その課題をデータを使って解決出来るのか?解決出来るとしたらどのような技術を使えば良いか?といった割とビジネス寄りの仕事になります。
ただ、最近はもっと細分化され始めている印象があります。例えば、サーバサイドエンジニアとデータサイエンティストの中間のようなポジション(データエンジニア)だったり、分析のみを専門とするデータアナリストといったポジションがあります。
自分がどの領域のデータサイエンティストとして仕事をしていきたいのかを考えていくことが大事です。

データサイエンティストになるための必須スキル

ここまで見てくださった方はきっと本気でデータサイエンティストになりたい方だと思いますので、必須スキルをご紹介したいと思います。
特に未経験の方はデータサイエンティストになるためにはどんなスキルが必要かわからないと思いますので、参考にしてみてください。
  1. 数学(確率、微分・線形代数)
  2. 統計学(最低限、統計検定2級くらいの知識)
  3. プログラミング(Python or R)
  4. データベース処理(SQL)
  5. 機械学習(単回帰・重回帰・ロジスティック回帰・決定木・ランダムフォレストなど)
  6. 深層学習(CNN・RNNなど)
  7. レポート力
これらはこれまで私が実務を行う上で必要だと感じたスキルです。
もちろんタスクによって全てが必要となるわけではありませんが、実務において一つの案件だけをやり続けることはほぼあり得ないですので、これらの知識は基礎的なレベルでも身に着けておくことが望ましいと思います。

データサイエンティストになるための必須スキルの学び方

「必須スキルはわかったけど、どれから手を付けて良いかわからない!」といった声が多いと思います。私も勉強したての頃は同じ気持ちでした。
そこで、各スキルについて具体的な勉強方法について解説します。
  • 必須スキルを学ぶ手順

Step 1 : 最低限の数学力

いきなり数学かぁ。。。

大半の人がこう思いますよね。でも、データサイエンティストという職業は極論を言ってしまうと、データと数学を使って何かしらのパターンや気づきを得ることが仕事です。その為、数学は避けては通れないと考えてもらって良いでしょう。
もちろん全ての分野を学ぶ必要はありませんが、微分・線形代数と確率についてはある程度理解しておくのが望ましいです。
Step 2 : プログラミング
数学の基礎理解をした上で、プログラミングについて学びましょう。
人によってはプログラミングを学ぶ前に統計学を学ぶべきという意見もあると思いますが、個人的には早い段階でプログラミングをマスターすることをおすすめします。
理由としては、統計学の基礎知識は確かに大事だけど基礎勉強ばかり続くと大抵の人は挫折するからです。
なのでまずは手を動かしながら楽しんで出来るプログラミングを先に習得してしまう方が効率良いと思います。プログラミングを学びながら統計学や機械学習を身に着けることも可能ですし、教科書を読むよりも身に着けやすいです。
データサイエンティストで必要となるプログラミング言語は現状、PythonもしくはRの二択になります。
どちらを学ぶのが良いかは将来の仕事内容にもよってきますが、悩むのであればPythonを選んでおくのかおすすめです。
プログラミング言語は1つ習得してしまえば、他の言語を習得するのは難しくありません。色々と勉強していった結果、やはりRの方が必要だったとなれば、そこから学んでも十分キャッチアップ出来ると思います。
Step 3 : データベース処理(SQL)
SQL等のデータベース処理の理解を進めましょう。ここまでの段階でプログラミングをある程度身に着けているので、SQLの構文はそこまで抵抗感無く勉強出来ると思います。
データサイエンティストであれば大量のデータ処理をするケースが多く、その際にデータベースにアクセスして必要なデータの抽出や加工は必須となります。
Step 5 : 統計学・機械学習
ここまで来てようやくデータサイエンティストらしい内容になってきました。
個人的には統計学を先に学んでおくのが良いかと思いますが、昨今もっぱら話題になってるのは機械学習です。統計学と機械学習、両者は全く関係ない分野ではなく、むしろ共通している概念が多いです。
もちろん機械学習から勉強しても良いのですが、理論的なところまでしっかり理解しようとすると結局統計学の知識が必要になってきます。
急がば回れではないですが、やはりベース知識である統計学をある程度身に着けておくことをおすすめします。
Step 6 : 専門性を深める
Step5までをしっかり身に着けた上でアウトプットもしっかり出来ている人であれば、おそらくどこかの企業のデータサイエンス部門に就職することは可能だと思います。
ここら先は人によって学ぶべき内容がかなり異なってきますので、一概にこれが良いとは断言できません。
画像が好きな人であれば、画像認識や深層学習が必須になってきますし、自然言語処理や音声データの解析というように専門領域が分かれてきます。
ただ、冒頭でも解説したように就職することがゴールではなく、むしろここからがスタートです。基礎知識をベースにして専門性をどんどん高めていきデータサイエンティストとしてどんどん市場価値を高めていきましょう!
・・・っと、ここまで解説データサイエンティストに必要スキルを解説してきましたが、正直なところこれらすべてを独学で頑張るのはかなり難しい、というか無理ゲーだと思います。実際、私も最初は参考書を順番に読んで勉強していったのですが挫折しかけました。
なので、次からは私がおすすめする効率的な勉強法について解説していきます。
  • おすすめの効率的な勉強法
ほとんどの人が勉強するときは教科書や参考書から入る人が多いと思いますが、これはおすすめしません。
なぜなら参考書には大抵難しい数式がいきなり登場するからです。
例えば下の式を見て拒否反応が出る人は最初に参考書で勉強するのはやめましょう。
(ちなみに下の式はポアソン分布と呼ばれる式で、統計学の基礎的な確率分布の一つです。)
(出典:統計Web
その代わり私が最もおすすめするのが動画教材です。
最近はYoutubeでも質の高い動画がたくさんありますので、まずは動画で学んでいきましょう。
私はUdemyという動画学習サービスを使って勉強しました。今でもスキルアップしたい時にはまずUdemyで探します。
Udemyには質が高い動画教材がたくさんありますし、一度購入したらいつでも何度でも見れるのでオススメです。また、わからないところがあったら先生に質問することも出来るので、挫折する確率が減ります。
Udemyは普通に購入しようとすると、教材によっては2万円近くするものがありますが、セール期間になると1200円とかで買えちゃったり出来ます。90%OFFのものもあって最高です。
しかもセールが割と頻繁に実施されますよ!セール期間中に購入することを強くオススメします。
では、おすすめのUdemy動画教材を紹介します。もちろんこれ以外にもたくさんあるので、是非自分に合った教材を探してスキルアップしていきましょう!
・基礎的な数学を身に着けたい人向け
株式会社キカガクさんが提供している有名な動画教材です。私もこちらを使って微分や線形代数をもう一度おさらいしました。とてもわかりやすくおすすめです。
・SQLを学びたい人向け
初めてSQLを学ぶと構文の多さやテーブルの結合などでつまりやすいのですが、こちらの教材は必要最低限の内容に絞ってハンズオン形式で学べるのでおすすめです。
・統計学の基礎を学びたい人向け
DataMixさんが提供している動画教材です。プログラミングをせずにエクセルを使って統計学の基礎からビジネスでも使える分析手法が学べるのでおすすめです。
・機械学習の基礎を学びたい人向け
Python、統計学の復習から入って機械学習の基礎を学んでいきます。最後にレコメンドシステムや実務を想定したデータ分析までこれでもかっていうくらいに内容盛りだくさんです。こちらもセール中に確実にゲットしておきましょう。
上記以外にもおすすめしたい動画はたくさんあるのですが、長くなるので他の記事にまとめようと思います。
おすすめのUdemy講座をまとめました。是非参考にしてみてください。

 

Udemy以外にもにおすすめするオンライン講座(月額5,000円以下)をまとめていますので、こちらも是非参考にしてみてください。

動画で網羅的に学習が進んだら次は参考書等で更に知識を深堀りしましょう。個人的には下記の書籍がおすすめです。今でもバイブルとして私がお世話になっている本たちです。

最後に

今回は未経験・30歳からデータサイエンティストになるための方法と慎重になるべき理由について解説しました。
データサイエンティストの大変さについて実体験を交えて解説しましたが、私自身は今の仕事はとてもやりがいを感じていますし、楽しく仕事が出来ています。
モデルの精度が出なかったりすると先の見えないトンネルに入った感じになりとても辛いですが、その分一生懸命仮説検証した結果、成果が出たときは何ものにも代えられない嬉しさと成長している実感があります。
皆さんもまずは何故データサイエンティストになりたいのかを今一度よく考え、その上で自分に合った勉強法で実務に役に立つスキルを身に着けてもらえていったらと思います。

おすすめ記事

タイトルとURLをコピーしました