大学院1年の古谷です。
今回の記事では機械学習の背景に関する話をしていこうと思います。 私たちの研究室ではロボットの走行に深層強化学習を用いていますが、機械学習について学ぶことが少なかったので今回はG検定という試験の勉強で学んだことを軽く紹介していこうと思います。 人工知能には今までに3回のブームがあります。1つ目は1950年代から1960にありました。これは推論・探索の時代と呼ばれ、迷路や数学の定理などの簡単な問題を解けるようになりました。2つ目は知識の時代と呼ばれ、1980年代にありました。専門知識をデータベスに溜め込んだエキスパートシステムがたくさん作られるようになりました。そして最後は2010年から現在まで続いている機械学習・特徴表現学習の時代です。ディープラーニングなどが登場し期待値がどんどん高まっています。
(引用元:AINOW[初心者でもわかるディープラーニングー基礎知識からAIとの違い、導入プロセスまで細かく解説]https://ainow.ai/2019/08/06/174245/) それらの背景があり、私たちが扱う機械学習が生まれたのです。機械学習は3つに分けることができます。教師あり学習・教師なし学習・強化学習です。教師あり学習は与えられてデータを元にそのデータがどんなパターンになるかを識別・予測するものです。例えば、与えられた動物の写真から何の動物であるか識別するものです。教師なし学習はデータそのものが持つ特徴などを学習するものです。例えば、ECサイトの売り上げからどういった顧客層があるのかを認識したい場合に使われます。強化学習は行動を学習するものです。例えば、ロボットが目的地に向かう中で一つ一つの行動に正解はないが目的地に到着するまでに選択した行動には価値があるため、それらの行動に報酬を与えるというものです。強化学習ではこれらの行動を何千何万と繰り返す最終的に高い報酬を持つ行動を選択できるようになります。 私たちが普段扱う深層強化学習はその強化学習にディープニューラルネットワークを組み込んだものになるのです。
参考文献「深層学習教科書ディープラーニングG検定公式テキスト」
次回はSI2020で発表する内容を記事にしたいと思います。