少量データで機械学習

f:id:mashimain:20180710220144j:plain

少量データで機械学習

japan.zdnet.com

これまで機械学習といえば、大量データのinputが必要という前提でしたが、少しだけ変わりそうです。

もちろん全ての機械学習で、使用可能というわけではなく、今回NECが開発した技術は、以下の3パターンです。

・人のノウハウを活用した学習技術
・類似度に基づいてパラメータを推定する技術
・複数分割による効果見積もり技術

 

1つ1つの詳細な解説は、上記のページにありますので、個人的に気になったものを取り上げます。

人のノウハウを活用した学習技術

1つ時代が戻った印象ですが、これで進んでいるというのだから、不思議なもの。

機械学習で大量データが必要といわれる背景には、人が持つ情報の数値化が難しいということがあります。

ここでは「情報」を「物事の因果関係に関するノウハウ」と限定しています。

つまり、全ての情報を数値化する技術を開発したわけではなく、数値化しやすいノウハウがある場合、必要なデータが少なくて済むという話だと推測します。

確かに、数値化が難しい→大量データが必要というのは、一種の思考停止だったのかもしれません。

ほかの2つは、新しいテクニックという感じですが、これは既存の考え方を変えるという意味で、発想する難易度が高いのではないかと思います。

具体的な技術の内容は、昨日よりスウェーデンで開催されている、機械学習の国際会議「ICML2018」で発表されるということなので、詳細を楽しみに待ちましょう。