CV・NLPハマりどころメモ

画像認識と自然言語処理を研究する中でハマったところを共有します.ほぼ自分用のメモ.

「データマイニング・機械学習分野の概要」を読んで参考になったこと[ML]

f:id:Vastee:20190521110439p:plain

神嶌 敏弘さんがご自身のHPで公開している「データマイニング機械学習分野の概要」という資料が,深層学習の歴史と,国際会議の動向を知る上で大変役に立ったため,本記事では,スライドを読んで参考になったことをまとめてみる.

まずは,資料へのリンクを貼らせていただく.

www.kamishima.net

機械学習データマイニング全般というメニューの中から,データマイニング機械学習分野の概要」という資料が見つかるはずだ.変更があった際には,こちらのページに最新版をアップしているようだ.

以降,参考になったことをつらつらと書いてゆく.

P9 データ分析に関わる分野の変遷

統計的機械学習のルーツがルールベールの機械学習にあるという表現が印象に残った.筆者がこれまで見てきた解説資料では,統計的機械学習がルールベース機械学習に塗り変わったかのような線表で分野の変遷が説明されていたのだが,神嶌さんの資料では,ルールベースが枝分かれして現在も細く(?)研究されていることが伝わる表現になっていてとても参考になった.また,ルールベースとニューラルネットが並列に表現されているところも参考になる.

P11 下馬評的予測

「手作業でやっていた規則の生成が,どんどん複雑化して手に負えなくなったら,機械学習が適用されるようになる」という大原則が印象に残った.統計的機械学習がもてはやされる現在,どんなタスクにでもとりあえずdata-drivenな手法を試す人が多い.しかしながら,規則がIF文などによって手作業で書き起こせる程度に収まるのであれば,data-drivenな手法よりも精度も速度も良くなる.しかも,教師データを大量に取得・作成する手間も省けるのだ.本ページの大原則は,機械学習を使ったプロジェクトを検討する際には,心に留めておきたいものだ.

P20 ニューラルネットワークの歴史

ニューラルネットワークの歴史が各年ごとに1行でまとめられていて非常にわかりやすい.1995年にニューラルネットによる公道走行実験が成功していたことは初めて知った.ググってみるとGIGAZINEで記事になっていた.こちらも読んでみると面白い.GIGAZINEには開発者へのインタビューがあるのだが,自動運転車による事故についてのポイントが語られており,20年前にも現在と同じ関心が寄せられていたことが印象深い.

gigazine.net

P28 人工知能についての誤解

本スライドでは,「人工知能というものがあるわけではない」ということを説明するために人工知能と自動車を比べるという内容なのだが,説明が直感的で分かりやすい.スライドでは,○ 自動車:人間の足の走るという機能の代わりをするもの,人工知能:人間の脳の考えるという機能の代わりをするもの という一般大衆が人工知能に対して抱く誤解をまず示している.次に,誤解を解くために,実際の人工知能が「ものではなく,何らかの知的処理を行う人工知能技術+多くの関連技術の集合体」だということが説明されていて,一般の人がもつイメージと実際の差異をうまく表現しているように感じた.これまで筆者も人工知能とは何か?という質問を受けていたが,非情報系の方が抱くイメージと実際の差異をうまく伝えられていなかったので,この分かりやすい説明は非常に参考になった.

P89 関連国際会議の俯瞰図

CV, NLP, DM系など幅広い分野が一枚の図としてまとめられていて参考になる.

P101以降 ML/DM/NN/AI 関連学会

各会議ごとにフォーカスを当てたスライドが用意されていて,こちらも参考になる.最近筆者は,これまで学んでいたCVではなく,NLPで論文投稿をする予定があるのでこうしたまとめ資料は非常にありがたい.

これまで筆者が見てきた中でトップクラスに分かりやすい機械学習概要でした.

以上.