NeurIPS2019において、主著論文が採択されました。

機械学習のトップ国際会議であるNeurIPS2019において、知能推論研究分野のHolland助教と原助教の主著論文がそれぞれ採択されました。
https://neurips.cc/Conferences/2019/AcceptedPapersInitial

概要

ホーランドマシュージェームズ　助教　（知能推論研究分野）

論文情報
論文名：[1] PAC-Bayes under potentially heavy tails
著者：　Matthew Holland (Osaka University)

昨今広く注目を集めている人工知能「AI」の技術的基盤をなすのは、機械学習の種々の手法である。これらの手法が産学官の各界で広く普及しはじめており、多種多様の応用によって目覚ましい成果が見られる一方、その工学的な信頼性には依然として課題が山積している。たとえば、病理画像の自動識別を任された学習機の「経験」に相当する観測データをいくら投入すれば、一定の時間内に望ましい結果を導き出せるか？学習機の「性能保証」にかかわるこの素朴な問いに答えることは、意外にも困難である。人間の学習機構を模倣して、ある種の「事前知識」をうまく機械学習の性能保証に反映させる仕組みとして、「PAC-Bayes理論」が2000年前後から、多くの研究者の手によって発展を遂げ、理論保証つきの実用的なアルゴリズムの開発にも大きく寄与してきた実績がある。しかし、この理論は比較的に「都合の良いデータ」を前提としており、外れ値や非対称性がよく見られる現実世界のデータとは相当の乖離があり、方法論としての適用範囲が狭いことも事実である。そこで本研究では、この枠組みの範囲を大きく拡げるべく、PAC-Bayes系の学習機がフィードバックとして使う統計量の抜本的な改良を図ることで、計算量を抑えつつ、統計的精度とロバスト性を高めることが可能であることを証明している。数学的な根拠と実装可能なアルゴリズムを踏まえて、理論と実践の乖離が埋まり、機械学習のさらなる信頼性の向上が期待される。

概要

原　聡　助教（知能推論研究分野）

論文情報
論文名： Data Cleansing for Models Trained with SGD
著　者： Satoshi Hara (Osaka University), Atushi Nitanda (The University of Tokyo / RIKEN AIP), Takanori Maehara (RIKEN AIP)

精度の高いAIを作るためには質の高いデータが必要である。AIの元になるデータに"変なデータ"が含まれていると出来上がるAIの精度は劣化してしまう。本研究では、このような精度劣化の原因となる"変なデータ"を特定する新手法を開発した。新手法を使って "変なデータ"を取り除いてからAIを作ることで、AIの精度を向上させることができる。これにより、従来は専門家などが人手で確認していた"データの質"を自動的に評価し、かつ専門家の経験や勘によらずに"データの質"を改善することが可能になる。