フルスタックエンジニアを目指す|株式会社ナンバーワンソリューションズ

フルスタックエンジニアを目指す

AI

正答率アップに向けて何ができるの?

投稿日:

久しぶりの投稿になります。今回は機械学習の正答率アップに向けてどう改善すればいいのかについてです。
これまで機械学習の理論的な内容を投稿してきました。その内容をいかしいざプログラミングしてみた結果思ったよりも正答率が高くなかった場合どのようにすればいいのか。
アップする方法について考えていきたいと思います。
①学習データを増やす
1にも2にも機械学習の正答率アップするには学習データを増やすことが一番の方法です。画像を用いた分類でも如何に学習データを増やすのか。そこが重要になってくるはずです。
主な収集方法(画像の場合)には
・Webでスクレーピング
・WebAPIを用いる
・動画をフレーム解析する
などがあげられるでしょうか。まずはデータの量を上げることから始めましょう

②データクレンジング
データの量が増えても期待通り正答率が上がらない場合データのクレンジングをしてみましょう。集めてきたデータの中には
・不鮮明・不適切なもの
・紛らわしいもの
・ラベルの誤り
など正答率を下げる原因になるデータが含まれている場合があります。それを取り除く、きれいにするだけでも正答率がアップする可能性があります

③特徴量の導入
特定の特徴を取り出す特徴量の研究が進んでいます。そのような特徴量を導入するだけでも分類の性能は上がる可能性があります。
画像であればHOG特徴量などです。

④パラメータチューニング
これまで挙げてきた方法でも学習率が上がらない場合何か方法はないのでしょうか。学習アルゴリズムのパラメータを調整するという方法があります。
扱うデータの種類などによって適切なパラメータは変わってきます。適切なパラメータを探し出すことで性能アップが見込めます。
複数のパラメータの組み合わせから適切なパラメータの組み合わせを見つける方法をグリッドリサーチと言います。

いかがでしょうか。上記の方法を検討しながらより正答率の高い機械学習システムを作成していきましょう。

-AI

Copyright© フルスタックエンジニアを目指す , 2019 All Rights Reserved Powered by STINGER.