1 はじめに

CX事業本部の平内(SIN)です。

[2020/05/26 一部のデータセットに誤りがあり、結果が変化したため、本記事を修正しました]

Amazon SageMaker(以下、SageMaker)の組み込みアルゴリズムである「イメージ分類」において、データセットの解像度の違いが、学習及び、検出状況にどのように影響するかを確認してみました。

元となるデータ自体や、その適用場面によって評価は大きく変わりそうですが、あくまで一例と言う位置づけで、以下の条件で違いを確認してみました。

  • データ(静止画)は、動画から生成し各ラベル200枚とする
  • 解像度の違うデータは、動画の解像度を変換することで生成する
  • ハイパーパラメータは、同一にする

下は、対象(商品)をWebカメラで撮影して、評価している様子です。

結果は、以下のとおりです。単純にデータセットの解像度が高いほど、検出の精度が良いとは言えないようです。

解像度accuracyepoch学習時間(sec)評価800 * 6000.93151737○640 * 4800.94202295○320 * 2400.985202232◎160 * 1200.987202240○80 * 601.0202376×

  • ◎ 80%以上で、すべて検出
  • ○ 60%以上で、すべて検出
  • × 誤検出多数

以下、詳細です。

#aws #クラウド #ia #sagemaker

イメージ分類において、データセットの解像度が、学習及び、検出結果に与える影響について確認してみました | Developers.IO
1.80 GEEK