ハナノナ

人工知能花分類システム

開発概要

モデル

認識で用いたディープラーニングのモデルは GoogleNet with Batch Normalization です。コードは Soumith Chintala氏の torchによる実装をほぼそのまま使用しました。
→ https://github.com/soumith/imagenet-multiGPU.torch
変更したのは最終層のsoftmaxの出力数を406にしただけ。

データセット

花の画像はImageNet(http://www.image-net.org )の中に種別に集められている花画像をダウンロードして使用しました。たくさんの種類がありますが、画像が十分な数ないものも多いです。私たちが使用したWNIDの一覧はここを参照して下さい。対応する英語名、和名も合わせてリストにしてあります。

ご注意:残念ながらimage-net.orgの花画像には誤ってラベルづけされた画像も少なからずあります。従って、使用する際にはそれらの誤分類されたデータを削除したり、またそれに伴って画像を補充するなどする必要があります。本開発では訓練にあたっては1種類あたり700枚以上の画像を用意しました。

性能

それぞれの種類ごとに50枚のテスト画像を用意して性能を計測したところ
top1 accuracy = 77.5%
top5 accuracy = 96.5%
となっています。