faster r-cnn についての質問
Show older comments
Faster R-CNNにていて教えていただきたいことがあります。今、ディープラーニングで研究を行うにあたり先行研究(同研究室)で行われていたFaster R-CNNのネットワークを比較実験するために、学習済みのネットワークを調べています。このネットワークは2017aでのバージョンで作成されています。
ここで何点か疑問に思ったので質問いたします。
まず、InputLayerを調べてみると[32 32 3]と比較的小さいサイズになっているのですが、アンカーボックスのサイズはそれより大きい224*212などのサイズになっています。学習データはsmallestImageDemensionで700*700の同一サイズに変更されていますが、自分の理解ではそれをさらに32*32にリサイズされ入力層に流れると思っています。そこで下記のURLで同じような質問をしてあるのを見つけたのですが、どうやら仕様が2017とでは違うようで、2017では検出するオブジェクトの検出するサイズに合わせて入力サイズを決めているそうなのですが、答えにある内容があまり理解できませんでした。
この質問者と同じ疑問ですが[32 32]の画像ではあまりにも小さすぎると思い、どうやって学習していたのか疑問です。2020verで例にのっとって入力サイズを224*224で行ってもうまく学習できません。
もし2017verでFRCNNを学習していた方や、この変更点について少しでも知っている方がいましたら、教えていただけると幸いです。
よろしくお願いいたします。
8 Comments
Kenta
on 25 Sep 2020
こんにちは、以前の結果と比べたいのであれば、それはややこしい状況ですね。例えば、以前のデータがあるのであれば、2020bで以前のものと改良版を両方実行してみて比べるのはどうか?と思ったのですが、それは可能な状況なのでしょうか?
HY
on 25 Sep 2020
Kenta
on 25 Sep 2020
なるほど、詳しく教えていただきありがとうございます。
>>別枠でも質問しましたが、入力が32*32と非常に小さく、そもそも2017verとは学習方法が異なっているように感じます。
ありがとうございます。別枠の質問がありましたね、失礼しました。
transformを使っての実装はすでにされましたか?それを使って、2020bでやれば、比較ができると思うのですがいかがでしょう。
HY
on 26 Sep 2020
Kenta
on 26 Sep 2020
詳しくありがとうございます。
手短な返信で恐縮ですが input layerの入力サイズを700などの大きめの値に統一するのではいかがでしょうか?
HY
on 26 Sep 2020
Kenta
on 26 Sep 2020
なるほど、ありがとうございます。
それではなぜ、先行研究のほうではうまく行ったんですかね?もし、以前どこかの質問やコメントですでに言及があれば申し訳ありません。
バックボーンネットワークを変えたり、アルゴリズムをR-CNN系からYOLOなどに変更してうまくいくとよいのですが、、、
HY
on 26 Sep 2020
Accepted Answer
More Answers (0)
Categories
Find more on 深層学習を使用したオブジェクトの検出 in Help Center and File Exchange
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!