アレックスネットワークの重みの更新について

Question

0 votes

スクリーンショット (172).png

アレックスネットワークのパラメータの更新の仕方について質問です。

添付させていただいた画像のようにアレックスネットワークを利用しました。データセット全150枚のうち、105枚(70％)を学習用に、

45枚(30％)を検証用データとして、ミニバッチサイズを10枚、エポック数を10としています。したがって、画像のように1エポックあたりの反復回数は105/10→10回となっています。

ここで分からないこととしては、ミニバッチあたりの重みの更新の仕方についてです。

私の認識としては、

まず学習用データ1枚分について、逆伝播によって何回かの重みの更新を行う→次の2枚目に重みを引き継ぎ、何回か更新を行う→バッチサイズ10枚分で同じ事を行い、最終的にミニバッチ1単位での重みを決定する。→次のミニバッチに重みを引き継ぐ→・・・

というものなのですが、合っていますでしょうか。また、もし合っている場合、下線部の回数がいくつなのかを知ることは可能でしょうか。

説明がわかりにくく申し訳ないですが、よろしくお願いいたします。

0 Comments
Show -2 older comments Hide -2 older comments

Sign in to comment.

Sign in to answer this question.

Follow Question

Answer 1

Kenta on 25 Jan 2022

Open in MATLAB Online

1 vote

こんにちは、以下私の理解で恐縮なのですが、

１０枚分（ミニバッチの数）のデータで推論＝＞１０枚分のクロスエントロピー誤差を計算（損失の計算）＝＞逆誤差伝搬にてネットワーク全体の重みを更新（回数でいうと１回、というのがよいでしょうか）

という感じではないですかね。

スクリーンショットを見る限り、trainの関数で学習させてると思うのですが、

カスタムループで書く版のドキュメントを見ると参考になるかもしれません。

例えば、以下の関数で入力Xと正解Yがあったときにforwardさせて、さらにそこからロスを計算させて、勾配を求めているのがわかると思います。

質問者さまのおっしゃるように、１枚ずつ勾配を出して更新するのではなくて、１０枚の結果をもって更新させています。

１０枚だと１０枚分の結果が平滑化されるのですが、１枚だとノイジーになって、学習曲線が非常にガタガタした感じになると思います。

function [gradients,state,loss] = modelGradients(dlnet,dlX,Y)
    [dlYPred,state] = forward(dlnet,dlX);
    loss = crossentropy(dlYPred,Y);
    gradients = dlgradient(loss,dlnet.Learnables);
    loss = double(gather(extractdata(loss)));
end

https://jp.mathworks.com/help/deeplearning/ug/train-network-using-custom-training-loop.html

2 Comments
Show None Hide None

創尾崎 on 26 Jan 2022

ご回答ありがとうございます！

理解できました！

Kenta on 26 Jan 2022

よかったです。細かくて申し訳ないですが、AlexNetと表記した方が、のちに検索に引っかかりやすくなって他の方に有用かもしれません。

Sign in to comment.

アレックスネットワークの重みの更新について

0 Comments
Show -2 older comments Hide -2 older comments

Accepted Answer

2 Comments
Show None Hide None

More Answers (0)

Categories

Tags

Community Treasure Hunt

アレックスネットワークの重みの更新について

0 Comments Show -2 older comments Hide -2 older comments

Accepted Answer

2 Comments Show None Hide None

More Answers (0)

Categories

Tags

See Also

Community Treasure Hunt

0 Comments
Show -2 older comments Hide -2 older comments

2 Comments
Show None Hide None