ディープラーニングニューラルネット時系列について
6 views (last 30 days)
Show older comments
単純な複数行1列の数列をニューラルネット時系列を用いて学習させようと思っているのですがいくつか疑問が湧いたので質問させていただきます。具体的にやろうとしていることは為替市場の値動きについて1分足の始値を数列として捉えて学ばせようということです。1、検証データとテストデータはどのタイミングでどのように使われているのか。このふたつのデータの違いがいまいち分かりません。2、時間遅延という項目で何が変わるのか。3、学習した後のネットワークを違う数列を用いて予測したものが合っているかを確かめる方法。ディープラーニングを学び始めたばかりの初学者なので分かりやすい説明を頂ければ幸いですよろしくお願いします。
0 Comments
Answers (1)
Hiro Yoshino
on 29 Aug 2022
(1) 検証データ >> モデルを学習後、モデル選択やパイパーパラメータの決定の時に利用されます。モデルの学習に使われていないので、フェアな比較がモデル間(異なるハイパーパラメータモデル間) で行えます。テストデータ >> 検証データと学習データをモデルを選択するところまで含めての”学習データ”と捉えます。”学習後 (モデル選択も含めた)”の実際の能力を測るために利用するデータです。
3つのデータの利用は推奨ですが、データ数に限りがある場合などは、テストデータ、検証データの順で省略されたりします。
(2) 時間遅延 とは何を指しますか?
(3) 数列という表現がイマイチはっきりしませんが、どういった話でしょうか?何かモデルがあるなら、ARIMA 等での確率過程モデリングになるかなと思います。ディープラーニングはモデルがブラックボックスで、予測に特化した手法です。基本的に解釈性は期待できません。
※定期的にファイナンス向けのセミナーなどがありますので、YouTube や配信メールをチェックされると良いかと思います。2019, 2020, は金融データにディープラーニングを用いる手法を日本でもご案内しています。
2 Comments
Hiro Yoshino
on 30 Aug 2022
[1] 先の回答にもあるように、検証データはテストデータが確保出来る場合、ハイパーパラメータのチューニング (モデル選択) に用いられることが多いです。ニューラルネット時系列アプリとは"こちら"のことですか? このアプリにはハイパーパラメータのチューニング機能は入っていないと思います。 つまり、自動では出来ません。
[2] 状況がよく把握できませんが (ランダムなn番目とは?、なぜランダム?) 、検証データは多いに越したことは無いかと。”たまたまこのデータに対して良かった”という状況を減らし、汎化性能を向上させるためです。
[3] テストデータを使って検証すれば良いのではないでしょうか? 浅いニューラルネットワークで実行する場合、中間層の数はせいぜい2層までだったと思います。その際、時系列データには再帰型 NN を使うと良いと思います。ディープニューラルネットワークなら、レイヤーの制約は特に有りません。細かい作り方を勉強したければ、(1) (有償・無償) のオンライントレーニングを受講 (https://matlabacademy.mathworks.com/) (2) 有償トレーニングコースに受講 (https://www.mathworks.com/learn/training.html) (3) MATLAB のドキュメンテーションを読んで頑張る (https://www.mathworks.com/help/deeplearning/) (4) 無料の公開セミナー等にたくさん参加して頑張る
の4つの方法があります。
See Also
Categories
Find more on 時系列、シーケンス、およびテキストを使用した深層学習 in Help Center and File Exchange
Products
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!