Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

训练中突然total_loss=NaN的问题 #86

Open
Wangxinyu-qlz opened this issue Dec 1, 2023 · 3 comments
Open

训练中突然total_loss=NaN的问题 #86

Wangxinyu-qlz opened this issue Dec 1, 2023 · 3 comments

Comments

@Wangxinyu-qlz
Copy link

没有改动网络;二分类的任务训练;数据集包含2.4w个图像;batch_size=24,input_size=256×256;
问题:在第99个eopch时,total_loss突然为nan,在第101个epoch时,val_loss也变成了nan,如图所示
image
image
我查了下,具体有这几种情况:梯度爆炸、学习率过大、损失函数不合适等等,但是不知道是哪种原因。
请问老师您有何见解?

@yesulove
Copy link

yesulove commented Oct 7, 2024

没有改动网络;二分类的任务训练;数据集包含2.4w个图像;batch_size=24,input_size=256×256; 问题:在第99个eopch时,total_loss突然为nan,在第101个epoch时,val_loss也变成了nan,如图所示 image image 我查了下,具体有这几种情况:梯度爆炸、学习率过大、损失函数不合适等等,但是不知道是哪种原因。 请问老师您有何见解?

你好,请问如何在网络中加代码得到您的曲线图呀,bubbliiiing博主给的代码没有曲线图的相关代码,请问您可以分享吗~

@Wangxinyu-qlz
Copy link
Author

Wangxinyu-qlz commented Oct 11, 2024

你好,请问如何在网络中加代码得到您的曲线图呀,bubbliiiing博主给的代码没有曲线图的相关代码,请问您可以分享吗~

你好,在根目录中的train.py中,317行:
image

这行代码调用的是util包下callbacks.py的代码。其中就有绘制曲线图的代码,可以在PyCharm中,通过按住Ctrl的同时,鼠标左键点击函数名/类名定位到关键代码处。
更多细节,请自行探究。希望能帮助到你。

@yesulove
Copy link

你好,请问如何在网络中加代码得到您的曲线图呀,bubbliiiing博主给的代码没有曲线图的相关代码,请问您可以分享吗~

你好,在根目录中的train.py中,317行: image

这行代码调用的是util包下callbacks.py的代码。其中就有绘制曲线图的代码,可以在PyCharm中,通过按住Ctrl的同时,鼠标左键点击函数名/类名定位到关键代码处。 更多细节,请自行探究。希望能帮助到你。

太感谢啦!好仔细~~

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants