-
Notifications
You must be signed in to change notification settings - Fork 133
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
问题汇总 #16
Comments
感谢分享,对于第二点,我解释一下,对于warp-ctc 见 https://github.com/SeanNaren/warp-ctc/blob/pytorch_bindings/pytorch_binding/warpctc_pytorch/__init__.py 这里第34行求得是sum,size_average默认false,所以结果是没有除以batch_size的,于是在 https://github.com/BADBADBADBOY/pytorchOCR/blob/master/ptocr/model/loss/ctc_loss.py |
补充一点,能装一下warp ctc最好,torch ctc会出现莫名nan的情况,不知道高版本的有没有修复,当然我在crnn.py中也加了防止nan的操作,现在用torch ctc 一般来说不因该会出现nan, 总之warp ctc 用起来更加友好 |
torch ctc nan 是因为超 step 的原因, 加个 zero infinity 就好 |
是官网给出的那个 把梯度为nan的置零的操作吗 |
对的, CTCLoss 有这个参数, 根据我自己撸框架的经历来说有两种情况会导致 loss nan
ZeroInfinity 可以解决偶尔 label 太长的问题 |
下载ag_DB_bb_resnet50_he_DB_Head_bs_8_ep_1200和ag_DB_bb_resnet50_he_DB_Head_bs_8_ep_1201均解压失败,不如直接放上来模型呀。 |
这里面的不用解压,就是模型文件 |
Windows环境遇到 if subprocess.call(['make', '-C', BASE_DIR]) != 0: # return value |
请问 Windows 也可以跑这个代码吗 |
可以跑的-------- 原始邮件 --------发件人: Ethan ***@***.***>日期: 2021年10月18日周一 上午9:54收件人: BADBADBADBOY/pytorchOCR ***@***.***>抄送: Jiolen ***@***.***>, Author ***@***.***>主 题: Re: [BADBADBADBOY/pytorchOCR] 问题汇总 (#16)
Windows环境遇到 if subprocess.call(['make', '-C', BASE_DIR]) != 0: # return value raise RuntimeError('Cannot compile lanms: {}'.format(BASE_DIR)) 直接将这两行注释掉就可以了
请问 Windows 也可以跑这个代码吗
—You are receiving this because you authored the thread.Reply to this email directly, view it on GitHub, or unsubscribe.Triage notifications on the go with GitHub Mobile for iOS or Android.
|
请问在win下编译是怎样的流程呢,需要修改什么文件吗,https://blog.csdn.net/kingroc/article/details/93893828 您给出的这个方法好像只针对于linux系统,win下我没编译成功 |
这是作者写的infer推断备份,你不用管这些bak,只需用rec_infer.py就行发自我的荣耀手机-------- 原始邮件 --------发件人: LanWong1 ***@***.***>日期: 2021年11月11日周四 下午3:27收件人: BADBADBADBOY/pytorchOCR ***@***.***>抄送: Jiolen ***@***.***>, Author ***@***.***>主 题: Re: [BADBADBADBOY/pytorchOCR] 问题汇总 (#16)
—You are receiving this because you authored the thread.Reply to this email directly, view it on GitHub, or unsubscribe.Triage notifications on the go with GitHub Mobile for iOS or Android.
|
你好,我看你dbnet的蒸馏算法里,loss两个都是dice loss,可原版dbnet一个loss是bceloss 这么用是经过实验的吗 |
在icdar2015上实验的,性能就是表格里给的
…------------------ 原始邮件 ------------------
发件人: ***@***.***>;
发送时间: 2021年11月16日(星期二) 下午3:39
收件人: ***@***.***>;
抄送: ***@***.***>; ***@***.***>;
主题: Re: [BADBADBADBOY/pytorchOCR] 问题汇总 (#16)
你好,我看你dbnet的蒸馏算法里,loss两个都是dice loss,可原版dbnet一个loss是bceloss 这么用是经过实验的吗
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub, or unsubscribe.
Triage notifications on the go with GitHub Mobile for iOS or Android.
|
dice用于分割可能比较好吧祝好!王毅---- 回复的原邮件 ***@***.***>发送日期2021年11月16日 15:39 ***@***.***> ***@***.******@***.***>主题Re: [BADBADBADBOY/pytorchOCR] 问题汇总 (#16)
你好,我看你dbnet的蒸馏算法里,loss两个都是dice loss,可原版dbnet一个loss是bceloss 这么用是经过实验的吗
—You are receiving this because you commented.Reply to this email directly, view it on GitHub, or unsubscribe.Triage notifications on the go with GitHub Mobile for iOS or Android.
[
{
***@***.***": "http://schema.org",
***@***.***": "EmailMessage",
"potentialAction": {
***@***.***": "ViewAction",
"target": "#16 (comment)",
"url": "#16 (comment)",
"name": "View Issue"
},
"description": "View this Issue on GitHub",
"publisher": {
***@***.***": "Organization",
"name": "GitHub",
"url": "https://github.com"
}
}
]
|
好的谢谢,所以是实验过在teachermodel里用dice loss会比较好是吗,因为我之前在dbnet里把bce loss 换成了dice loss 效果还是差的比较明显的 |
|
请问以下模型剪枝只适用于mobilenetv3吗?为什么不是通用的剪枝呢?还有就是您使用的剪枝算法是什么?流程是怎么样的? @BADBADBADBOY |
问一下如何加入群呢?二维码已经失效了? |
用L1正则化加到BN层的缩放因子上,训练的时候L1正则化推动BN层的缩放因子趋向于零,然后对bn层通道排序,再剪掉一定比例的通道,最后再finetune,方法适用任何有bn的模型,只是剪枝部分需要根据不同模型重写 |
font{
line-height: 1.6;
}
ul,ol{
padding-left: 20px;
list-style-position: inside;
}
但是那个剪枝是训练之后的剪枝呀, 并不是训练的时候
wangyi4422
***@***.***
签名由
网易邮箱大师
定制
在2022年01月20日 ***@***.***> 写道:
请问以下模型剪枝只适用于mobilenetv3吗?为什么不是通用的剪枝呢?还有就是您使用的剪枝算法是什么?流程是怎么样的? @BADBADBADBOY
请问以下模型剪枝只适用于mobilenetv3吗?为什么不是通用的剪枝呢?还有就是您使用的剪枝算法是什么?流程是怎么样的? @BADBADBADBOY
用L1正则化加到BN层的缩放因子上,训练的时候L1正则化推动BN层的缩放因子趋向于零,然后对bn层通道排序,再剪掉一定比例的通道,最后再finetune
—Reply to this email directly, view it on GitHub, or unsubscribe.Triage notifications on the go with GitHub Mobile for iOS or Android.
You are receiving this because you commented.Message ID: ***@***.***>
|
def polygon_area(self, polygon): |
crnn的文档可否完善一下 |
周末我看看,具体哪里有问题你可以先提出来,不然不知道怎么完善,我这里给出的默认是有一定基础和debug能力的 |
|
key_file 是字典,bg_path是背景图地址,crnn里一种数据增强会用到 |
postprocess文件夹在什么地方 |
请问DBNet有识别任务的预训练模型吗 |
我也是win下编译不了。。。 |
我有一个问题,就是文字检测训练完成之后想执行infer测试一下,由于我是windows操作系统,需要调用ptocr/postprocess |
你可以注释cpp的,用python版的,其实速度也差不了多少
snake
***@***.***
…------------------ 原始邮件 ------------------
发件人: ***@***.***>;
发送时间: 2023年9月1日(星期五) 上午9:12
收件人: ***@***.***>;
抄送: ***@***.***>; ***@***.***>;
主题: Re: [BADBADBADBOY/pytorchOCR] 问题汇总 (#16)
我有一个问题,就是文字检测训练完成之后想执行infer测试一下,由于我是windows操作系统,需要调用ptocr/postprocess
/dbprocess下的cppdbprocess.so文件,但我在 windows下调用cppdbprocess.so文件无法运行,所以我想编译cppdbprocess.pyd文件,但我发现cppdbprocess.pyd文件编译较为困难,尝试多次都失败了,该编译.so的文件的makefile我也都看过了,但在 visual studio生成cppdbprocess.pyd这一环卡主,导致无法执行infer,请问作者能否提供一些帮助?以及在生成cppdbprocess.pyd这个文件上有什么方法?非常感谢。
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
非常感谢badboy的工作,👍赞
记录下自己在使用项目过程中遇见的问题
1、
问题:torch 用不了cuda
原因:pytorch==1.5.0 是用pip安装的,导致torch和cuda可能不匹配,具体匹配规则可见https://blog.csdn.net/kellyroslyn/article/details/109668001
解决:去torch官网下载https://pytorch.org/get-started/previous-versions/,选定指定版本的torch和cuda
2、
问题:训练识别的时候,No module named “warpctc_pytorch”
原因:没有这个库,不能用pip安装,pip直接安装的会报错。
解决:去pypi官网下载这个包即可,需要选定pytorch版本和cuda版本和python版本https://pypi.org/project/warpctc-pytorch/#files
注意:ptocr/model/loss/ctc_loss.py 作者的ctc还有另外一个torch.nn.CTCLoss ,如果用这个的话,训练出来结果不准。网上可以去搜这两个ctc的区别,搞不懂
3、
问题1:编译pse出错,比如 recipe for target 'pixel merge.so' failed
问题2: pse预测的时候出错,libopencv_imgproc.so.3.2:cannot open shared object file
原因:opencv导致,opencv不能用pip安装的,需要源码编译
解决:去opencv官网https://opencv.org/releases/下载3.2.0版本,然后按照下面的教程编译即可https://blog.csdn.net/kingroc/article/details/93893828
(camke的时候注意python版本)
4、
scikit-image 和 numpy 库要匹配,我用的是skimage==0.17.2 和numpy==1.16.2
The text was updated successfully, but these errors were encountered: