Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

如何优化EAST,模型输出,工程代码一点问题? #104

Open
YuTingLiu opened this issue Nov 22, 2019 · 2 comments
Open

如何优化EAST,模型输出,工程代码一点问题? #104

YuTingLiu opened this issue Nov 22, 2019 · 2 comments

Comments

@YuTingLiu
Copy link

非常感谢公开提升的方法,但是中间做法有点疑惑?

@huoyijie 你的模型流程图输出:
image

@kurapan 原始模型流程图输出:
image

模型预测的输出看到是不一致的,区域判断上多了一个结束标识,处理上,你是将激活像素合并,输出结果区域,具体合并部分在nms.py文件中。
程序上的合并区域能够超过模型学习的区域识别吗?

@YuTingLiu
Copy link
Author

在nms.py中,不知我理解的对不对,特征图shape为:(184, 160),先行后列合并激活像素,得到group D,接下来就是计算每个区域坐标和得分,这块代码没有看懂。

实际上,scipy.ndimage.label连通区域与opencv计算矩形区域,特征图与原图缩放比例为4,可以直接得到预测区域坐标。但是这样区域尺度上与nms计算不一致。。。

有没有解答一下的?

@jiangguisyp
Copy link

在nms.py中,不知我理解的对不对,特征图shape为:(184, 160),先行后列合并激活像素,得到group D,接下来就是计算每个区域坐标和得分,这块代码没有看懂。

实际上,scipy.ndimage.label连通区域与opencv计算矩形区域,特征图与原图缩放比例为4,可以直接得到预测区域坐标。但是这样区域尺度上与nms计算不一致。。。

有没有解答一下的?

特征图上的激活像素并不对应着 文本区域,也不是对应着缩放的4倍的文本区域,每个激活其实都是一个框,一个连通域有很多个激活像素,也就是很多预测框,作者没有采用先把框预测出来,再用nms来融合的策略,而是先融合激活像素的值,最终预测出一个框。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants