微网站搭建平台,app开发公司网站,网络维护公司,个人网站空间大小文章目录一、研究背景二、方法流程1. 特征提取2. 核建议3. 实例无关特征图4. 轮廓生成5. 其余部分内容三、不足一、研究背景 相比起基于 FCN 网络的文本边缘检测网络#xff0c;KPN网络可以更好地处理文本之间的间隔。
二、方法流程 1. 特征提取
FCN 和 FPN
FCN(全卷积神经…
文章目录一、研究背景二、方法流程1. 特征提取2. 核建议3. 实例无关特征图4. 轮廓生成5. 其余部分内容三、不足一、研究背景 相比起基于 FCN 网络的文本边缘检测网络KPN网络可以更好地处理文本之间的间隔。
二、方法流程 1. 特征提取
FCN 和 FPN
FCN(全卷积神经网络) 介绍
FPN(特征金字塔神经网络) 介绍
特征提取网络有两个输入图片和位置信息
位置信息怎么来的
对图片中每一个像素点进行处理从而生成两个通道的特征图。
每个像素点具有关于 x 轴和 y 轴的位置信息每个像素点的 x 轴生成一个通道y轴生成一个通道。位置大小范围转换为 [−1,1][-1,1][−1,1], 即在坐标原点处的像素点关于 x 轴的值为 -1。
具体计算方法如下图所示。 其中 w,hw, hw,h 表示输出特征图的宽度和高度iii 表示第 iii 个像素点。 2. 核建议
预测中心图获取文本的连通分量, 获取连通分量是因为对于一个文本实例存在冗余点
分量得分点最高的像素作为关键点 关键点对应位置的特征图为预测核 3. 实例无关特征图
嵌入特征图与预测核进行卷积得到实例无关特征图 其中 OOO 表示输出的实例无关特征图每个通道对应一个文本的预测(pip_ipi)
KKK 表示得到的卷积核
EEE 表示预测中心图(FsF_sFs) 和 嵌入特征图(FpF_pFp) 的卷积结果 4. 轮廓生成
通过预先设定的阈值对预测出的实例无关特征图进行二值化处理得到待检测文本的轮廓 5. 其余部分内容
对于在找到的每一个预测中心图中找到的点实际上对应的是一个文本实例。所以由此得到的核建议之间应该尽量保持正交关系这样就可以在一定程度上避免不同文本实例之间的干扰。
由此可以得到一个函数 KKK 表示得到的卷积核kik_iki 表示由预测中心图中的一个点得到的核建议。
对此提出了一个损失函数 LOLLL_{OLL}LOLL 其中 III 表示单位矩阵
LdiceL_{dice}Ldice表示骰子损失
LBCEL_{BCE}LBCE表示二进制交叉熵损失。 三、不足
对场景文本复杂和小文本的环境下存在漏检的情况.
红色表示实际情况绿色表示 KPN 检测结果