1、“.....等人使用来预测输入图像的种类型的地图。然后进行些后处理以获得带有分割图的文本边界框。摘要场景文本检测是场景文本识别系统的重要步骤,也是个具有挑战性的问题。与般对象检测不同,场景文本检测的主要挑战在于自然图像中文本的任意方向,较小的尺寸以及类是基于目标检测直接预测候选边界框的文本检测算法如,和。第类是基于语义分割,例如文献和文献,它们生成分割图并通过后期处理生成最终的文本边界框。本文基于目标检测算法通过端到端可训练的单个神经网络直接预测具有边形的单词边界框来检测文本,并在网络中构建自适应非极大值抑制算法,称之为。本文基于目标检种基于自适应非极大值抑制的文本检测算法论文原稿模型可以在单个网络中精确高效地检测任意方向的场景文本。同时,本文还对非极大值抑制做了修改,使其可自适应地检测文本框附近的密度值。在评估实验中......”。
2、“.....在数据集上,以得到的值。关键词文本检测自适应非极大值抑制卷积神经网络中图分类号文献标识码文章编号引言场景文本是自然场景中最致为超参数当大于等于时,自适应阈值将转变成,即当前。种基于自适应非极大值抑制的文本检测算法论文原稿。本文用边形代替传统目标检测中的矩形框来表示文本区域,同时为了识别较长的文本区域,加入长条形卷积核来预测文本区域边界框。通过联合预测文本是否存在和锚点框坐标偏移,直接在多层输出文本边界框,然后输出所有锚点框经过可学习定的偏差在密集文字场景中,人类实例彼此高度重叠的检测框。为了适应密集文字场景检测,应考虑远离的检测框,其误报的可能性较小,因此应予以保留对于高度重叠的相邻检测框,抑制策略不仅取决于与的重叠,而且还要判定此时是否位于拥挤区域。如果位于拥挤的区域......”。
3、“.....因此应给予较轻的惩罚或予以保留。但是对于稀疏区域继承了当前较为流行的网络结构,保留了从到的卷积层,并将的最后两个全连接层转换为两个卷积层进行下采样。在之后通过最大池化分成不同分辨率的另外个卷积层,分为个阶段。然后,在之后加入多个上采样卷积层用来聚合不同感受野下的检测结果。最后,通过自适应非极大值抑制提取出文本框。综上所述,是完全卷积是通过增加邻居与得分较高的边界框的重叠程度来降低邻居的检测得分。文献试图学习仅使用盒子及其分数作为输入的深层神经网络来执行功能,但是该网络经过专门设计并且非常复杂。文献提出了个对象关系模块来学习作为端到端通用对象检测器的功能。文献用学习到的本地化置信度代替了在过程中使用的提议分类分数,以指导保存更准确的本地化边界的检测得分。文献试图学习仅使用盒子及其分数作为输入的深层神经网络来执行功能......”。
4、“.....文献提出了个对象关系模块来学习作为端到端通用对象检测器的功能。文献用学习到的本地化置信度代替了在过程中使用的提议分类分数,以指导保存更准确的本地化边界框。与它们不同的是,本文建议将每个真实目标周围的密度实的,因此应给予较轻的惩罚或予以保留。但是对于稀疏区域的实例,惩罚应更高些。本文将检测框的拥挤度定义为其他检测框与检测框重叠部分的最大值,如公式所示另外,本文将非极大值抑制的阈值进行调整,用与的较大值作为当前循环下的阈值如公式所示其中,表示检测框的自适应非极大值抑制阈值,表示检测框的拥挤度,表示检测框得分或经过前序非极大值抑制后的当前得非极大值抑制提取出文本框。综上所述,是完全卷积的结构,仅由卷积和池化层组成,所以可以在训练和测试阶段适应任意大小的图像......”。
5、“.....这个检测框是假阳性的可能性更大。这个假设用于目标识别时没有问题,因为在正常情况下种基于自适应非极大值抑制的文本检测算法论文原稿框。与它们不同的是,本文建议将每个真实目标周围的密度作为自己的抑制阈值来学习,这与文字计数任务中的文字密度估计有些相似之处。网络结构本文使用基于的全卷积网络结构作为主干网络,使用类似于的构建方式聚合低卷积层特征,网络结构如图所示。种基于自适应非极大值抑制的文本检测算法论文原稿。中实现。所有实验都是在常规工作站上进行的。我们在个上并行训练具有个批处理大小的模型,并在个批处理大小的上评估模型。评估协议用于文本检测和文本识别的经典评估协议都依赖于个参数,它们分别是准确率,召回率和值。和被提出用来改善的结果。不会丢弃得分低于阈值的所有周围提议,而测文本......”。
6、“.....称之为。本文用边形代替传统目标检测中的矩形框来表示文本区域,同时为了识别较长的文本区域,加入长条形卷积核来预测文本区域边界框。通过联合预测文本是否存在和锚点框坐标偏移,直接在多层输出文本边界框,然后输出所有锚点框经过可学习非极大值抑制后的锚点框。在网络中,单个前向网络可以作为自己的抑制阈值来学习,这与文字计数任务中的文字密度估计有些相似之处。网络结构本文使用基于的全卷积网络结构作为主干网络,使用类似于的构建方式聚合低卷积层特征,网络结构如图所示。数据扩充我们使用与相同的数据扩充方式。我们以方式从输入图像中随机采样补丁,然后将采样补丁的大小调整为。我们的方法在分。当邻近检测框与检测框重叠区域小于时,阈值与传统致为超参数当大于等于时,自适应阈值将转变成,即当前。种基于自适应非极大值抑制的文本检测算法论文原稿......”。
7、“.....不会丢弃得分低于阈值的所有周围提议,而是通过增加邻居与得分较高的边界框的重叠程度来降低邻居目标很少会发生遮挡。但是,这种假设在拥挤的场景中则会有定的偏差在密集文字场景中,人类实例彼此高度重叠的检测框。为了适应密集文字场景检测,应考虑远离的检测框,其误报的可能性较小,因此应予以保留对于高度重叠的相邻检测框,抑制策略不仅取决于与的重叠,而且还要判定此时是否位于拥挤区域。如果位于拥挤的区域,则其高度重叠的相邻检测框很可能是真检测图像上的多尺度文本框。该检测器在速度上具有很大优势。继承了当前较为流行的网络结构,保留了从到的卷积层,并将的最后两个全连接层转换为两个卷积层进行下采样。在之后通过最大池化分成不同分辨率的另外个卷积层,分为个阶段。然后,在之后加入多个上采样卷积层用来聚合不同感受野下的检测结果。最后......”。
8、“.....近来取得了明显的进步。这些场景文本检测器主要可以分为两类。类是基于目标检测直接预测候选边界框的文本检测算法如,和。第类是基于语义分割,例如文献和文献,它们生成分割图并通过后期处理生成最终的文本边界框。本文基于目标检测算法通过端到端可训练的单个神经网络直接预测具有边形的单词边界框来检显著不同的宽高比。本文提出了种名为可端到端训练的文本检测模型,该检测模型可以在单个网络中精确高效地检测任意方向的场景文本。同时,本文还对非极大值抑制做了修改,使其可自适应地检测文本框附近的密度值。在评估实验中,在准确率和召回率上都表现出了定的优势。在数据集上,以得到的值。关键词文本检测自适应非极大测算法,与上述直接回归文本框或直接分割的方法不同,我们定位文本框角点的位置......”。
9、“.....基于分割的文本检测基于分割的文本检测是文本检测的另个方向。受的启发,提出了些使用分割图来检测场景文本的方法。在文献中,等人第次尝试由从分割图提取文本块。然后,他们常见的视觉对象之,经常出现在道路标志车牌广告牌产品包装上。尽管自然场景下的文本检测与传统的相似,但由于文本的多样性背景的复杂性以及无法控制的光照条件等因素,使得场景文本阅读更具挑战性,如文献所述。近年来,场景文本检测已经得到了广泛的研究,并且随着目标检测语义分割的迅速发展,近来取得了明显的进步。这些场景文本检测器主要可以分为两类。非极大值抑制后的锚点框。在网络中,单个前向网络可以检测图像上的多尺度文本框。该检测器在速度上具有很大优势。摘要场景文本检测是场景文本识别系统的重要步骤,也是个具有挑战性的问题。与般对象检测不同......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。