AG真人游戏|官方网

019-857896660

在线客服| 微信关注
当前位置: 首页 > 企业新闻

Amazon研究人员用AI提高曲线文本识别,测试准确度超过83%_AG真人游戏


本文摘要:光学文字识别(OCR)将手写或打印机文本的图像切换为机器可读文本,是可追溯到70年代初的技术。

AG真人游戏官方网

光学文字识别(OCR)将手写或打印机文本的图像切换为机器可读文本,是可追溯到70年代初的技术。但是,由于长期以来OCR算法很难识别与水平面不平行的文字,Amazon的研究开发者开发了Texttubes这一技术。这是自然图像中曲线文本的检测器,可以将文本建模为包围其中轴线的管状。在描述工作的论文中,合作者主张他们的方法在标准化的OCR基准上超过了最先进的设备。

【照片来源:venturebeat所有者:venturebeat所】正如研究者说明的那样,场景文本一般分为文本检查和文本识别两个倒数任务。第一个是用于定位文字、单词和行,第二个是mRNA的内容。

两者都说在一起更容易,自然环境中的文本不仅受到变形的影响,也不受视点变化和字体的影响。该团队的解决方案是利用文本参照框架的管状表达形式,利用目标文本一般是大小相近的文字串联的事实,捕捉大部分可变性。与传统的方法相比,更容易重叠和产生噪音的矩形和四面形来捕捉文本信息,它被公式化为数学函数,需要训练机器学习场景文本检测器。

AG真人游戏网站网址

研究人员在CTW-1500上评价了TextTubes的性能。CTW-1500是数据集,该数据集由自然场景和图像库收集的1500张图像(每张图像最少1个曲线例),最多10000个文本例构成。同时在Total-Text上展开评价,Total-Text包括约1255次训练图像、300个测试图像和一个或多个曲线文本实例。据报道,CTW-1500以83.65%的精度获得了业界领先的结果,最相似的方法精度为75.6%。

对一个案例的中间轴和均值半径开展建模……能够捕捉到整个案例的信息。这篇论文的年度出版者写道。在单词组成的数据集中,如Total-Text,我们的模式需要构建最先进的设备性能。在具备行级评论的数据集中,例如CTW-1500,我们的模型需要更好地捕捉例子中每个单词的文本信息。

如果有一天TextTubes需要使用的话,对于依赖OCR技术开展业务的企业来说,这可能是个好消息。据估计,80%以上的数字流程仍有纸张,约97%的中小企业仍在用于纸张支票。据GrandViewRearch的数据显示,到2025年,OCR解决方案市场的价值可能超过138亿8千万美元。

AG真人游戏网站网址

AG真人游戏网站网址

(公共编号:)viaVB原创文章允许禁止发表。下一篇文章发表了注意事项。


本文关键词:AG真人游戏,AG真人游戏官方网,AG真人游戏网站网址

本文来源:AG真人游戏-www.bugistube.com

客户案例Customer case
  • 【AG真人游戏】上海市质监局公布固定式通用灯具抽检结果:仅2批次产品不合格!
  • 新年第一站,盐城移动东台海域离岸基站开通-AG真人游戏官方网
  • 高铁Wi-Fi已有基本方案:旅途上网不是梦【AG真人游戏官方网】
  • AG真人游戏网站网址|太阳能光伏扶贫助力村民早日脱贫
  • AG真人游戏|9个月营收超10亿,平安好医生提交赴港IPO申请
  • 外媒:强震造成土耳其南部度假胜地约80人受伤
  • AG真人游戏|尚冰:畅通信息丝绸之路壮大中国标准“朋友圈”
  • AG真人游戏网站网址:凯盛科技1.5亿连投两个玻璃盖板相关项目
  • AG真人游戏:加拿大两名宗教领袖一夫多妻被判有罪
  • AG真人游戏官方网_豆瓣鹅组什么意思怎么加入 豆瓣鹅组什么梗内涵