通用文字识别
产品介绍
通用文字识别(General Optical Character Recognition,General OCR)基于行业前沿的深度学习技术,提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。
功能介绍
功能列表
通用印刷体识别
支持多场景、任意版面下整图文字的识别。支持自动识别语言类型,同时支持自选语言种类(推荐),除中英文外,支持日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。应用场景包括:印刷文档识别、网络图片识别、广告图文字识别、街景店招识别、菜单识别、视频标题识别、头像文字识别等。
支持图像整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,准确率和召回率更高。
支持多场景、任意版面下整图文字的识别。相较于“通用印刷体识别”接口,精简版接口在准召率有一定损失的情况下,耗时更短。适用于对接口耗时较为敏感的客户。
支持图像整体文字的检测和识别,返回文字框位置与文字内容。暂未支持多语种识别,推荐使用通用印刷体识别接口。
支持多场景、任意版面下整图文字中的手写中文、英文、字母、数字、常见字符的识别。针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。可应用于银行、保险、金融等手写单据录入、教育行业笔记文档化等场景。
支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。可应用于英文笔记作业文档化、英文试卷答题卡识别等场景。
支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。支持中英文、横排和竖排文字识别,支持90度、180度、270度翻转以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。
通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
通用印刷体识别(高精度版)
通用印刷体识别(精简版)
通用印刷体识别(高速版)
通用手写体识别
英文识别
广告文字识别
快速文本检测
- 上一篇:音频文件转写 2022/8/8
- 下一篇:长江流域生态气象遥感监测年报发布 生态环境质量持续改善 2022/7/26