多可新增图片文字识别(OCR)模块,图片也能全文检索
标签:
ocr识别图片搜索图片全文检索图片文字识别全文检索 |
分类: 使用指南 |
超强的全文检索功能一直是多可系统的一大特色。
对于上传到多可系统的word、excel、ppt、txt、pdf这样的文字类文档,使用者不仅能通过标题检索到文件,还可输入关键词对文档的内容进行全文检索。只要文档中有这个词,就能找到这个文件。
现在,全文检索功能不仅适用于文字类文档,也适用于图片类文档了。多可于近期推出v6.3版本,新增了对<图片文字识别(OCR)模块>的支持,安装该模块后,系统就能自动识别图片中的文字,显示识别后的文字结果,并支持输入文字检索图片。
安装模块后,系统立即开启图片文字识别功能。对于安装模块前上传的图片,系统不做处理;对于安装模块后上传的图片,系统会自动进行文字识别,用户无需手动操作。一般的文字图片,上传后一两分钟内系统就能将文字识别出来。
下面我们看一个图片文字识别和搜索的实例。
1、将一个png格式图片上传到多可文档系统中。为方便查看文字识别结果,请在菜单中将文件查看方式调整到“报表模式”:
下图即为在报表模式下显示的图片缩略图及操作按键,该图片刚上传到系统:
2、图片一旦上传到系统,系统即自动在后台对图片进行文字识别。上传图片后请稍等片刻,给系统一点处理图片的时间,然后点击“概要”(见上图中的红框)。这时在新开的浏览器页面里就会显示文字识别结果:
3、刷新一下文件列表页面,就会看到图片名称下方出现了概要中的开头部分文字:
4、只要点击“概要”能看到文字,或者在报表模式下能显示图片中的文字内容,就说明图片文字识别工作已经完成,这时候就能通过输入字词来搜索该图片了。下图是输入关键字“水母”后的搜索结果:
上述例子表明,当图片中的文字被识别出来后,就能轻松实现图片的全文检索。
图片文字识别模块的主要作用是方便检索。
以前要搜索图片,只能通过输入标题关键词来查找,一旦忘记了标题里的关键词,要么得直接去一个个文件夹里找,要么就是采用高级搜索,通过设置上传时间、上传人、所属部门、文件夹等图片的其他信息来搜索。两个方法都有点麻烦。而现在,忘记了标题不要紧,记得图片里的字词一样可以搜。
比如我们想在系统里找一份采购合同扫描图片,但是不记得合同名称,这时候只要记得合同里的一些内容,比如甲方公司名称,在搜索框输入公司名,就能快速找到这份合同。
所以图片文字识别模块对于有大量文字图片的用户来说很有价值,能大幅提升工作效率。
从实例的文字识别结果来看,文字的准确度还是比较高的。
文字识别正确率主要取决于图片本身的质量。
像本次实例这样的图片,本身都是印刷体文字,通篇以文字为主,虽有图片但比较规整,这样的图片文字识别的正确率就比较高。还有如日常工作中的各种合同、会议通知等纸质文件的扫描图片,也基本属于这种清晰理想型文字图片,图片文字识别速度会较快、效果也会比较理想。
如果图片本身质量稍差,有灰底、黑底甚至透底,建议在上传前,先使用原本专业级图片去灰底与增强软件对图片进行去灰和增强处理,然后再上传到多可系统。这样也能提升图片文字识别率和正确率。
(关于原本软件的使用介绍,请参考【原本,一键去除文件图片灰底,轻松还原文档本来模样】)
但如果图片质地很差,透底严重,画面变形,文字则可能识别不出来。
那么,这个OCR模块在哪里?该怎么启用呢?
首先,请注意:
图片文字识别功能属于选择购买的收费模块,并不包含在多可系统里。也就是说,您在官网下载的V6.3版本的多可文档管理系统不带有图片文字识别OCR模块。要使用这个模块,需要单独下载安装模块升级包,并支付模块费用。
如果您打算购买企业版的多可系统,并且想启用图片文字识别模块功能,除了购买企业版外,还需单独购买该模块。然后才能正式使用图片文字识别功能。
在您决定是否需要购买图片文字识别模块前,您可能会需要提前体验一下模块的功能;
或者,您一直在使用多可的免费版,纯粹出于好奇想看看文字识别结果;
……
无论您最终是否购买该模块,我们都为您准备了500张图片的免费文字识别体验机会。
要体验图片文字识别模块,请先将多可系统升级到v6.3,然后下载图片文字识别搜索OCR升级包。下载后按提示安装即可。安装完成后,系统自动启用图片文字识别功能,并自动识别上传的每一份图片,等到500个OCR体验机会用完,文字识别功能会自动失效,您无需手动卸载模块。
下载多可系统和模块升级包请到官网下载页,地址:
http://www.315soft.com/download/

图片文字识别模块是一个单独的升级包,在下载页面中位于三个管理系统下方,请勿下错。

加载中…