今天被问及可否将扫描件转换成可编辑文字,一时好奇心起,百度许久,居然还真找到了一些靠谱的在线资源。鉴于这年头懒人众多,遂决定发扬雷锋精神,和诸君分享一二。
在线神器的地址点这里
过程没什么好说的,按照网站上标明的步骤操作便可。可惜该神器不支持.tif文件,不巧很多扫描机器生成的就是.tif,这时候我们需要另外一个神器:地址点这里
过程依然没什么好说的,需要注意的是该网站广告和乱七八糟的链接太多,你需要做到心无杂念,认准中间的“选择文件”上传你的.tif文件然后点下“转换为PDF文件”,稍后出现“点击此处:打开文件 下载文件”两个链接时,选择下载即可。
然而当你兴冲冲地回到wdku.net打算动手转换时,运气不好的话或许你还会遇上这样的问题:
或者是这样的问题:
从道义上讲,我们不能怪人家小气——免费的只给转1M以下3个页面以内的东西,毕竟人家挖空心思赚点小钱也不容易。对于土壕,本人倒是十二分建议注册,也算是对技术宅的支持和鼓励。当然,如果你懒到连注册也不想动手的话,我们的确也还有其他的解决途径,这时候还得用回第二个神器里面的另外一个工具——PDF文件分割,地址点这里。
过程依然是没什么好说的,注意将分割方式改为每3个页面一个文档即可。假如每个文档还是很不凑巧地超过了1M,不妨将页面数设置为2或者1,万一问题依旧的话便只能求助于另外一个神器,地址点这里,将PDF的尺寸缩小从而让它小于1M。
好了,一切就绪,现在可以开始神奇的转换了。
经实测,转换过来的word文档基本没什么错别字,可见TextConv这个在线转换工具的文字识别算法的确还可以,当然,这也和扫描件是否有污迹等等很多因素脱不开关系,所以保险起见,转换完成后的校对还是十分必要的。