Tengs

Design & Develop

  • 言论自由
  • 技术文档
  • 日常琐事
  • 其它东西

图片转文本

懒人福利——悄悄告诉你如何将扫描件转成可编辑文字

2017年4月26日 / Leave a Comment

今天被问及可否将扫描件转换成可编辑文字,一时好奇心起,百度许久,居然还真找到了一些靠谱的在线资源。鉴于这年头懒人众多,遂决定发扬雷锋精神,和诸君分享一二。

在线神器的地址点这里

 

过程没什么好说的,按照网站上标明的步骤操作便可。可惜该神器不支持.tif文件,不巧很多扫描机器生成的就是.tif,这时候我们需要另外一个神器:地址点这里

 

过程依然没什么好说的,需要注意的是该网站广告和乱七八糟的链接太多,你需要做到心无杂念,认准中间的“选择文件”上传你的.tif文件然后点下“转换为PDF文件”,稍后出现“点击此处:打开文件 下载文件”两个链接时,选择下载即可。

然而当你兴冲冲地回到wdku.net打算动手转换时,运气不好的话或许你还会遇上这样的问题:

 

或者是这样的问题:

 

从道义上讲,我们不能怪人家小气——免费的只给转1M以下3个页面以内的东西,毕竟人家挖空心思赚点小钱也不容易。对于土壕,本人倒是十二分建议注册,也算是对技术宅的支持和鼓励。当然,如果你懒到连注册也不想动手的话,我们的确也还有其他的解决途径,这时候还得用回第二个神器里面的另外一个工具——PDF文件分割,地址点这里。

 

过程依然是没什么好说的,注意将分割方式改为每3个页面一个文档即可。假如每个文档还是很不凑巧地超过了1M,不妨将页面数设置为2或者1,万一问题依旧的话便只能求助于另外一个神器,地址点这里,将PDF的尺寸缩小从而让它小于1M。

好了,一切就绪,现在可以开始神奇的转换了。

经实测,转换过来的word文档基本没什么错别字,可见TextConv这个在线转换工具的文字识别算法的确还可以,当然,这也和扫描件是否有污迹等等很多因素脱不开关系,所以保险起见,转换完成后的校对还是十分必要的。

Posted in: 技术文档 Tagged: 图片转文本

标签

ASP bug CentOS CSS Google js 中庸 主流 交易 人生 人类劣根 刷票 哲学 大学 感想 文学 文言文 期末 歌手 死狗 毅力 比赛 水浒 江南style 滚动字幕 爱因斯坦 狂想 狗屁文化 现代诗 玻璃 琐事 电脑城 男篮 神曲 科学 笑话 箴言 经济 网易 网络安全 腾讯 腾讯TT 视频广告 诗歌 霸位

近期评论

  • 壮敏 发表在《讨贼檄文》
  • 黄祺 发表在《顿悟》
  • 西班牙超模 发表在《致加西亚》
  • 西班牙超模 发表在《致加西亚》
  • 糗事百科 发表在《IE6 去除 input border》

Copyright © 2025 Tengs.

Me WordPress Theme by themehall.com