2022-11-23 22:11:07
pdf文件转换成word后乱码或不能编辑的问题

利用microsoft office word 2003自己的功能即可实现转换。
首先电脑系统要安装microsoft office 2003;
其次,打开你所要转换的pdf文件,点击打印;
( 用microsoft office 2003自带microsoft office document image writer d虚拟打印机,打印需要的页码 ) [这一般是默认的,直接按确定就可!]
然后按“确定”,则立即自动变为另存为(以mdi格式),选好另存的目录,点击“保存”,则立即自动打开保存的mdi格式的文件;
再点击mdi格式文件的“工具”中的“使用ocr识别文本”(根据文本的多少可能需要点时间)识别完后;
再点击“工具”中的“将文本发送到word”,则一切搞定!
此时,原来pdf上的文本已经转换到word上来了,可以自由复制粘贴了。
当然,这是对于那些pdf无法复制的文件,毕竟这样转换过来的文件与原来的还是有点出路,
最好是再对照哦。
为什么我下载的pdf 文件都变成了word打开后还是乱码...

可能你没有装pdf阅读器打开pdf文件,如果用pdf阅读器打开pdf应该能正常显示,如果复制到word里面是乱码的话,就说明这种pdf文件的文字内码是错误的,用龙谷的pdf内码校正软件可以处理,好像现在可以在线校正,不知道有没有回答你的问题。
http://www.nooog.com/pdfcode
pdf转换成word之后都是都乱码怎么弄啊~~!

pdf转换成word出现乱码的主要原因的,在制作pdf的时候用了好多的字体来制作这个pdf文档,所以你pdf转换成word的时候会出现大量的乱码,是因为你的文字库不识别这些文字!
如果转换的话,首先转换成jpg格式然后用ocr文字识别这些就都能搞定了,比较麻烦,你可以自己去尝试下,实在不行我给你推荐一个转换团队,叫易捷pdf转换。转换效果不错你去试试,不用你这么麻烦了,专业负责转换pdf,而且专治各种转换中的疑难杂症,呵呵,百度搜索易捷pdf转换就好了,感觉可以就来个最佳答案吧~~!
为什么由pdf转换成word后出现乱七八糟的字

出现乱码是由于你的pdf文档是由扫描图片制作而成的,转换软件不能识别这些图片,所以转换后出现乱码。你必须使用ocr文字识别工具才能解决这一问题。
abbyy finereader 10 corporate edition 就是一款很好的ocr工具,你到网上搜索这个软件的破解版或者绿色版,可以找到下载地址。

如果pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。