2023-01-05 02:03:09
pdf转换成word为什么只有图片,没有文字了

如果这样的话,表明你的pdf是扫描或图片生成,其中的文字是图片方式而非文本方式,
一般的转换软件无法识别图片中的文字,所以
转换成word后没有文字了。
只有借助ocr(光学字符识别)技术才能将非文本格式的文字识别出来,但市面上常见的这类
转换工具ocr识别成功率都不高,故出现像你这样的转换后没有文字现象比比皆是。
除非你能找到识别率很高的ocr工具,否则想全部提取pdf中的文字,太难了。
word文档插入pdf文件后怎么只是显示文件名称和pdf图...

1、实现工具:office 2003中自带的microsoft office document imaging 应用情景:目前国外很多软件的支持信息都使用pdf方式进行发布,如果没有adobe reader,无法查看其内容,如果没有相关的编辑软件又无法编辑pdf文件。转换为doc格式则可以实现编辑功能。尽管有些软件也可以完成pdf转换为doc的工作,但很多都不支持中文,我们利用office 2003中的microsoft office document imaging组件来实现这一要求最为方便。 使用方法: 第一步:首先使用adobe reader打开待转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。 编辑提示:如果你在“名称”设置的下拉列表中没有找到“microsoft office document image writer”项,那证明你在安装office 2003的时候没有安装该组件,请使用office 2003安装光盘中的“添加/删除组件”更新安装该组件。 第二步:运行microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。 编辑提示:目前,包括此工具在内的所有软件对pdf转doc的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。%d%a