
此主题已经被归档,里面包含的信息和链接可能会过期或者失效。如果您遇到难题,请点击 这里 发帖,或者点击上面的"发布新帖"按钮并选择相应的版块。
- 将帖子标记为未读
- 将此主题添加到书签
- 订阅此主题
- 禁止
- 订阅此主题的 RSS 提要
- 高亮显示此贴
- 打印此贴
- 通过电子邮件将此主题发送给好友
- 标记帖子
[经验分享]一体机扫描下来的 PDF 文件做文字修改(OCR)的方法
发布时间 2013-02-21 10:38:43
我们主要通过“Microsoft Office Document Imaging”这个 Office 的组件进行格式转换和文字识别。这个组件集成在微软的 Office XP 及以上版本下,并且为默认安装组件,若您的电脑中没有它,建议放入微软的 Office 光盘安装。如何判断自己的电脑已经安装上了这个组件呢?就是看控制面板里的打印机文件夹下是否有了一个名为“Microsoft Office Document Imaging”的打印机图标。
此组件最后会将 PDF 格式转换成 Word 格式,即可在 Word 中编辑修改了。转换识别后原稿还需要重新排版和校对。
操作步骤
- 确保电脑上已经正确安装了如下软件:Acrobat 或 Acrobat Reader、Office XP 或 Office 2003(带有 Microsoft Office Document Imaging 组件)。
- 用 Acrobat 或 Acrobat Reader 软件将已有的或扫描进来的 PDF 文件打开,然后点击“文件”菜单下的“打印”,打印机名称选择“Microsoft Office Document Image Writer” 。如图 1 在 Acrobat 中选择“Microsoft Office Document Image Writer”虚拟文件打印机所示。此打印机将输出一个后缀名为MDI的虚拟打印文件。图 1: 在 Acrobat 中选择“Microsoft Office Document Image Writer”虚拟文件打印机点击“确定”按钮按钮后将输出一个 MDI 文件且自动打开了 Microsoft Office Document Imaging 组件界面。如果没有自动打开,可以依次点击电脑左下角“开始”→“程序”→“Microsoft Office”→“Microsoft Office 工具”,打开此组件。
- 在“Microsoft Office Document Imaging”窗口中依次点击“工具”→“将文本发送到 Word ”菜单,出现如图 2 将原稿发送到 Word 所示界面:图 2: 将原稿发送到 Word注 :勾选上“在输出时保持图片版式不变”,这样可以最大程度保留原稿格式。
- 点击“确定”按钮后会有 OCR 的提示,如图 3 OCR 提示所示:注 :如果安装完整的 Office 软件,Microsoft Office Document Imaging 及 OCR 组件可能会没有安装,当您按照本文介绍的方法使用时,Office 软件会提示您安装该组件。请根据提示放入 Office 光盘,安装程序会自动根据提示安装该组件。图 3: OCR 提示
- 点击“确定”按钮后开始 OCR 过程,如图 4 OCR 识别所示:图 4: OCR 识别
- 识别完成后会自动打开 Word,您的原稿就会在 Word 中并且可以自由编辑了。
我作为志愿者在社区帮忙,我的回帖只代表我自己。
如果我的答复对您有帮助,欢迎您点击我答复下方的 “大拇指”给我奖励。
如果我的答复解决了您的问题,欢迎您点击我的帖子下方的 “接受为解决方案”。
1 条回复1

此主题已经被归档,里面包含的信息和链接可能会过期或者失效。如果您遇到难题,请点击 这里 发帖,或者点击上面的"发布新帖"按钮并选择相应的版块。