虚拟打印机的调用
![]() |
一般来说,绝大多数应用程序都支持“打印”功能,利用该功能我们往往能够很方便地调用指定的虚拟打印机。例如,在Office 2007应用程序中调用“Microsoft Office Document Image Writer”虚拟打印机时,我们可以先启动Office应用程序,在弹出的程序编辑窗口中,依次单击菜单栏中的“文件”/“打印”命令,在弹出的打印窗口中,我们会看到所有的虚拟打印机和真实打印机,此时我们只要选中图2界面中的“Microsoft Office Document Image Writer”选项,就能调用Office应用程序内置的虚拟打印机了。
从文档中提取文字
虽然虚拟打印机无法实现真实的文档打印效果,不过巧妙地利用虚拟打印机,我们能够实现一些意想不到的用途。例如,利用Office应用程序内置的“Microsoft Office Document Image Writer”虚拟打印机,并在“Microsoft Office Document Imaging”工具的配合下,我们能够从类似图象、网页、PDF文件等特殊文档中提取出文字内容出来。
例如,我们希望从某个PDF特殊文档中提取出文字内容时,可以先打开PDF特殊文档编辑窗口,并在该窗口中将目标文档打开,然后依次单击菜单栏中的“文件”/“打印”命令,打开打印属性设置界面;在该界面的“名称”设置项处单击下拉按钮,从弹出的下拉列表中选择“Microsoft Office Document Image Writer”项目,再单击旁边的“属性”按钮,打开Office应用程序内置虚拟打印机属性设置界面,单击该界面中的“高级”标签,进入到如图3所示的标签设置页面;
在该页面的“输出格式”设置项处,选中“MDI-压缩文档格式”项目,并在“默认文件夹”处调整好新文件的保存路径,再单击“确定”按钮,这样一来目标PDF特殊文档就能被虚拟打印机打印成MDI格式的文件了,同时“Microsoft Office Document Imaging”程序会自动将刚才生成的MDI压缩文档打开。之后,在Microsoft Office Document Imaging文档编辑窗口中,依次单击菜单栏中的“工具”/“将文本发送到Word”命令,再在其后界面中单击“确定”按钮,这样一来Microsoft Office Document Imaging程序会自动对目标文档进行OCR识别,当然在这之前我们需要先安装好相关的ORC扫描识别组件,如果没有安装的话该程序会自动弹出窗口提示我们来安装该组件的;在识别操作完成后,Microsoft Office Document Imaging程序会自动将识别出来的文字内容发送到另外一个Word文档中,以便供我们编辑、预览所用。
需要提醒各位注意的是,当我们发现本地计算机的Office程序组中没有提供虚拟打印机时,我们不妨通过“添加或删除”功能来打开Office应用程序的高级自定义窗口,然后从Office工具列表框中选择“Microsoft Office Document Imaging”工具,之后再将“Microsoft Office Document Image Writer”组件选中,并按照向导提示完成剩下的安装操作,这么一来虚拟打印机就能被成功安装了。
