第一步:先安装Office 2003中的有关组件。具体方法是:使用Office 2003安装光盘中的“添加或删除功能,更改已安装的功能或删除指定的功能”更新安装该组件(如图1)。

图1
勾选 “选择应用程序的高级自定义”(如图2)。

图2
打开Office工具→Microsoft Office Document Imaging,按提示选择安装“扫描、OCR和索引服务筛选器”和“Microsoft Office Document Image Writer”(如图3)。

图3
接着重新启动计算机使修改生效(如图4)。

图4
在安装Microsoft Office Document Imaging组件后,Windows XP系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。Imaging组件可以通过这个虚拟打印机,将PDF文件所保存的信息识别,从而达到将它直接转换输出到Word等文字编辑工具中的目的。
第二步:用Adobe Reader 打开想转换的PDF文件,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为 “Microsoft Office Document Image Writer”(如图5)。

图5
确认后将该PDF文件输出为 MDI格式的虚拟打印文件(如图6)。

图6
然后,运行 “Microsoft Office Document Imaging”,并利用它来 打开 刚才保存的MDI文件,选择“工具→ 将文本发送到Word ”菜单(如图7)。

图7
在弹出的“将文本发送到Word”窗口中选中“所有页面”和“ 在输出时保持图片版式不变 ”(如图8)。

图8
确认后系统会提示“必须在您执行此操作前识别该文档中的文本(OCR)。这可能需要一些时间”,不管它,点击确定即可(如图9)。

图9
识别完成后,系统会自动调出Word,这时你就可以看到,刚才还不能编辑的文字,乖乖的出现在Word编辑窗口中(如图10)。
function ImgZoom(Id)//重新设置图片大小 防止撑破表格
{
var w = $(Id).width;
var m = 550;
if(w < m)
{
return;
}
else
{
var h = $(Id).height;
$(Id).height = parseInt(h*m/w);
$(Id).width = m;
}
}
window.onload = function()
{
var Imgs = $("content").getElementsByTagName("img");
var i=0;
for(;i

