該方法已經過本人測試,效果還不錯。儘管不是100%完全轉換,但比起原來的只能看不能編輯(特別某些PDF文件中以圖形格式表現的文字),還是有很大的進步。
(01)打開PDF文件
(02)依次選擇菜單欄上的“文件”——“打印”——“打印機”。在“打印機”下拉菜單中選擇“Microsoft Office Document Image Writer”
(03)選擇保存“Microsoft Office Document Image Writer”虛擬打印文件(*)的文件名和保存地址。
(04)“Microsoft Office Document Image Writer”將PDF文件打印成規定文件名的MDI文件,如下圖所示。
(05)在菜單樣上選擇“工具”——使用OCR識別文本
(06)根據PDF的具體情況,選擇對應的頁面和語言。本例為“所有頁面”和“英語”。
(07)語言選擇見“選項”,可選擇“中文”或“英文”。
(08)完成設置後,點擊菜單樣上的“工具”——“使用OCR”。“Microsoft Office Document Image Writer”開始識別MDI文件。
(09)完成OCR識別後,在菜單樣上選擇“工具”——“將文本發送到WORD”
(10)鈎選“版式選項”,選擇文件的保存地址。識別後的文件將自動送到WORD。
(11)根據文件大小,會有長短不一的傳送時間。傳送完成後,系統會自動打開WORD,用户需要將文件另存為WORD格式。