使用XPDF將PDF轉換為HTML的操作步驟

    時間:2024-06-22 10:28:18 HTML DOM 我要投稿
    • 相關推薦

    使用XPDF將PDF轉換為HTML的操作步驟

      1、下載xpdf最新版本,我下載的是xpdf-3.02pl2-win32.zip

      2、下載中文支持包,我下載的是xpdf-chinese-simplified.tar.gz

      3、下載pdftohtml支持包,我下載的是:pdftohtml-0.39-win32.tar.gz

      4、解壓調試

      1) 先將xpdf-3.02pl2-win32.zip解壓,解壓后的內容可根據需要進行刪減,如果只需要轉換為txt格式,其他的

      exe文件可以刪除,只保留pdftotext.exe,以此類推;

      2) 然后將xpdf-chinese-simplified.tar.gz解壓到剛才xpdf-3.02pl2-win32.zip的解壓目錄;

      3) 將pdftohtml-0.39-win32.tar.gz解壓,pdftohtml.exe解壓到xpdf-3.02pl2-win32.zip的解壓目錄;

      4) 目錄結構:

      +---[X:xpdf]

      |-------各種轉換用到的exe文件

      |

      |-------xpdfrc

      |

      +------[X:xpdfxpdf-chinese-simplified]

      |

      http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉換成HTML整理

      |

      +-------很多轉換時需要用到的字符文件

      xpdfrc:此文件是用來聲明轉換字符集對應路徑的文件

      5) 修改xpdfrc文件(文件原名為sample-xpdfrc)

      修改文件內容為:

      #----- begin Chinese Simplified support package

      cidToUnicode Adobe-GB1 xpdf-chinese-simplifiedAdobe-GB1.cidToUnicode

      unicodeMap ISO-2022-CN xpdf-chinese-simplifiedISO-2022-CN.unicodeMap

      unicodeMap EUC-CN xpdf-chinese-simplifiedEUC-CN.unicodeMap

      unicodeMap GBK xpdf-chinese-simplifiedGBK.unicodeMap

      cMapDir Adobe-GB1 xpdf-chinese-simplifiedCMap

      toUnicodeDir xpdf-chinese-simplifiedCMap

      fontDir C:WINDOWSFonts

      displayCIDFontTT Adobe-GB1 C:WINDOWSFontssimhei.ttf

      #----- end Chinese Simplified support package

      6) 創建bat文件pdftohtml.bat(放置的路徑不能包含空格)

      內容為:

      @echo off

      set folderPath=%1

      set filePath=%2

      cd /d %folderPath%

      pdftohtml -enc GBK %filePath%

      exit

      http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉換成HTML整理

      7) 創建類

      public class ConvertPdf

      {

      private static String INPUT_PATH;

      private static String PROJECT_PATH;

      public static void convertToHtml(String file, String project)

      {

      INPUT_PATH = file;

      PROJECT_PATH = project;

      if(checkContentType()==0)

      {

      toHtml();

      }

      }

      private static int checkContentType()

      {

      String type = INPUT_PATH.substring(INPUT_PATH.lastIndexOf(".") + 1, INPUT_PATH.length())

      .toLowerCase();

      if (type.equals("pdf"))

      return 0;

      else

      return 9;

      }

      private static void toHtml()

      {

      if(new File(INPUT_PATH).isFile())

      {

      try

      {

      String cmd = "cmd /c start X:pdftohtml.bat "" + PROJECT_PATH + "" http://www.javaeye.com/forums 1.6 Word/Excel/PDF文件轉換成HTML整理

      Runtime.getRuntime().exec(cmd);

      }

      catch (IOException e)

      {

      e.printStackTrace();

      }

      }

      }

      }

      String cmd = "....";此處代碼是調用創建的bat文件進行轉換

      8) 測試轉換

      public static void main(String[] args)

      {

      ConvertPdf.convertToHtml("C:test.pdf", "X:xpdf");

      }

    【使用XPDF將PDF轉換為HTML的操作步驟】相關文章:

    迅捷PDF轉換成Word工具使用步驟介紹04-03

    科目三轉彎詳細操作步驟03-30

    如何將word轉化為pdf03-09

    使用Word2010創建圖表的詳細操作步驟04-03

    word將兩欄的數據平均分配顯示的操作步驟11-29

    allegro的reuse功能操作步驟03-20

    軟文推廣營銷操作步驟03-03

    數控加工中心的操作步驟03-18

    檢修電氣設備操作步驟06-18

    91久久大香伊蕉在人线_国产综合色产在线观看_欧美亚洲人成网站在线观看_亚洲第一无码精品立川理惠

      亚洲第一天堂中文字幕在线 | 人人爱草免费国产视频 | 久热这里只精品国产8 | 亚洲精品福利aV在线播放 | 亚洲大片中文字幕 | 中文字幕久久精品一区二区 |