赞
踩
用Java实现office文件转换为PDF。研究了一下主要有以下几种方式:
1.使用openoffice,这个可以再linux系统中使用。但是这个据说对于样式复杂的office文件,转换的效果并不好。(但是linux下仍然推荐使用这个)
2.使用POI技术+itext技术。这个样式设计比较繁琐,并且样式效果也不是太好。
3.jacob技术,也是本文要讲解的技术。这个的实现思路是通过Java代码控制Windows系统上的office软件,进行转换。(仅限Windows服务器)
前期的准备工作:
1.下载jacob的相关jar包。里面主要包含jacob.jar和jacob-1.18-x64.dll,jacob-1.18-x86.dll三个文件。先将jar包引入到工程中,然后启动工程会报错,根据提示的错误信息,将指定的dll文件,加到当前jdk/jre/bin目录下即可。查看当前jdk安装路径的方法:通过配置的环境变量去查看所在目录。(注意引入的文件名要与报错的信息保持一致)
下载地址: http://sourceforge.net/project/jacob-project(该地址可能不能用了,自行寻找吧)
2.excel转PDF的话,一般要安装savapdf的插件。去下载SaveAsPDFandXPS.exe并一步步安装。
3.Excel转PDF,还容易报缺少打印机的错误。去Windows的本地服务里开启print spooler服务
4.excel转PDF,还容易出现PDF显示不全的问题。解决的方法是,打开Excel,然后分页预览,将两条蓝色的边线,分别拉倒两侧,(当前文件有多宽,就设置多宽)然后保存。参考https://jingyan.baidu.com/article/48b558e3266ab17f38c09ac0.html
5.准备其他需要的jar包。有poi-ooxml-3.9.jar,poi-3.9.jar,ooxml-schemas-1.1.jar,dom4j-2.0.0-RC1.jar
准备工作做完了,就上代码了:
- import java.io.File;
- import org.apache.poi.POIXMLDocument;
- import org.apache.poi.xwpf.usermodel.XWPFDocument;
- import org.dom4j.Document;
- import org.dom4j.DocumentException;
- import org.dom4j.io.SAXReader;
- import com.jacob.activeX.ActiveXComponent;
- import com.jacob.com.ComThread;
- import com.jacob.com.Dispatch;
- import com.jacob.com.Variant;
- public class Office2pdf {
- static final int wdFormatPDF = 17;// PDF 格式
- /**
- * word转化为PDF
- * @param sfileName
- * @param toFileName
- * @return
- * @throws Exception
- * @author ygl
- */
- public static int word2Pdf(String sfileName,String toFileName) throws Exception{
-
- System.out.println("启动Word...");
- long start = System.currentTimeMillis();
- ActiveXComponent app = null;
- Dispatch doc = null;
- try {
- app = new ActiveXComponent("Word.Application");
- app.setProperty("Visible", new Variant(false));
- // 打开word文件
- Dispatch docs = app.getProperty("Documents").toDispatch();
- // doc = Dispatch.call(docs, "Open" , sourceFile).toDispatch();
- doc = Dispatch.invoke(docs,"Open",Dispatch.Method,new Object[] {
- sfileName, new Variant(false),new Variant(true) }, new int[1]).toDispatch();
- System.out.println("打开文档..." + sfileName);
- System.out.println("转换文档到PDF..." + toFileName);
- File tofile = new File(toFileName);
- // System.err.println(getDocPageSize(new File(sfileName)));
- if (tofile.exists()) {
- tofile.delete();
- }
- // Dispatch.call(doc, "SaveAs", destFile, 17);
- // 作为html格式保存到临时文件::new Variant(8)其中8表示word转html;7表示word转txt;44表示Excel转html;17表示word转成pdf。
- Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] {
- toFileName, new Variant(17) }, new int[1]);
- long end = System.currentTimeMillis();
- System.out.println("转换完成..用时:" + (end - start) + "ms.");
- } catch (Exception e) {
- e.printStackTrace();
- System.out.println("========Error:文档转换失败:" + e.getMessage());
- }catch(Throwable t){
- t.printStackTrace();
- } finally {
- // 关闭word
- Dispatch.call(doc,"Close",false);
- System.out.println("关闭文档");
- if (app != null)
- app.invoke("Quit", new Variant[] {});
- }
- //如果没有这句winword.exe进程将不会关
- ComThread.Release();
- return 1;
- }
- private static Document read(File xmlFile) throws DocumentException {
- SAXReader saxReader = new SAXReader();
- return saxReader.read(xmlFile);
- }
- public int getDocPageSize(String filePath) throws Exception {
- XWPFDocument docx = new XWPFDocument(POIXMLDocument.openPackage(filePath));
- int pages = docx.getProperties().getExtendedProperties().getUnderlyingProperties().getPages();//总页
- int wordCount = docx.getProperties().getExtendedProperties().getUnderlyingProperties().getCharacters();// 忽略空格的字符另外还有getCharactersWithSpaces()方法获取带空格的总字数�?
- System.out.println ("pages=" + pages + " wordCount=" + wordCount);
- return pages;
- }
- /**
- * excle转PDF
- * @param els
- * @param pdf
- * @author ygl
- */
- public static void excel2Pdf(String inFilePath, String outFilePath) throws Exception {
- ActiveXComponent ax = null;
- Dispatch excel = null;
- try {
- ComThread.InitSTA();
- ax = new ActiveXComponent("Excel.Application");
- ax.setProperty("Visible", new Variant(false));
- ax.setProperty("AutomationSecurity", new Variant(3)); // 禁用宏
- Dispatch excels = ax.getProperty("Workbooks").toDispatch();
- Object[] obj = new Object[]{
- inFilePath,
- new Variant(false),
- new Variant(false)
- };
- excel = Dispatch.invoke(excels, "Open", Dispatch.Method, obj, new int[9]).toDispatch();
- File tofile = new File(outFilePath);
- // System.err.println(getDocPageSize(new File(sfileName)));
- if (tofile.exists()) {
- tofile.delete();
- }
- // 转换格式
- Object[] obj2 = new Object[]{
- new Variant(0), // PDF格式=0
- outFilePath,
- new Variant(0) //0=标准 (生成的PDF图片不会变模糊) ; 1=最小文件
- };
- Dispatch.invoke(excel, "ExportAsFixedFormat", Dispatch.Method,obj2, new int[1]);
- System.out.println("转换完毕!");
- } catch (Exception es) {
- es.printStackTrace();
- throw es;
- } finally {
- if (excel != null) {
- Dispatch.call(excel, "Close", new Variant(false));
- }
- if (ax != null) {
- ax.invoke("Quit", new Variant[] {});
- ax = null;
- }
- ComThread.Release();
- }
- }
- public static void main(String[] args) throws Exception {
- word2Pdf("d:\\222.docx", "d:\\222.pdf");
- excel2Pdf("d:\\44.xlsx", "d:\\44.pdf");
- }
-
- }
注意:Excel转换为PDF只能转换第一个sheet。
另附,我自己写的现成的工程,及bat文件。一键启动,无需更改,方便快捷。https://download.csdn.net/download/qq_29281307/10668558
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。