Java【代码 16】将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理

开源 0

word、excel、pdf、image转换工具类

  • 1.感谢
  • 2.包含的工具类
  • 3.lib文件说明
    • 3.1 使用的
    • 3.2 未使用的
  • 4.核心代码
    • 4.1 WordToPdfUtil
    • 4.2 ExcelToPdfUtil
    • 4.3 PdfToImageUtil
  • 6.问题处理
    • 6.1 Word中文无法转换
    • 6.2 Excel中文无法转换
  • 7.总结

1.感谢

感谢小伙伴儿的分享:
● 不羁
● 郭中天
整合调整后的工具类Gitee地址:https://gitee.com/yuanzhengme/java_application_aspose_demo

2.包含的工具类

● WordToPdfUtil用于将word文档转换为pdf格式的工具类
● ExcelToPdfUtil用于将excel文档转换为pdf格式的工具类
● PdfToImageUtil用于将pdf文档转换为image格式的工具类

3.lib文件说明

3.1 使用的

● aspose-words-15.8.0-jdk16.jar 将word文档转换为pdf需要引入
● aspose-cells-8.5.2.jar 将excel文档转换为pdf需要引入
● aspose-cells-20.7.jar 将excel文档转换为pdf需要引入(Linux端中文出现乱码时使用)

3.2 未使用的

● aspose-words-15.12.0-jdk16.jar 未测试
● aspose-pdf-22.4.cracked.jar 将pdf转换为其他格式【破解版效果不佳】
● aspose-pdf-22.4.jar 将pdf转换为其他格式【未破解效果依然不佳】

4.核心代码

4.1 WordToPdfUtil

    /**     * word 转 pdf     *     * @param wordFilePath word文件路径     * @param pdfFilePath  pdf文件路径     */    public static void convert(String wordFilePath, String pdfFilePath) {        FileOutputStream fileOutputStream = null;        try {            pdfFilePath = pdfFilePath == null ? getPdfFilePath(wordFilePath) : pdfFilePath;            setLicense();            File file = new File(pdfFilePath);            fileOutputStream = new FileOutputStream(file);            Document doc = new Document(wordFilePath);            doc.save(fileOutputStream, SaveFormat.PDF);        } catch (Exception e) {            e.printStackTrace();        } finally {            try {                assert fileOutputStream != null;                fileOutputStream.close();            } catch (IOException e) {                e.printStackTrace();            }        }    }

4.2 ExcelToPdfUtil

    /**     * excel 转 pdf     *     * @param excelFilePath excel文件路径     * @param pdfFilePath   pdf文件路径     * @param convertSheets 需要转换的sheet     */    public static void convert(String excelFilePath, String pdfFilePath, int[] convertSheets) {        FileOutputStream fileOutputStream = null;        try {            pdfFilePath = pdfFilePath == null ? getPdfFilePath(excelFilePath) : pdfFilePath;            // 设置License            setLicense();            // 读取excel文件            Workbook wb = new Workbook(excelFilePath);            fileOutputStream = new FileOutputStream(pdfFilePath);            // 设置pdf格式            PdfSaveOptions pdfSaveOptions = new PdfSaveOptions();            pdfSaveOptions.setOnePagePerSheet(true);            if (null != convertSheets) {                printSheetPage(wb, convertSheets);            }            wb.save(fileOutputStream, pdfSaveOptions);            fileOutputStream.flush();        } catch (Exception e) {            e.printStackTrace();        } finally {            try {                assert fileOutputStream != null;                fileOutputStream.close();            } catch (IOException e) {                e.printStackTrace();            }        }    }

4.3 PdfToImageUtil

    /**     * 根据参数将全部的PDF转换为Image     *     * @param pdfFilePath   PDF文件路径     * @param imageFileDir  图片存储目录     * @param imageFileName 图片存储文件没     * @param type          图片类型     */    public static void convertAllPage(String pdfFilePath, String imageFileDir, String imageFileName, String type) {        System.setProperty("sun.java2d.cmm", "sun.java2d.cmm.kcms.KcmsServiceProvider");        // 图片类型        if (type == null || "".equals(type)) {            type = IMAGE_TYPE_JPG;        }        // 1.加载PDF文件        File file = new File(pdfFilePath);        // 2.生成JPG图片的文件夹        imageFileDir = imageFileDir == null ? getImageFileDir(pdfFilePath) : imageFileDir;        imageFileName = imageFileName == null ? getImageFileName(pdfFilePath) : imageFileName;        try {            PDDocument pdDocument = PDDocument.load(file);            PDFRenderer renderer = new PDFRenderer(pdDocument);            int pageCount = pdDocument.getNumberOfPages();            for (int i = 0; i < pageCount; i++) {                BufferedImage image = renderer.renderImageWithDPI(i, 144);                ImageIO.write(image, type,                        new File(imageFileDir.concat(File.separator).concat(imageFileName).concat("_")                                .concat(String.valueOf(i + 1)).concat(".").concat(type)));            }        } catch (IOException e) {            e.printStackTrace();        }    }

6.问题处理

  • 都需要将字体文件simsun.ttc上传到jarPath/font目录下。

6.1 Word中文无法转换

在Linux环境下,如果转换后的pdf文件无中文,在WordToPdfUtil转换方法里添加以下代码:

// 设置字体String realPath = new ApplicationHome(WordToPdfUtil.class).getSource().getParentFile().toString();FontSettings.setFontsFolder(realPath + File.separatorChar + "font", false);

6.2 Excel中文无法转换

使用aspose-cells-20.7.jar:

<dependency>	<groupId>com.aspose.cells</groupId>	<artifactId>aspose-cells</artifactId>	<version>20.7</version>	<scope>system</scope>	<systemPath>${project.basedir}/lib/aspose-cells-20.7.jar</systemPath></dependency>

并在ExcelToPdfUtil转换方法里添加以下代码:

// 设置字体String realPath = new ApplicationHome(WordToPdfUtil.class).getSource().getParentFile().toString();String fontDir = realPath + File.separatorChar + "font";IndividualFontConfigs individualFontConfigs = new IndividualFontConfigs();individualFontConfigs.setFontFolder(fontDir, false);LoadOptions loadOptions = new LoadOptions();loadOptions.setFontConfigs(individualFontConfigs);// 读取excel文件Workbook wb = new Workbook(excelFilePath, loadOptions);

7.总结

  • PDF转换为其他格式的方法效果不佳,遇到好的方案会进行补充。
  • 主要用到aspose的jar包,实际上是需要授权的,否则会有水印,是个隐患。

也许您对下面的内容还感兴趣: