java 往 pdf 插入数据 (pdfbox+poi)

指定页码插入 / 替换#

pdfbox 好像没有专门提供这个方法,但是现有的方法多重组合起来也能实现这个功能,

需求:一个 pdf 文件 A 有 10 页,现在想在第 6 页插入一页新的 pdf 文件 B,插入完成后整个 pdf 文件 A 变成 11 页。

思路 1(插入):#

  先将这个 10 的 pdf 拆分成 10 个 1 页的 pdf,按顺序放好,文件名分别是:1.pdf、2.pdf….10.pdf。再拆分到第 6 页的时候将文件 B 放进来,重命名问 6.pdf,原本 pdf 文件 A 里面的第 6 页重命名为 7.pdf,依次后推,最后的得到的 1.pdf—–>11.pdf 一共 11 个文件

  然后使合并功能将这个 11 个 pdf 按顺序合并。

思路 2(替换):#

  在插入的基础上,拆分的时候将 pdf 文件 A 里面的第 6 个页丢弃,使用新的页面来代替它命名 6.pdf,然后合并就完事了。

1.pom

<!--pdfbox-->
<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox-tools</artifactId>
    <version>2.0.25</version>
</dependency>
<dependency>
    <groupId>net.sf.cssbox</groupId>
    <artifactId>pdf2dom</artifactId>
    <version>2.0.1</version>
</dependency>

<!--poi-->
<dependency>
    <groupId>com.itextpdf</groupId>
    <artifactId>itextpdf</artifactId>
    <version>5.5.10</version>
</dependency>
<dependency>
    <groupId>com.itextpdf.tool</groupId>
    <artifactId>xmlworker</artifactId>
    <version>5.5.10</version>
</dependency>
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>3.15</version>
</dependency>
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-scratchpad</artifactId>
    <version>3.15</version>
</dependency>

2.实现方法

/**from fhadmin.cn
 * 指定页码插入页
 * @param filename1  源pdf路径
 * @param filename2  需要插入的pdf路径
 * @param number     插入的页码
 * @param newfilename   全新pdf的路径
 * @throws Exception
 */
public void insertPage(String filename1,String filename2,int number,String newfilename,String tempPath) throws Exception {
    PDDocument pdf1 = PDDocument.load(new File(filename1));
    PDDocument pdf2 = PDDocument.load(new File(filename2));

    //1、将第一个pdf按页码全部拆开
    Splitter splitter = new Splitter();
    List<PDDocument> Pages = splitter.split(pdf1);

    Iterator<PDDocument> iterator = Pages.listIterator();

    PDFMergerUtility PDFmerger = new PDFMergerUtility();

    int i = 1;
    while(iterator.hasNext()) {
        if(i==number){
            System.out.println("当前插入页码:"+number);
            pdf2.save(tempPath+"/"+ i +".pdf");
            i++;
        }
        PDDocument pd = iterator.next();
        String tempFile = tempPath+"/"+ i +".pdf";
        System.out.println("开始拆分:"+tempFile);
        pd.save(tempFile);
        i++;
    }

    //2、开始重组
    PDFmerger.setDestinationFileName(newfilename);

    //上面的i最后多加了一次,这里不取等
    for(int j=1;j<i;j++){
        String tempFile = tempPath+"/"+ j +".pdf";
        System.out.println("开始合并:"+tempFile);
        PDFmerger.addSource(tempFile);
    }

    //合并文档
    PDFmerger.mergeDocuments();
    System.out.println("文档合并完成");

    pdf1.close();
    pdf2.close();
}

3.测试
//from fhadmin.cn
@Test
void insertPage() throws Exception {
    PdfUtils pdfUtils = new PdfUtils();
    String filename1 = "F:\\Users\\admin\\Desktop\\A.pdf";
    String filename2 = "F:\\Users\\admin\\Desktop\\B.pdf";
    String newfilename = "F:\\Users\\admin\\Desktop\\newA.pdf";
    String tempPath = "F:\\Users\\admin\\Desktop\\temp";
    int insertNum = 32;

    pdfUtils.insertPage(filename1,filename2,insertNum,newfilename,tempPath);
}

啰嗦几句#

1、我将要修改的页面先拆分出来了,比如这里的第 6 页,然后(我这个整页都是图片)将内容修改后,合并进来发现尺码不对,是的,你没有听错就是尺码不对,当我修改后的 pdf 在放进来合并的时候,这一页它变小了~,原来是我在将图片另存为 pdf,或者使用打印另存为 pdf 的时候,纸张大小就那么几类(A4/A3 等),那我就不干了啊,丑里吧唧的。

2、这个时候就用 pdfbox 的图片插入功能:将图片写入原来的 6.pdf 这一页里面来,你要问我为啥?因为原来的 6.pdf 尺码是对的,其中画图的时候开始位置 x,y 都从 0 开始。

本作品采用《CC 协议》,转载必须注明作者和本文链接
未填写
文章
234
粉丝
11
喜欢
34
收藏
35
排名:796
访问:8710
私信
所有博文
社区赞助商