C#利用itext实现PDF页面处理与切分

更新时间：2022年04月26日 13:54:46 作者：XSpringSun

这篇文章主要介绍了如何在C#中使用itext做一个pdf的页面大小一致性处理，然后再根据数据切分出需要的pdf，感兴趣的小伙伴可以了解一下

一、itext

我要使用itext做一个pdf的页面大小一致性处理，然后再根据数据切分出需要的pdf.

iText的官网有关于它的介绍，然后在官网可以查找api文档。

其中我要使用的是itext7+,主要在iText.Kernel.Pdf 命名空间下。

二、处理PDF页面大小一致

由于原始PDF 是扫描图片合成来的，有些页面扫描的图片规格不一致，导致pdf阅读性很差。

对于这个pdf我进行处理，首先是在nuget 里面搜索 itext 进行安装，使用itext7。

处理PDF大小方法：

        public void RestPageSize(string sourcePdfPath, string outputPdfPath)
        {
            PdfReader pdfReader = null;
            PdfDocument pdfDocument = null;
            PdfWriter pdfWriter = null;
            PdfDocument outPDfDoc = null;
            try
            {
                pdfReader = new PdfReader(sourcePdfPath);
                pdfDocument = new PdfDocument(pdfReader);
                var outDir = System.IO.Path.GetDirectoryName(outputPdfPath);
                if (!Directory.Exists(outDir))
                {
                    Directory.CreateDirectory(outDir);
                }

                pdfWriter = new PdfWriter(outputPdfPath);
                outPDfDoc = new PdfDocument(pdfWriter);

                outPDfDoc.SetDefaultPageSize(PageSize.A3);


                for (int i = 1; i < pdfDocument.GetNumberOfPages() + 1; i++)
                {
                    var page = pdfDocument.GetPage(i);
                    var formXObject = page.CopyAsFormXObject(outPDfDoc);
                    var xPercent = PageSize.A3.GetWidth() / page.GetPageSize().GetWidth();
                    var yPercent = PageSize.A3.GetHeight() / page.GetPageSize().GetHeight();
                    PdfCanvas pdfCanvas = new PdfCanvas(outPDfDoc.AddNewPage());
                    pdfCanvas.AddXObjectWithTransformationMatrix(formXObject, xPercent, 0, 0, yPercent, 0, 0);
                }

                pdfWriter.Flush();

            }
            catch (Exception ex)
            {
                Console.WriteLine(ex);
            }
            finally
            {
                if (pdfReader != null)
                {
                    pdfReader.Close();
                }
                if (pdfDocument != null)
                {
                    pdfDocument.Close();
                }
                if (outPDfDoc != null)
                {
                    outPDfDoc.Close();
                }
                if (pdfWriter != null)
                {
                    pdfWriter.Close();
                    pdfWriter.Dispose();
                }
            }

思路：遍历原来的PDF页码，将原来的PDF页码对象拷贝PdfFormXObject到要生成的PDF文档中，首先要copy页面对象才能使用，不然直接获取的page对象是原来文档的，我们无法操作。

var formXObject = page.CopyAsFormXObject(outPDfDoc);

然后对页面进行缩放计算，我们新的PDF默认设置成A3大小，通过计算原始页面和新页面宽高比例进行缩放。

计算完成后，在新文档中使用PdfCanvas 对象新添加一页，然后将PdfFormXObject 写入到新添加的页中。

处理后的PDF:

三、切分PDF

切分PDF 就比较简单了，直接从原始文件中拷贝页面到新PDF文档中就行了。

切分PDF 方法：

        public void ExtractPages(string sourcePdfPath, string outputPdfPath, int startPage, int endPage)
        {
            PdfReader pdfReader = null;
            PdfDocument pdfDocument = null;
            PdfWriter pdfWriter = null;
            PdfDocument outPDfDoc = null;
            try
            {
                pdfReader = new PdfReader(sourcePdfPath);
                pdfDocument = new PdfDocument(pdfReader);
                var outDir = Path.GetDirectoryName(outputPdfPath);
                if (!Directory.Exists(outDir))
                {
                    Directory.CreateDirectory(outDir);
                }
                
                pdfWriter = new PdfWriter(outputPdfPath);
                outPDfDoc = new PdfDocument(pdfWriter);

                pdfDocument.CopyPagesTo(startPage, endPage, outPDfDoc);
                pdfWriter.Flush();

            }
            catch (Exception ex)
            {
                Console.WriteLine(ex);

            }
            finally
            {
                if (pdfReader != null)
                {
                    pdfReader.Close();
                }
                if (pdfDocument != null)
                {
                    pdfDocument.Close();
                }
                if (outPDfDoc != null)
                {
                    outPDfDoc.Close();
                }

                if (pdfWriter != null)
                {
                    pdfWriter.Close();
                    pdfWriter.Dispose();
                }
            }

        }

注意：对写入流要进行pdfWriter.Flush()将缓冲区数据写入PDF后再关。

以上就是C#利用itext实现PDF页面处理与切分的详细内容，更多关于C# PDF页面处理切分的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

C#新特性之可空引用类型
本文详细讲解了C#新特性之可空引用类型，文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2022-02-02
C#中一个高性能异步socket封装库的实现思路分享
下面小编就为大家分享一篇C#中一个高性能异步socket封装库的实现思路，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2017-11-11
c#之获取本机主机名的四种方式总结
这篇文章主要介绍了c#之获取本机主机名的四种方式总结，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-07-07
在C# WPF下自定义滚动条ScrollViewer样式的操作
这篇文章主要介绍了在C# WPF下自定义滚动条ScrollViewer样式的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
浅谈C#9.0新特性之参数非空检查简化
这篇文章主要介绍了浅谈C#9.0新特性之参数非空检查简化，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-06-06
C# 常见操作符整理
操作符接受一个或多个参数，并生成一个新值。操作符其实可以看做一个有返回值方法，但是参数的形式和调用和普通的调用不同。
2011-02-02
Unity中的静态批处理和动态批处理操作
这篇文章主要介绍了Unity中的静态批处理和动态批处理操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-04-04
C#递归应用之实现JS文件的自动引用
这篇文章主要为大家详细介绍了C#如何利用递归实现JS文件的自动引用的功能，文中的示例代码讲解详细，具有一定的参考价值，需要的可以参考一下
2023-03-03
C#编程中使用设计模式中的原型模式的实例讲解
这篇文章主要介绍了C#编程中使用设计模式中的原型模式的实例讲解,原型模式创建新对象方便快捷,而且可在运行时根据需要通过克隆来添加和去除他们,也可在程序运行是根据情况来修改类内部的数据,需要的朋友可以参考下
2016-02-02
C#编程之依赖倒置原则DIP
这篇文章介绍了C#编程之依赖倒置原则DIP，文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2022-03-03

C#利用itext实现PDF页面处理与切分

目录

一、itext

二、处理PDF页面大小一致

三、切分PDF

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具