Python在PDF中添加或删除超链接的操作

更新时间：2024年12月15日 09:00:19 作者：Eiceblue

PDF文件现已成为文档存储和分发的首选格式,然而,PDF文件的静态特性有时会限制其交互性,超链接是提高PDF文件互动性和用户体验的关键元素,本文将详细介绍如何使用第三方库Spire.PDF for Python来进行这些操作,需要的朋友可以参考下

引言

PDF文件现已成为文档存储和分发的首选格式。然而，PDF文件的静态特性有时会限制其交互性。超链接是提高PDF文件互动性和用户体验的关键元素。Python作为一种强大的编程语言，拥有多种库和工具来处理PDF文件，包括添加、删除超链接。本文将详细介绍如何使用第三方库Spire.PDF for Python来进行这些操作。

所需Python库 - Spire.PDF for Python。可以通过下面的pip 命令直接安装：

pip install Spire.Pdf

Python 在PDF文档中添加超链接

Spire.PDF for Python支持在PDF中添加不同类型的超链接：

简单文字链接：直接使用 PdfPageBase.Canvas.DrawString() 方法将其绘制到页面上。
超文本链接、邮箱链接：通过 PdfTextWebLink.DrawTextWebLink() 方法绘制到页面上。
文档链接：通过 PdfPageBase.AnnotationsWidget.Add(PdfFileLinkAnnotation) 方法添加。

Python 代码如下：

from spire.pdf.common import *
from spire.pdf import *

# 创建PDF文档
pdf = PdfDocument()

# 添加页面
page = pdf.Pages.Add()

# 设置初始X和Y坐标
y = 30.0
x = 10.0

# 创建PDF字体
font = PdfTrueTypeFont("宋体", 14.0, PdfFontStyle.Regular, True)
font1 = PdfTrueTypeFont("宋体", 14.0, PdfFontStyle.Underline, True)

# 添加简单文本链接
label = "简单链接： "
format = PdfStringFormat()
format.MeasureTrailingSpaces = True
page.Canvas.DrawString(label, font, PdfBrushes.get_Black(), 0.0, y, format)
x = font.MeasureString(label, format).Width
url = "https://www.e-iceblue.cn"
page.Canvas.DrawString(url, font1, PdfBrushes.get_Blue(), x, y)
y = y + 28

# 添加超文本链接
label = "超文本链接："
page.Canvas.DrawString(label, font, PdfBrushes.get_Black(), 0.0, y, format)
x = font.MeasureString(label, format).Width
webLink = PdfTextWebLink()
webLink.Text = "主页"
webLink.Url = url
webLink.Font = font1
webLink.Brush = PdfBrushes.get_Blue()
webLink.DrawTextWebLink(page.Canvas, PointF(x, y))
y = y + 28

# 添加邮件链接
label = "邮件链接： "
page.Canvas.DrawString(label, font, PdfBrushes.get_Black(), 0.0, y, format)
x = font.MeasureString(label, format).Width
link = PdfTextWebLink()
link.Text = "联系我们"
link.Url = "mailto:support @e-iceblue.com"
link.Font = font1
link.Brush = PdfBrushes.get_Blue()
link.DrawTextWebLink(page.Canvas, PointF(x, y))
y = y + 28

# 添加文档链接
label = "文档链接: "
page.Canvas.DrawString(label, font, PdfBrushes.get_Black(), 0.0, y, format)
x = font.MeasureString(label, format).Width
text = "点击打开文件"
location = PointF(x, y)
size = font1.MeasureString(text)
linkBounds = RectangleF(location, size)
fileLink = PdfFileLinkAnnotation(linkBounds, "C:\\Users\\Administrator\\Desktop\\排名.xlsx")
fileLink.Border = PdfAnnotationBorder(0.0)
page.AnnotationsWidget.Add(fileLink)
page.Canvas.DrawString(text, font1, PdfBrushes.get_Blue(), x, y)

# 保存PDF文档
pdf.SaveToFile("PDF超链接.pdf")
pdf.Close()

生成文件：

Python 删除PDF 文档中的超链接

如果要将PDF文档中已有的超链接一次性全部删除，可以参考以下步骤：

通过LoadFromFile()方法加载 PDF 文档。
循环遍历文档中的页面，并通过 PdfPageBase.AnnotationsWidget 属性获取每个页面上的注释。
循环遍历所有注释，检查每个注释是否为超链接。
如果是，则使用 PdfAnnotationCollection.Remove() 方法将其删除。
使用 PdfDocument.SaveToFile() 方法保存文档。

Python 代码：

from spire.pdf import *
from spire.pdf.common import *

# 加载PDF文档
pdf = PdfDocument()
pdf.LoadFromFile("PDF超链接.pdf")

# 遍历文档中的所有页面
for j in range(pdf.Pages.Count):
    # 获取每一页
    page = pdf.Pages.get_Item(j)
    # 获取每一页上的注释
    annotations = page.AnnotationsWidget
    # 检查注释是否为空
    if annotations.Count > 0:
        # 遍历所有注释
        i = annotations.Count - 1
        while i >=0:
            # 获取注释
            annotation = annotations.get_Item(i)
            # 检查注释是否为超链接
            if isinstance(annotation, PdfTextWebLinkAnnotationWidget):
                # 删除超链接
                annotations.Remove(annotation)
            i -= 1

# 保存PDF文档
pdf.SaveToFile("删除PDF超链接.pdf")
pdf.Close()

如果仅需删除PDF某一页中的指定超链接，可以参考以下代码：

# 删除第一页中的第一个超链接
page = pdf.Pages.get_Item(0)
page.AnnotationsWidget.RemoveAt(0)

到此这篇关于Python在PDF中添加或删除超链接的操作的文章就介绍到这了,更多相关Python添加或删除PDF超链接内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python 基于TCP协议的套接字编程详解
这篇文章主要介绍了python 基于TCP协议的套接字编程,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-06-06
Python3 实现爬取网站下所有URL方式
今天小编就为大家分享一篇Python3 实现爬取网站下所有URL方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-01-01
python中Tkinter 窗口之输入框和文本框的实现
这篇文章主要介绍了python中Tkinter 窗口之输入框和文本框的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-04-04
Django Middleware自定义中间件及作用详解
这篇文章主要为大家介绍了Django Middleware自定义中间件示例及其作用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2023-11-11
用Python实现校园通知更新提醒功能
今天小编就为大家分享一篇用Python实现校园通知更新提醒功能，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-11-11
Python for i in range ()用法详解
今天小编就为大家分享一篇Python for i in range ()用法详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-12-12
解决Pytorch dataloader时报错每个tensor维度不一样的问题
这篇文章主要介绍了解决Pytorch dataloader时报错每个tensor维度不一样的问题，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2021-05-05
python开发任意表达式求值全功能示例
这篇文章主要为大家介绍了python开发任意表达式求值全功能示例，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-07-07
python中利用Future对象回调别的函数示例代码
最近在学习python，所以这篇文章主要给大家介绍了关于在python中利用Future对象回调别的函数的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习下吧。
2017-09-09
详解Python中HTML解析库pyquery的使用
在工作中难免会遇到解析 HTML 的场景,比如将网页下载下来之后,要解析出里面图片的路径、指定标签里的文本等等,而 pyquery 专门负责做这件事,下面我们就来学习一下他的具体用法吧
2023-12-12