python轻松过滤处理脏话与特殊敏感词汇

 更新时间:2022年07月26日 10:11:57   作者:Python 集中营  
我们开发的系统往往都离不开信息的处理,这些信息有的内容非常敏感,就需要过滤掉不容许出现,

python的其中一个强大之处就是它可以方便的集成很多的非标准库,今天在GitHub上溜达又发现了一个脏话处理神器,导入better_profanity库后,只需要几行代码就能搞定了,相当nice!

使用pip的方式将better_profanity非标准库安装好,这个库好像在清华大学的镜像站中没有,其他镜像站不知道有没有,于是下载时没有使用镜像站,默认到官方去下载即可。

pip install better_profanity
# 将处理模块直接导入到代码块中
from better_profanity import profanity

1、默认脏话库/敏感词库处理

默认情况下就只能处理英文的脏话。

censored_text = profanity.censor("you are bitch")
print(censored_text)
# you are ****

可以看到其中bitch字符被认为是脏话已经处理成****字符了。

当然,还可以将处理后的脏话字符换成别的字符代替,比如下面这样处理。

censored_text = profanity.censor("you are bitch",'-')
print(censored_text)
# you are ----

这样****就被替换成了----。

2、自定义过滤信息处理

bad_words = ['Python', 'Java', 'Scala']  # 自定义过滤词汇
profanity.load_censor_words(bad_words)  # 加载自定义过滤词汇
censored_text = profanity.censor("Python is very Good !")  # 执行过滤
print(censored_text)
# **** is very Good !

可以发现,想要过滤的python字符已经成功过滤掉了。

3、contains_profanity函数

contains_profanity函数用来查看我们的语句中是否包含需要过滤的词汇,如果包含则会返回True,否则返回False。

bad_words = ['bitch', 'Java', 'Scala']  # 自定义过滤词汇
profanity.load_censor_words(bad_words)  # 加载自定义过滤词汇
censored_text = profanity.contains_profanity("you are bitch")
print(censored_text)
# True

结果为True,表示包含需要过滤的词汇信息。

4、load_censor_words_from_file函数

load_censor_words_from_file函数用于加载需要过滤词汇的文件。

profanity.load_censor_words_from_file('/usr/load/bad_words.txt')

加载完词汇文件之后,按照之前的逻辑处理即可。

词汇文件的定义格式,按照每个词汇独占一行的形式进行定义,文件格式使用.txt文本文档即可。

# bitch
# bitches
# bitchin
# bitching
# blowjob
# blowjobs
# blue waffle

到此这篇关于python轻松过滤处理脏话与特殊敏感词汇的文章就介绍到这了,更多相关python脏话处理内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python 实现图片上传接口开发 并生成可以访问的图片url

    python 实现图片上传接口开发 并生成可以访问的图片url

    今天小编就为大家分享一篇python 实现图片上传接口开发 并生成可以访问的图片url,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • Python函数的周期性执行实现方法

    Python函数的周期性执行实现方法

    这篇文章主要介绍了Python函数的周期性执行实现方法,涉及Python使用sched模块实现函数周期性调度触发的相关技巧,需要的朋友可以参考下
    2016-08-08
  • 彻底弄懂Python中的回调函数(callback)

    彻底弄懂Python中的回调函数(callback)

    回调函数就是一个通过函数指针调用的函数,下面这篇文章主要给大家介绍了关于Python中回调函数(callback)的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-06-06
  • CNN的Pytorch实现(LeNet)

    CNN的Pytorch实现(LeNet)

    本文主要从CNN的Pytorch实现库导入,模型定义,数据加载、处理,模型训练,代码汇总等方面入手介绍,运用代码讲解相关内容非常的详细,大家如果有需要了解相关知识的可以参考这篇文章
    2021-09-09
  • python中的数组赋值与拷贝的区别详解

    python中的数组赋值与拷贝的区别详解

    今天小编就为大家分享一篇python中的数组赋值与拷贝的区别详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • OpenCV半小时掌握基本操作之图像处理

    OpenCV半小时掌握基本操作之图像处理

    这篇文章主要介绍了OpenCV基本操作之图像处理,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • python使用回溯算法实现列表全排列

    python使用回溯算法实现列表全排列

    这篇文章主要介绍了python使用回溯算法实现列表全排列,研究的问题是输入列表L(不含重复元素),输出L的全排列,全排列问题,可以用回溯法解决,需要的朋友可以参考下
    2023-11-11
  • Python创建高强度密码生成工具方法实例

    Python创建高强度密码生成工具方法实例

    这篇文章主要为大家介绍了Python创建高强度密码生成工具方法实例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-12-12
  • Python使用Matplotlib模块时坐标轴标题中文及各种特殊符号显示方法

    Python使用Matplotlib模块时坐标轴标题中文及各种特殊符号显示方法

    这篇文章主要介绍了Python使用Matplotlib模块时坐标轴标题中文及各种特殊符号显示方法,结合具体实例分析了Python使用Matplotlib模块过程中针对中文及特殊符号的显示方法,需要的朋友可以参考下
    2018-05-05
  • Python 去除字符串中指定字符串

    Python 去除字符串中指定字符串

    这篇文章主要介绍了Python 去除字符串中指定字符串,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-03-03

最新评论