Python如何提取chm数据

 更新时间:2023年01月06日 08:35:55   作者:彳亍261  
这篇文章主要介绍了Python如何提取chm数据,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

Python提取chm数据

需求场景

chm格式文档中的内容,提取保存为html

  • 方法一 使用在线转换工具或者软件
  • 方法二 脚本编译

step 1:.bat脚本反编译

使用该脚本, 可以将chm文件反编译,类似解压,获取文件。有些文档可以直接转换为txt,有些会转化为html. 这个跟生成chm文件有关系。

1 新建txt文档, 参照示例写入命令。保存后文件另存为.bat格式

hh -decompile 转换结果输出路径 待转换文件(相对/绝对路径)
# 示例
hh -decompile   D:\Desktop\  123.chm

2 右键 管理员身份运行该文件即可,结果输出到命令指定的目录

step 2: html转txt

【html】Python提取html中文本到txt

查用python自带的.chm官方文档

1.去python的官方网站去下载对应版本的python,在这里下载的python会自带一份官方文档(根据操作系统选择的不同,会有不同的格式),下载windows版本的会有一个(*.chm)格式的说明文档

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

下载好后进入下载目录,找到Doc目录,进入

我的是windows系统,可以看到有个5-6兆的(*.chm)说明文档

windows下可以直接双击打开。

如何查用python自带的.chm官方文档

打开后的样子,可以看到很多目录,充满了知识,等待着去发掘。

如何查用python自带的.chm官方文档

如果我对python自带的某个库的使用十分不解,比如copy,

我应该这样查

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

想找python基本的数据类型以及使用来学习

可以这样来找

如何查用python自带的.chm官方文档

python自带的(内建的)函数有很多,了解一下

如何查用python自带的.chm官方文档

python自带了的各种异常,快来捕获吧

如何查用python自带的.chm官方文档

python语言是一种解释型语言,很大程度上解决了跨平台开发的难度,关于python的各种接口(interface)调用,以及对操作系统的支持,都可以查到。

如何查用python自带的.chm官方文档

关于英语的问题,大可不必担心,有道云翻译提供截屏翻译,鼠标取词翻译,是十分方便的,快去学习吧!

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python利用shutil模块实现文件夹的复制删除与裁剪

    Python利用shutil模块实现文件夹的复制删除与裁剪

    shutil模块是对os模块的补充,主要针对文件的拷贝、删除、移动、压缩和解压操作。本文将利用shutil模块实现文件夹的复制删除与裁剪,需要的可以参考一下
    2022-05-05
  • 对numpy Array [: ,] 的取值方法详解

    对numpy Array [: ,] 的取值方法详解

    今天小编就为大家分享一篇对numpy Array [: ,] 的取值方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • python把数据框写入MySQL的方法

    python把数据框写入MySQL的方法

    这篇文章主要介绍了如何让python把数据框写入MySQL,下文利用上海市2016年9月1日公共交通卡刷卡数据的一份数据单展开其方法,需要的小伙伴可以参考一下
    2022-03-03
  • Python实现的读取电脑硬件信息功能示例

    Python实现的读取电脑硬件信息功能示例

    这篇文章主要介绍了Python实现的读取电脑硬件信息功能,结合实例形式分析了Python基于wmi库读取电脑CPU、磁盘、网络、进程等硬件信息相关操作技巧,需要的朋友可以参考下
    2018-05-05
  • Pandas 模糊查询与替换的操作

    Pandas 模糊查询与替换的操作

    这篇文章主要介绍了Pandas 模糊查询与替换的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • pytorch中model.train()和model.eval()用法及说明

    pytorch中model.train()和model.eval()用法及说明

    在PyTorch中,model.train()用于启用BatchNormalization和Dropout,保证模型在训练阶段能够有效地利用这些层的特性,而model.eval()则是用于测试阶段,确保BatchNormalization和Dropout不会影响测试结果,保持模型的稳定性
    2024-09-09
  • Django用户认证系统 组与权限解析

    Django用户认证系统 组与权限解析

    这篇文章主要介绍了Django用户认证系统 组与权限解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Django如何实现密码错误报错提醒

    Django如何实现密码错误报错提醒

    这篇文章主要介绍了Django如何实现密码错误报错提醒,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值
    2020-09-09
  • python 爬取知乎回答下的微信8.0状态视频

    python 爬取知乎回答下的微信8.0状态视频

    这篇文章主要介绍了python 爬取知乎的微信8.0状态视频的方法,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-03-03
  • Python全局变量与局部变量区别及用法分析

    Python全局变量与局部变量区别及用法分析

    这篇文章主要介绍了Python全局变量与局部变量区别及用法,结合实例形式分析了Python全局变量与局部变量的定义、常见用法、区别及相关操作注意事项,需要的朋友可以参考下
    2018-09-09

最新评论