红薯HtmlSucker 0.0.1 HTML网页信息提取工具包

  • 源码大小:14.1KB
  • 源码语言:英文软件
  • 源码类型:汉化补丁
  • 源码授权:免费软件
  • 源码类别:jsp其它
  • 应用平台:Windows平台
  • 源码官网:
  • 更新时间:2018-01-30
  • 网友评分:
360通过 腾讯通过 金山通过

情介绍

HtmlSucker是一款用来从一个HTML网页中提取文章信息的小工具包,例如从网页中提取文章标题、作者、发布时间、 封面图以及文章正文内容。基于 jsoup 库进行 HTML 解析。

HtmlSucker 提供两种正文提取算法:

最大文本块:分析整个 HTML 文档的所有节点,提取其中包含最多文字的的连续节点。
文本密度算法:参考 WebCollector 项目的代码
目前还处于非常简单的阶段,但是可用。

载地址

下载错误?【投诉报错】

红薯HtmlSucker 0.0.1 HTML网页信息提取工具包

      气源码

      关文章

      • CC活动报名小程序 v1.0

        CC活动报名小程序采用腾讯小程序云开发技术,不需要单独部署服务器和服务端程序...

      • WTS在线答题系统 v1.0.0

        WTS在线答题系统为在线答题系统(在线考试),支持在线考试、在线练习等功能..。欢迎下载使用...

      • 一起鼎OA办公系统软件 v2.0

        一起鼎OA办公系统软件含工作流审批、业务流审批、采购流审批、资金流审批、人力流审批、知识文档、快捷报单、客户管理、项目管理、工作日程、资产管理、资讯公告、分支机构...

      • WTS在线答题系统 v0.3.0

        WTS在线答题系统为在线答题系统(在线考试),支持在线考试、在线练习等功能,非常不错,需要的朋友前来下载吧...

      • HTML+JS上传图片源码下载 v1.0 免费版

        HTML+JS上传图片源码可以帮助前端开发人员快速导入一个图片上传插件的模块脚本...

      • 后台整合包精简版(servlet_DBC) v2.0

        后台整合包精简版(servlet_DBC)是一个整合了部分Java后台功能的工具包。欢迎下载使用...

      • jspgou网店系统 v6.1.1 店中店版

        jspgou是基于java技术研发的电子商务管理软件,以其强大、稳定、安全、高效、跨平台等多方面的优点,网站模板统一在后台管理,系统拥有强大、灵活的标签,用户自定义显示内...

      • angularjs Web页面框架 v18.0.6

        Angular JS (Angular.JS) 是一组用来开发Web页面的框架、模板以及数据绑定和丰富UI组件,欢迎下载使用...

      • JPress v3.0 alpha.1

        JPress,一个wordpress的java代替版本,使用JFinal开发。支持类似wordpress的几乎所有功能,比如:模板,插件等。同时在模板上,JPress提出了“模板即模型”的概念...

      • 双鱼林JSP商品进销存系统 v1.0

        双鱼林JSP商品进销存系统是一款一个电子供应商,既经营网站又经营许多实体商店,此系统采用了目前最流行的ssm框架,其中的spingMVC框架相对于struts2框架更灵活,更安全...

      载声明

      ☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
      ☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
      ☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
      ☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
      ☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
      ☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
      ☉ 本站提供的红薯HtmlSucker 0.0.1 HTML网页信息提取工具包资源来源互联网,版权归该下载资源的合法拥有者所有。