java抓取网页或文件中的邮箱号码

 更新时间:2017年03月28日 16:05:05   作者:java大渣渣  
这篇文章主要为大家详细介绍了java如何抓取网页或文件中的邮箱号码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了java抓取邮箱号码的具体代码,供大家参考,具体内容如下

java抓取文件中邮箱号码的具体代码

package reg;


import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;


public class TestEmail {

public static void main(String[] args) {
// TODO Auto-generated method stub
 BufferedReader br=null;
 try {
br=new BufferedReader(new FileReader("D:/1.htm"));
String str=null;
StringBuilder sb=new StringBuilder();
while((str=br.readLine())!=null){
sb.append(str);
}
List es=getEmail(sb.toString());
for(String e:es){
System.out.println(e);
}
} catch (FileNotFoundException e) {
// TODO: handle exception
e.printStackTrace();
}catch (IOException e) {
// TODO: handle exception
e.printStackTrace();
}finally {
try {
if(br!=null) br.close();
} catch (IOException e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
 public static List getEmail(String str){
 List es=new ArrayList();
Pattern p=Pattern.compile("[\\w\\.-]*\\w+@[\\w\\.-]*\\w+\\.\\w{2,5}");
// Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
 Matcher m=p.matcher(str);
 while(m.find()){
 es.add(m.group());
 }
 return es;
 }
}


java抓取网页中邮箱号码的具体代码

package reg;

import java.io.BufferedReader; 
import java.io.InputStreamReader; 
import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
 
public class Testemail01 
{ 
 public static String getWebCon(String domain) 
 { 
 System.out.println("开始抓取邮件地址..("+domain+")"); 
 StringBuffer sb=new StringBuffer(); 
 try 
 { 
 java.net.URL url=new java.net.URL(domain); 
 BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream())); 
 String line; 
 while((line=in.readLine())!=null) 
 { 
 parse(line); 
 } 
 in.close(); 
 } 
 catch(Exception e) 
 { 
 sb.append(e.toString()); 
 System.err.println(e); 
 
 } 
 return sb.toString(); 
 } 
 public static void main(String[] args) 
 { 
 String s=Testemail01.getWebCon("http://tieba.baidu.com/p/2366935784"); 
 } 
 private static void parse(String line) 
 { 
 Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//邮箱的正则表达式 
 Matcher m=p.matcher(line); 
 while(m.find()) 
 { 
 System.out.println(m.group()); 
 } 
 } 
}

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Java通过MySQL的加解密函数实现敏感字段存储

    Java通过MySQL的加解密函数实现敏感字段存储

    这篇文章主要介绍了如何在Java中MySQL的加解密函数实现敏感字段存储,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2022-03-03
  • IDEA2019.3配置Hibernate的详细教程(未使用IDEA的自动化)

    IDEA2019.3配置Hibernate的详细教程(未使用IDEA的自动化)

    这篇文章主要介绍了IDEA2019.3配置Hibernate的详细教程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-05-05
  • Spring JPA find单表查询方法示例详解

    Spring JPA find单表查询方法示例详解

    这篇文章主要为大家介绍了Spring JPA find单表查询方法示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • Spring Boot如何优化内嵌的Tomcat示例详解

    Spring Boot如何优化内嵌的Tomcat示例详解

    spring boot默认web程序启用tomcat内嵌容器,监听8080端口,下面这篇文章主要给大家介绍了关于Spring Boot如何优化内嵌Tomcat的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面来一起看看吧。
    2017-09-09
  • Spring Boot 配置文件类型properties 格式与yml 格式

    Spring Boot 配置文件类型properties 格式与yml 格式

    这篇文章主要介绍了Spring Boot 配置文件类型properties 格式与yml 格式,文章围绕主题展开详细内容,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-05-05
  • java实现Floyd算法

    java实现Floyd算法

    这篇文章主要为大家详细介绍了java实现Floyd算法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • spring boot + mybatis实现动态切换数据源实例代码

    spring boot + mybatis实现动态切换数据源实例代码

    这篇文章主要给大家介绍了关于spring boot + mybatis实现动态切换数据源的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-10-10
  • Java接收text/event-stream格式数据的详细代码

    Java接收text/event-stream格式数据的详细代码

    这篇文章主要介绍了java接收text/event-stream格式数据,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-07-07
  • Java设计模式之外观模式

    Java设计模式之外观模式

    这篇文章介绍了Java设计模式之外观模式,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-09-09
  • Java框架MyBatis接口编程过程解析

    Java框架MyBatis接口编程过程解析

    这篇文章主要介绍了Java框架MyBatis接口编程过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02

最新评论