android 封装抓取网页信息的实例代码

 更新时间:2013年06月09日 15:49:36   作者:  
android 封装抓取网页信息的实例代码,需要的朋友可以参考一下

复制代码 代码如下:

package cn.mypic; 

 
    import java.io.BufferedInputStream; 
    import java.io.BufferedReader; 
    import java.io.File; 
    import java.io.FileNotFoundException; 
    import java.io.FileOutputStream; 
    import java.io.IOException; 
    import java.io.InputStreamReader; 
    import java.net.MalformedURLException; 
    import java.net.URL; 
    import java.util.regex.Matcher; 
    import java.util.regex.Pattern; 

 
    public class GetContentPicture { 
    //得到了图片地址并下载图片 
    public void getHtmlPicture(String httpUrl) { 
    URL url; 
    BufferedInputStream in; 
    FileOutputStream file; 
    int count;                      //图片文件名序号  
    FileNumber num=new FileNumber();//图片文件名序号类,num为对象 
    count=num.NumberReadFromFile();//获取图片文件序号 
    try { 
    System.out.println("获取网络图片"); 
       String fileName = (String.valueOf(count)).concat(httpUrl.substring(httpUrl.lastIndexOf(".")));//图片文件序号加上图片的后缀名,后缀名用了String内的一个方法来获得 
        //httpUrl.substring(httpUrl.lastIndexOf("/"));//这样获得的文件名即是图片链接里图片的名字 
       String filePath = "d:/image/";//图片存储的位置 
       url = new URL(httpUrl); 

       in = new BufferedInputStream(url.openStream()); 

       file = new FileOutputStream(new File(filePath+fileName)); 
       int t; 
       while ((t = in.read()) != -1) { 
        file.write(t); 
       } 
       file.close(); 
       in.close(); 
       System.out.println("图片获取成功"); 
       count=count+1;//图片文件序号加1 
       num.NumberWriteToFile(count);//将图片名序号保存 
    } catch (MalformedURLException e) { 
       e.printStackTrace(); 
    } catch (FileNotFoundException e) { 
       e.printStackTrace(); 
    } catch (IOException e) { 
       e.printStackTrace(); 
    } 
    } 

    //获取网页的代码保存在String格式的Content中 
    public String getHtmlCode(String httpUrl) throws IOException { 
    String content =""; 
    URL uu = new URL(httpUrl); // 创建URL类对象 
    BufferedReader ii = new BufferedReader(new InputStreamReader(uu 
        .openStream())); // //使用openStream得到一输入流并由此构造一个BufferedReader对象 
    String input; 
    while ((input = ii.readLine()) != null) { // 建立读取循环,并判断是否有读取值 
       content += input; 
    } 
    ii.close(); 
    return content; 
    } 
    //分析网页代码,找到匹配的网页图片地址 
    public void get(String url) throws IOException { 

    String searchImgReg = "(?x)(src|SRC|background|BACKGROUND)=('|\")/?(([\\w-]+/)*([\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")";//用于在网页代码Content中查找匹配的图片链接。 
    String searchImgReg2 = "(?x)(src|SRC|background|BACKGROUND)=('|\")(http://([\\w-]+\\.)+[\\w-]+(:[0-9]+)*(/[\\w-]+)*(/[\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")"; 

    String content = this.getHtmlCode(url);//this指对象gcp,在此地调用获取网页代码,getHtmlCode方法 
    //System.out.println(content); //输出的content将是一个连续的字符串。 

    Pattern pattern = Pattern.compile(searchImgReg);//java.util.regex.Pattern 
    Matcher matcher = pattern.matcher(content);     //java.util.regex.Matcher 
    while (matcher.find()) { 
       System.out.println(matcher.group(3));//输出图片链接地址到屏幕 
    // System.out.println(url); 
       this.getHtmlPicture(matcher.group(3));//对象调用getHtmlPicture从网上下载并输出图片文件到指定目录 

    } 

    pattern = Pattern.compile(searchImgReg2); 
    matcher = pattern.matcher(content); 
    while (matcher.find()) { 
       System.out.println(matcher.group(3)); 
       this.getHtmlPicture(matcher.group(3)); 

    } 
    // searchImgReg = 
    // "(?x)(src|SRC|background|BACKGROUND)=('|\")/?(([\\w-]+/)*([\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")"; 
    } 
    //主函数url网页的地址 
    public static void main(String[] args) throws IOException { 

    String url = "http://www.baidu.com"; 
    GetContentPicture gcp = new GetContentPicture(); 
    gcp.get(url); 

 
    } 



复制代码 代码如下:

package cn.mypic; 

    import java.io.*; 

    public class FileNumber{ 
    //文件写 
    public void NumberWriteToFile(int x){ 
       int c=0; 
       c=x; 
       File filePath=new File("d:/image");//文件名序号TXT文件保存地址 
       File f1=new File(filePath,"number.txt"); 
       try{ 
        FileOutputStream fout=new FileOutputStream(f1); 
        DataOutputStream out=new DataOutputStream(fout); 
        out.writeInt(c); 

       } 
       catch(FileNotFoundException e){ 
        System.err.println(e); 
       } 
       catch(IOException e){ 
        System.err.println(e); 
       } 

    } 
    //文件读 
    public int NumberReadFromFile(){ 
       int c1 = 0; 
       File filePath=new File("d:/image"); 
       File f1=new File(filePath,"number.txt"); 
       try{ 
        FileInputStream fin=new FileInputStream(f1); 
        DataInputStream in=new DataInputStream(fin); 
        c1=in.readInt(); 
        System.out.println(c1);//输出文件内容至屏幕 
       } 
       catch(FileNotFoundException e){ 
        System.err.println(e); 
       } 
       catch(IOException e){ 
        System.err.println(e); 
       } 
       return c1; 
    } 
    public static void main(String args[]){ 

    } 

}

相关文章

  • Android  ImageView绘制圆角效果

    Android ImageView绘制圆角效果

    这篇文章主要介绍了Android ImageView绘制圆角效果,一种是使用Xfermode,另一种是BitmapShader来实现圆形和圆角的效果,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-01-01
  • Kotlin协程操作之创建启动挂起恢复详解

    Kotlin协程操作之创建启动挂起恢复详解

    本文的定位是协程的创建、启动、挂起、恢复,也会示例一些简单的使用,这里不对suspend讲解,,也不对协程的高级用法做阐述(热数据通道Channel、冷数据流Flow...),本文主要讲协程稍微深入的全面知识
    2022-08-08
  • Android接收和发送短信处理

    Android接收和发送短信处理

    这篇文章主要介绍了Android接收和发送短信处理的相关资料,具有一定的参考价值,需要的朋友可以参考下
    2016-01-01
  • Android SurfaceView画板操作

    Android SurfaceView画板操作

    这篇文章主要为大家详细介绍了Android SurfaceView画板操作,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-05-05
  • Android搜索框SearchView属性和用法详解

    Android搜索框SearchView属性和用法详解

    这篇文章主要为大家详细介绍了Android搜索框SearchView属性和用法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-05-05
  • android6.0运行时权限完美封装方法

    android6.0运行时权限完美封装方法

    今天小编就为大家分享一篇android6.0运行时权限完美封装方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • 基于Android AIDL进程间通信接口使用介绍

    基于Android AIDL进程间通信接口使用介绍

    本篇文章小编为大家介绍,基于Android AIDL进程间通信接口使用介绍。需要的朋友参考下
    2013-04-04
  • 详解Android 硬布局item的高级写法

    详解Android 硬布局item的高级写法

    这篇文章主要介绍了详解Android 硬布局item的高级写法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • Android自定义View实现叶子飘动旋转效果(四)

    Android自定义View实现叶子飘动旋转效果(四)

    这篇文章主要为大家详细介绍了Android自定义View实现叶子飘动旋转效果,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-03-03
  • Android中webView加载H5绑定cookie实例

    Android中webView加载H5绑定cookie实例

    这篇文章主要介绍了Android中webView加载H5绑定cookie实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03

最新评论