java 抓取网页内容实现代码

 更新时间:2014年02月28日 16:00:45   作者:  
这篇文章主要介绍了java 抓取网页内容实现代码,需要的朋友可以参考下

复制代码 代码如下:

package test;

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStream;

import java.io.InputStreamReader;

import java.net.Authenticator;

import java.net.HttpURLConnection;

import java.net.PasswordAuthentication;

import java.net.URL;

import java.net.URLConnection;

import java.util.Properties;

 

public class URLTest {

 // 一个public方法,返回字符串,错误则返回"error open url"

 public static String getContent(String strUrl) {

  try {

   URL url = new URL(strUrl);

   BufferedReader br = new BufferedReader(new InputStreamReader(url

     .openStream()));

   String s = "";

   StringBuffer sb = new StringBuffer("");

   while ((s = br.readLine()) != null) {

    sb.append(s + "/r/n");

   }

   br.close();

   return sb.toString();

  } catch (Exception e) {

   return "error open url:" + strUrl;

  }

 }

 

 public static void initProxy(String host, int port, final String username,

   final String password) {

  Authenticator.setDefault(new Authenticator() {

   protected PasswordAuthentication getPasswordAuthentication() {

    return new PasswordAuthentication(username,

      new String(password).toCharArray());

   }

  });

  System.setProperty("http.proxyType", "4");

  System.setProperty("http.proxyPort", Integer.toString(port));

  System.setProperty("http.proxyHost", host);

  System.setProperty("http.proxySet", "true");

 }

 

 public static void main(String[] args) throws IOException {

   String url = "https://www.jb51.net";

   String proxy = "http://192.168.22.81";

   int port = 80;

   String username = "username";

   String password = "password";

   String curLine = "";

   String content = "";

   URL server = new URL(url);

   initProxy(proxy, port, username, password);

   HttpURLConnection connection = (HttpURLConnection) server

   .openConnection();

   connection.connect();

   InputStream is = connection.getInputStream();

   BufferedReader reader = new BufferedReader(new

   InputStreamReader(is));

   while ((curLine = reader.readLine()) != null) {

   content = content + curLine+ "/r/n";

   }

   System.out.println("content= " + content);

   is.close();

   System.out.println(getContent(url));

 }

}       

相关文章

  • SpringBoot引入Thymeleaf的实现方法

    SpringBoot引入Thymeleaf的实现方法

    这篇文章主要介绍了SpringBoot引入Thymeleaf的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-04-04
  • java类中使用Jfreechart的简单实例

    java类中使用Jfreechart的简单实例

    这篇文章介绍了java类中使用Jfreechart的简单实例,有需要的朋友可以参考一下
    2013-08-08
  • Java基于Calendar类输出指定年份和月份的日历代码实例

    Java基于Calendar类输出指定年份和月份的日历代码实例

    这篇文章主要介绍了Java 使用Calendar类输出指定年份和月份的日历,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02
  • 使用Feign传递请求头信息(Finchley版本)

    使用Feign传递请求头信息(Finchley版本)

    这篇文章主要介绍了使用Feign传递请求头信息(Finchley版本),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-03-03
  • java线程池使用及原理面试题

    java线程池使用及原理面试题

    很多面试官喜欢把线程池作为问题的起点,然后延伸到其它内容,由于我们专栏已经说过队列、线程、锁面试题了,所以本章面试题还是以线程池为主
    2022-03-03
  • iBatis习惯用的16条SQL语句

    iBatis习惯用的16条SQL语句

    iBatis 是apache 的一个开源项目,一个O/R Mapping 解决方案,iBatis 最大的特点就是小巧,上手很快.这篇文章主要介绍了iBatis习惯用的16条SQL语句的相关资料,需要的朋友可以参考下
    2016-10-10
  • java性能优化之编译器版本与平台对应关系

    java性能优化之编译器版本与平台对应关系

    这篇文章主要介绍了java性能优化--编译器版本与平台对应关系,本章节更加具体化的学习编译器还有哪些可以优化的方便,让你的应用展现出更好的性能,需要的朋友可以参考下
    2022-06-06
  • springboot中RestTemplate发送HTTP请求的实现示例

    springboot中RestTemplate发送HTTP请求的实现示例

    RestTemplate是一个 spring-web 提供的执行HTTP请求的同步阻塞式工具类,本文就来介绍一下RestTemplate发送HTTP请求,具有一定的参考价值,感兴趣的可以了解一下
    2024-03-03
  • Java日志组件间关系详解

    Java日志组件间关系详解

    在本文里我们给大家整理了关于Java日志组件间关系相关基础知识,需要的朋友们跟着学习下。
    2019-02-02
  • MyBatis mapping类基本用法

    MyBatis mapping类基本用法

    这篇文章主要为大家介绍了MyBatis mapping类基本用法示例详解,
    有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-09-09

最新评论