PHP中使用CURL获取页面title例子
更新时间:2015年01月07日 10:31:16 投稿:junjie
这篇文章主要介绍了PHP中使用CURL获取页面title例子,本文使用正则实现获取页面title、页面编码、<head>标签中的内容,需要的朋友可以参考下
通过PHP获取页面title内容的实战演示:
范例代码:
复制代码 代码如下:
<?php
/*
功能: 取得 URL 页面上的 <title> 内容
参数:$_POST['url']
*/
// 设置最长执行的秒数
ini_set ("expect.timeout", 30);
set_time_limit(30);
// 检查 URL
if(!isset($_POST['url']) || $_POST['url'] == ''){
echo "URL 错误";
exit;
}
/* 取得 URL 页面数据 */
// 初始化 CURL
$ch = curl_init();
// 设置 URL
curl_setopt($ch, CURLOPT_URL, $_POST['url']);
// 让 curl_exec() 获取的信息以数据流的形式返回,而不是直接输出。
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
// 在发起连接前等待的时间,如果设置为0,则不等待
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, 0);
// 设置 CURL 最长执行的秒数
curl_setopt ($ch, CURLOPT_TIMEOUT, 30);
// 尝试取得文件内容
$store = curl_exec ($ch);
// 检查文件是否正确取得
if (curl_errno($ch)){
echo "无法取得 URL 数据";
//echo curl_error($ch);/*显示错误信息*/
exit;
}
// 关闭 CURL
curl_close($ch);
// 解析 HTML 的 <head> 区段
preg_match("/<head.*>(.*)<\/head>/smUi",$store, $htmlHeaders);
if(!count($htmlHeaders)){
echo "无法解析数据中的 <head> 区段";
exit;
}
// 取得 <head> 中 meta 设置的编码格式
if(preg_match("/<meta[^>]*http-equiv[^>]*charset=(.*)(\"|')/Ui",$htmlHeaders[1], $results)){
$charset = $results[1];
}else{
$charset = "None";
}
// 取得 <title> 中的文字
if(preg_match("/<title>(.*)<\/title>/Ui",$htmlHeaders[1], $htmlTitles)){
if(!count($htmlTitles)){
echo "无法解析 <title> 的内容";
exit;
}
// 将 <title> 的文字编码格式转成 UTF-8
if($charset == "None"){
$title=$htmlTitles[1];
}else{
$title=iconv($charset, "UTF-8", $htmlTitles[1]);
}
echo $title;
}
相关文章
php 无法加载mysql的module的时候的配置的解决方案引发的思考
今天配置php 的时候,发现没配起mysql ,wordpress提示我需要 mysql 的module之后上google搜索,大多数都是说php.ini 没加载起2012-01-01php+mysql+jquery实现简易的检索自动补全提示功能
这篇文章主要介绍了php+mysql+jquery实现简易的检索自动补全提示功能,涉及基于jQuery的ajax数据库查询与事件动态响应相关操作技巧,需要的朋友可以参考下2017-04-04php 利用socket发送HTTP请求(GET,POST)
作为php程序员一定会接触http协议,也只有深入了解http协议,编程水平才会更进一步。最近我一直在学习php的关于http的编程,许多东西恍然大悟,受益匪浅。希望分享给大家。本文需要有一定http基础的开发者阅读。2015-08-08
最新评论