四个步骤
curl_init();// 初始化
curl_exec();// 向服务器发送请求和接收数据
curl_close();// 关闭cURL
一个简单的网页抓取脚本
$curl = curl_init();// 初始化
curl_setopt($curl,CURLOPT_URL,'http://www.jianshu.com/');// 此参数是要扒取的网站地址
curl_setopt($curl,CURLOPT_RETURNTRANSFER,true);// 此参数决定着,发送请求获取的数据是否直接输出。默认是false,直接输出;值为true,则不直接输出。
$output = curl_exec($curl);// 返回一个字串
curl_close($curl);// 关闭
echo str_replace("简书","谷歌",$output);//输出字串
注:可以在CMD中进入到指定目录下,执行命令。php index.php > jianshu.html
,意思是执行文件index.php
,获取的数据将简书
替换成谷歌
,并且写入到jianshu.html