Idle Works, Idle Thoughts

Goutte - PHP抓取网页

Goutte是一个PHP库,用来抓取网页和分析页面元素。

安装Goutee

$ composer require fabpot/goutte

可以看到它依赖于以下库:

抓取一个页面

<?php

require_once("vendor/autoload.php");

use Goutte\Client;

$client = new Client();

$crawler = $client->request("GET", "http://item.taobao.com/item.htm?id=521476534416");

$title = $crawler->filter("title")->first()->text();

echo $title;

?>