Goutte(グート)でスクレイピングをする準備

Goutte

PHP のスクレイピング用ライブラリであるGoutte(「グート」と読むらしい*1)を使うための準備の方法です。実際の使い方はオフィシャルのドキュメントを見るほうが早いでしょう。

php-curl と php-xml を入れる

以下、Ubuntu 16.04 LTS を用いた場合です。

$ sudo apt-get install php-curl php-xml

composer を入れる

$ sudo apt-get install composer

Goutteと、関連ライブラリを入れる

$ composer require fabpot/goutte symfony/browser-kit symfony/css-selector symfony/dom-crawler

テストしてみる

以下のようなコードでチェックして正しく表示されれば OK です。

<?php
require __DIR__ . '/vendor/autoload.php';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'https://www.yahoo.co.jp/');
var_dump($crawler);
Powered by はてなブログ