03.02.2014 Views

php|architect's Guide to Web Scraping with PHP - Wind Business ...

php|architect's Guide to Web Scraping with PHP - Wind Business ...

php|architect's Guide to Web Scraping with PHP - Wind Business ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

vi ” CONTENTS<br />

Referring URLs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />

P ersistent Connections . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

Content Caching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

U ser Agents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

Ranges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />

Basic HTTP Authentication . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

Digest HTTP Authentication . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

W rap-U p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

Chapter 3 — HTTP Streams W rapper 27<br />

Simple Request and Response Handling . . . . . . . . . . . . . . . . . . . . . 28<br />

Stream Contexts and POST Requests . . . . . . . . . . . . . . . . . . . . . . . 29<br />

Error Handling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

HTTP Authentication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

A F ew M ore Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

W rap-U p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

Chapter 4 — cURL Extension 35<br />

Simple Request and Response Handling . . . . . . . . . . . . . . . . . . . . . 36<br />

Contrasting GET and POST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

Setting M ultiple Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />

Handling H eaders . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />

Debugging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

Cookies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

HTTP Authentication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

Redirection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

Referers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

Content Caching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

U ser Agents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

Byte Ranges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

DNS Caching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

T imeouts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44<br />

Request P ooling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44<br />

W rap-U p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!