php|architect's Guide to Web Scraping with PHP - Wind Business ...
php|architect's Guide to Web Scraping with PHP - Wind Business ...
php|architect's Guide to Web Scraping with PHP - Wind Business ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
vi ” CONTENTS<br />
Referring URLs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />
P ersistent Connections . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
Content Caching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
U ser Agents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
Ranges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />
Basic HTTP Authentication . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />
Digest HTTP Authentication . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />
W rap-U p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
Chapter 3 — HTTP Streams W rapper 27<br />
Simple Request and Response Handling . . . . . . . . . . . . . . . . . . . . . 28<br />
Stream Contexts and POST Requests . . . . . . . . . . . . . . . . . . . . . . . 29<br />
Error Handling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />
HTTP Authentication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
A F ew M ore Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />
W rap-U p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />
Chapter 4 — cURL Extension 35<br />
Simple Request and Response Handling . . . . . . . . . . . . . . . . . . . . . 36<br />
Contrasting GET and POST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />
Setting M ultiple Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />
Handling H eaders . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />
Debugging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
Cookies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />
HTTP Authentication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />
Redirection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />
Referers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />
Content Caching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />
U ser Agents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />
Byte Ranges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />
DNS Caching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />
T imeouts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44<br />
Request P ooling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44<br />
W rap-U p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46