Pe bune? Nu înțeleg ce-i așa de complicat…
<?php
require_once 'simple_html_dom.php';
$targetUrl = 'http://localhost/test/curl/sample.html';
$userAgent = 'Googlebot/2.1 (http://www.googlebot.com/bot.html)';
$request = curl_init();
curl_setopt($request, CURLOPT_USERAGENT, $userAgent);
curl_setopt($request, CURLOPT_URL, $targetUrl);
curl_setopt($request, CURLOPT_FAILONERROR, true);
curl_setopt($request, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($request, CURLOPT_AUTOREFERER, true);
curl_setopt($request, CURLOPT_RETURNTRANSFER, true);
curl_setopt($request, CURLOPT_TIMEOUT, 50);
$response = curl_exec($request);
if (!$response) {
echo '<br />cURL error number:' . curl_errno($request);
echo '<br />cURL error:' . curl_error($request);
die();
}
$urls = array();
$html = str_get_html($response);
$links = $html->find('.file-name a');
foreach ($links as $a) {
if (preg_match('/\.jpe?g/', $a->href)) {
$urls[] = $a->href;
}
}
var_dump($urls);
?>
Dacă asta nu merge, atunci structura codului HTML este alta decât cea pe care ne-ai dat-o tu sau ai o problemă la preluarea datelor folosind cURL.
Ori revii și spui că a funcționat codul de mai sus, ori ne dai link-ul către pagina pe care vrei s-o parsezi, altfel nu faci nimic altceva decât să irosești timpul oamenilor de pe-aici…
EDIT
Am pus codul complet și testat.