SimpleDOM preluare sortata

IonutBotizan · aprilie 26, 2016, 10:00am

Pe bune? Nu înțeleg ce-i așa de complicat…

<?php

require_once 'simple_html_dom.php';

$targetUrl = 'http://localhost/test/curl/sample.html';
$userAgent = 'Googlebot/2.1 (http://www.googlebot.com/bot.html)';

$request = curl_init();
curl_setopt($request, CURLOPT_USERAGENT, $userAgent);
curl_setopt($request, CURLOPT_URL, $targetUrl);
curl_setopt($request, CURLOPT_FAILONERROR, true);
curl_setopt($request, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($request, CURLOPT_AUTOREFERER, true);
curl_setopt($request, CURLOPT_RETURNTRANSFER, true);
curl_setopt($request, CURLOPT_TIMEOUT, 50);

$response = curl_exec($request);

if (!$response) {
    echo '<br />cURL error number:' . curl_errno($request);
    echo '<br />cURL error:' . curl_error($request);
    die();
}

$urls  = array();
$html  = str_get_html($response);
$links = $html->find('.file-name a');

foreach ($links as $a) {
    if (preg_match('/\.jpe?g/', $a->href)) {
        $urls[] = $a->href;
    }
}

var_dump($urls);

?>

Dacă asta nu merge, atunci structura codului HTML este alta decât cea pe care ne-ai dat-o tu sau ai o problemă la preluarea datelor folosind cURL.
Ori revii și spui că a funcționat codul de mai sus, ori ne dai link-ul către pagina pe care vrei s-o parsezi, altfel nu faci nimic altceva decât să irosești timpul oamenilor de pe-aici…

EDIT
Am pus codul complet și testat.