Just nu i M3-nätverket
Gå till innehåll

"parsa" en webbsida


raiTA

Rekommendera Poster

Hej!

Vet du möjligen hur man parsar en annan hemsida och publicerar på sin egen? Tex om jag vill ha nyheter från en nyhetssida (i det här fallet nyheter för en spelsida) om vad som hänt i spelvärlden. Så kan min php sida titta på källan och plocka just den snutt jag behöver.

Eller kan du kanske något annat ord för funktionen som jag själv kan söka vidare på.

 

Tack för din tid!

Hälsningar

Erik

 

Länk till kommentar
Dela på andra webbplatser

Det är egentligen väldigt enkelt, men du ska tänka på att det är en hel del småpysslande med att formatera det som du vill ha det.

 

Läs först in en sida med file(), som du sedan omvandlar till en sträng med implode().

Sedan ska du plocka ut de delarna du vill ha. Du får då titta på HTML-koden för den aktuella webbsidan, och försöka leta upp specifika taggar m.m. som definierar där du vill börja och sluta extrahera innehåll.

 

Du letar upp dessa i din sträng med strpos(), och delar upp strängen med substr().

Överkurs är att använda sig av reguljära uttryck (sök här på Eforum så får du fram en massa tips om dessa), men det är betydligt krångligare, och inte alls nödvändigt.

 

Så här kan lite exmpelkod se ut:

$sida = implode("", file("http://www.doman.se/spelsida.html"));
$start = strpos($sida, "<b>Nyheter</b><p>");
$slut =  strpos($sida, "</p>", $start);
$nyheter = substr($sida, $start, $slut);
echo $nyheter;

 

Länk till kommentar
Dela på andra webbplatser

Arkiverat

Det här ämnet är nu arkiverat och är stängt för ytterligare svar.

×
×
  • Skapa nytt...