Reading Web Page Data

Programovacie jazyky, rady, poradňa...
martie32
Novice
Novice
Príspevky: 6
Registrovaný: 07 aug 2008, 19:43

Reading Web Page Data

Príspevok od používateľa martie32 »

Existuje v php nejaka funkcia pomocou ktorej precitam zdrojovy kod nejakej stranky a vyberiem si len cast ktoru potrebujem?
Napriklad miesto IFRAME, potreboval by som nacitat len lavy ramcek stranky.....
Alebo cisto len hodnotu(al. text) nejakeho objektu v zdrojovom kode.
Napr. <img src=x.jpg>....tak si precitam zdrojak a vyberiem si len src
v programe VistaTask som videl nejaku funkciu Reading Web Page Data, ktora stiahne stranku, najde v nej pomocou nejakych bodov hladany retazec a vypise...tak ci nieco podobne nie je aj v php....
chrono
VIP
VIP
Používateľov profilový obrázok
Príspevky: 7127
Registrovaný: 25 dec 2006, 15:17

Príspevok od používateľa chrono »

Ak si urobíš, tak to tam mať budeš. Na stiahnutie stránky môžeš použiť curl a na nájdenie požadovaných informácií budeš musieť použiť pravdepodobne regexp.
jurko.info
Medium Expert
Medium Expert
Príspevky: 108
Registrovaný: 22 nov 2006, 0:16
Kontaktovať používateľa:

Príspevok od používateľa jurko.info »

ako napísal Chrono, cez curl je to asi najschodnejšie, ale táto knižnica môže a nemusí byť nainštalovaná (povolená) a servery, takže si to najprv zisti u poskytovateľa - inak práca s ňou je veľmi jednoduchá

ťažšie to budeš mať s analýzou toho, čo to načíta (alebo uloží do súboru)
martie32
Novice
Novice
Príspevky: 6
Registrovaný: 07 aug 2008, 19:43

Príspevok od používateľa martie32 »

Kód: Vybrať všetko

$curl = curl_init();
   curl_setopt($curl, CURLOPT_URL, "http://www.link.sk");
   curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
   curl_setopt($curl, CURLOPT_HEADER, 0);
   curl_setopt($curl, CURLOPT_COOKIE, "PHPSESSID=a174251863106fd02b6c14d887f2a441; domain=.link.sk; path=/");  
   curl_exec($curl);
 $output = curl_exec($curl); 
fajn tak zdrojak mam stiahnuty v $output......pozadovane udaje z tej stranky, zatial ziskavam, len tak ze si zo zdrojaku odstranim urc. pocet znakov z konca..urc. pocet od zaciatku...a ostane mi co chcem....len urcite to takto nepojde stale...vedeli by ste ma nakopnut ako to vyriesit pomocou tych
regularnych vyrazov? nieco som si o tom pozrel, len neviem dojst na to ako z takeho velkeho zdrojaku, pomocou regexp vytiahnem, len tu malu cast co chcem....napriklad len urcitu tabulku z jej obsahom...alebo udaj src v <img> ...dik.
chrono
VIP
VIP
Používateľov profilový obrázok
Príspevky: 7127
Registrovaný: 25 dec 2006, 15:17

Príspevok od používateľa chrono »

To záleží od toho html kódu.
martie32
Novice
Novice
Príspevky: 6
Registrovaný: 07 aug 2008, 19:43

Príspevok od používateľa martie32 »

napriklad zdrojak google.sk, kusok zo zdrojaku:

Kód: Vybrať všetko

... <td align=center nowrap>
              <input name=hl type=hidden value=cs>
              <input maxlength=2048 name=q size=55 title="Vyhledat Googlem" value="">
              <br>
              <input name=btnG type=submit value="Vyhledat Googlem">
              <input name=btnI type=submit value="Zkusím štěstí"></td>...
a potreboval by som dostat do premennej len hodnotu value, teda Zkusím štěstí

// uz sa mi to podarilo pomocou tych regexp...
Napísať odpoveď