Z tejto stranky http://www.zoznam.sk/firmy/s/2627118/Zi ... ef--Presov potrebujem vyparsovat vsetky informacie o firme.
dakujem
dost to suri
Regex PHP
-
JanJanuska
Medium Expert
- Príspevky: 101
- Registrovaný: 13 mar 2007, 21:40
- Bydlisko: Malacky, Praha
- Kontaktovať používateľa:
obsah získaš pomocou file_get_contents
To je pekne
ale necakaj ze ti to tu niekto cele krasne rozparsuje a hodi ti to na podnose
. Namiesto cakania, ze ti to niekto rozparsuje klikni Regularne vyrazy a jedes. 
-
audiotrack
VIP
- Príspevky: 25958
- Registrovaný: 09 sep 2005, 18:39
- Kontaktovať používateľa:
mária, nabudúce trošku samostatnosti. Aspoň skúsiť a opravíme, ale nie že toto chcem, spravte
obrat, počet zamestnancov a webovú stránku sa mi už nechcelo, to si dorob ak ti treba
Kód: Vybrať všetko
<?php
$stranka = file_get_contents("http://www.zoznam.sk/firmy/s/2627118/Zilinsky-Jozef--Presov");
preg_match_all("/margin\-left\:35px\">([+0-9 ].+)<br>/",$stranka,$cisla);
preg_match_all("/<a href=\"mailto:[^0-9][A-z0-9_]+([.][A-z0-9_]+)*[@][A-z0-9_]+([.][A-z0-9_]+)*[.][A-z]{2,4}\">([^0-9][A-z0-9_]+([.][A-z0-9_]+)*[@][A-z0-9_]+([.][A-z0-9_]+)*[.][A-z]{2,4})<\/a>/",$stranka,$mail);
preg_match_all("/I?O:.+([0-9]{8})<br>/",$stranka,$ico);
preg_match_all("/vzniku:.+([0-9]{4})<br>/",$stranka,$rok);
preg_match_all("/<br class=\"br\">+([^<]+)<br>+(.+)<br>/",$stranka,$adresa);
$data['telefon'] = $cisla[1][0];
$data['fax'] = $cisla[1][1];
$data['email'] = $mail[3][0];
$data['adresa'] = $adresa[1][0];
$data['adresa2'] = $adresa[2][0];
$data['ICO'] = $ico[1][0];
$data['rok'] = $rok[1][0];
var_dump($data);
?>