Problem s parsovaním
Problem s parsovaním
Zdravim,
mam problem , skoro 1,6gb txt a plne dát ktoré su v riadku od seba oddelené TABom, a potrebjem ich dat do nejakého formatu z ktorého by som to dalej analyzoval. Poradne mam to do zajtra !!! PLS
mam problem , skoro 1,6gb txt a plne dát ktoré su v riadku od seba oddelené TABom, a potrebjem ich dat do nejakého formatu z ktorého by som to dalej analyzoval. Poradne mam to do zajtra !!! PLS
-
audiotrack
VIP
- Príspevky: 25958
- Registrovaný: 09 sep 2005, 18:39
- Kontaktovať používateľa:
Re: Problem s parsovaním
a otázka znie teda ako?
môžeš z toho spraviť databázu, môžeš z toho spraviť xml, môžeš z toho spraviť csv, môžeš z toho spraviť json... záleží v čom a ako to chceš ďalej analyzovať
môžeš z toho spraviť databázu, môžeš z toho spraviť xml, môžeš z toho spraviť csv, môžeš z toho spraviť json... záleží v čom a ako to chceš ďalej analyzovať
Re: Problem s parsovaním
Ono to mam ako zadanie na "analýzu sociálnych sietí" čiže tam je subor profilov ako 1. uživatel 1 riadok. Potom mam dalšie txt kde su len čisto vztahy medzi nimi ako kto je skym priatel. Nejako to by som to mal rozanalyzovat a dalej stým spracovat.
-
audiotrack
VIP
- Príspevky: 25958
- Registrovaný: 09 sep 2005, 18:39
- Kontaktovať používateľa:
Re: Problem s parsovaním
v poriadku, nepýtal som sa čo to je za súbor, a je mi to úprimne jedno
Otázka ostáva rovnaká, v čom a ako to chceš ďalej analyzovať. Ako si opísal ten problém, je to krásny príklad na prolog. Ak to ale robíš v céčku, jave, php, delphi, visual basicu či hocičom inom, pre každý jazyk bude lepšie zvoliť iný formát. Najuniverzálnejšie by to bolo cez relačnú databázu a sql, ale prerobiť tak veľký súbor do db bude vyžadovať skript na zautomatizovanie a to si sa mal spamätať trošku skôr keď ti to do zajtra treba
Re: Problem s parsovaním
v softoch na analýzu sociálnych sieti ako su gephi pajek a také vieš také grafy a podobné + mozno nejaké štatistické metédy
-
audiotrack
VIP
- Príspevky: 25958
- Registrovaný: 09 sep 2005, 18:39
- Kontaktovať používateľa:
Re: Problem s parsovaním
gephi aj pajek používajú rovnaký formát, ktorý je podľa tvojho popisu veľmi podobný tomu čo máš ak nie presne taký. Určite ho potrebuješ upravovať?
Re: Problem s parsovaním
no neviem či zrovna moje .txt otvoria. Ale chápeš ja mam kopu dát v .txt a musím ich nejako rozriedit aby sa dali analyzovat dalej. Ako ja tiez nejaké moc tomu nechápem preto chcem trošku aj poradit.
-
harrison314
Hardcore addict
- Príspevky: 8219
- Registrovaný: 27 máj 2009, 20:42
- Bydlisko: Bratislava
- Kontaktovať používateľa:
Re: Problem s parsovaním
Co ti brani to vyskusat?Matejko42 napísal:no neviem či zrovna moje .txt otvoria.
Re: Problem s parsovaním
Díkes, rozdelil som to do častí potom som to dal do excelu, to by som aj mal, to by sa už dalo použiť na nejaké štatistické metódy. Ale teraz hlavne či neveiete poradit ako to mam roztriedit aby som to analyzoval a nejako použil soft GEPHY, alebo PAJEK.
-
harrison314
Hardcore addict
- Príspevky: 8219
- Registrovaný: 27 máj 2009, 20:42
- Bydlisko: Bratislava
- Kontaktovať používateľa:
Re: Problem s parsovaním
Su tie subory verejne dostupne?
Re: Problem s parsovaním
Kód: Vybrať všetko
http://snap.stanford.edu/data/soc-pokec.html