Problem s parsovaním

Programovacie jazyky, rady, poradňa...
Matejko42
Novice
Novice
Príspevky: 6
Registrovaný: 23 okt 2013, 14:40

Problem s parsovaním

Príspevok od používateľa Matejko42 »

Zdravim,

mam problem , skoro 1,6gb txt a plne dát ktoré su v riadku od seba oddelené TABom, a potrebjem ich dat do nejakého formatu z ktorého by som to dalej analyzoval. Poradne mam to do zajtra !!! PLS
audiotrack
VIP
VIP
Používateľov profilový obrázok
Príspevky: 25958
Registrovaný: 09 sep 2005, 18:39
Kontaktovať používateľa:

Re: Problem s parsovaním

Príspevok od používateľa audiotrack »

a otázka znie teda ako?
môžeš z toho spraviť databázu, môžeš z toho spraviť xml, môžeš z toho spraviť csv, môžeš z toho spraviť json... záleží v čom a ako to chceš ďalej analyzovať
Matejko42
Novice
Novice
Príspevky: 6
Registrovaný: 23 okt 2013, 14:40

Re: Problem s parsovaním

Príspevok od používateľa Matejko42 »

Ono to mam ako zadanie na "analýzu sociálnych sietí" čiže tam je subor profilov ako 1. uživatel 1 riadok. Potom mam dalšie txt kde su len čisto vztahy medzi nimi ako kto je skym priatel. Nejako to by som to mal rozanalyzovat a dalej stým spracovat.
audiotrack
VIP
VIP
Používateľov profilový obrázok
Príspevky: 25958
Registrovaný: 09 sep 2005, 18:39
Kontaktovať používateľa:

Re: Problem s parsovaním

Príspevok od používateľa audiotrack »

v poriadku, nepýtal som sa čo to je za súbor, a je mi to úprimne jedno :) Otázka ostáva rovnaká, v čom a ako to chceš ďalej analyzovať. Ako si opísal ten problém, je to krásny príklad na prolog. Ak to ale robíš v céčku, jave, php, delphi, visual basicu či hocičom inom, pre každý jazyk bude lepšie zvoliť iný formát. Najuniverzálnejšie by to bolo cez relačnú databázu a sql, ale prerobiť tak veľký súbor do db bude vyžadovať skript na zautomatizovanie a to si sa mal spamätať trošku skôr keď ti to do zajtra treba
Matejko42
Novice
Novice
Príspevky: 6
Registrovaný: 23 okt 2013, 14:40

Re: Problem s parsovaním

Príspevok od používateľa Matejko42 »

v softoch na analýzu sociálnych sieti ako su gephi pajek a také vieš také grafy a podobné + mozno nejaké štatistické metédy
audiotrack
VIP
VIP
Používateľov profilový obrázok
Príspevky: 25958
Registrovaný: 09 sep 2005, 18:39
Kontaktovať používateľa:

Re: Problem s parsovaním

Príspevok od používateľa audiotrack »

gephi aj pajek používajú rovnaký formát, ktorý je podľa tvojho popisu veľmi podobný tomu čo máš ak nie presne taký. Určite ho potrebuješ upravovať?
Matejko42
Novice
Novice
Príspevky: 6
Registrovaný: 23 okt 2013, 14:40

Re: Problem s parsovaním

Príspevok od používateľa Matejko42 »

no neviem či zrovna moje .txt otvoria. Ale chápeš ja mam kopu dát v .txt a musím ich nejako rozriedit aby sa dali analyzovat dalej. Ako ja tiez nejaké moc tomu nechápem preto chcem trošku aj poradit.
harrison314
Hardcore addict
Hardcore addict
Používateľov profilový obrázok
Príspevky: 8219
Registrovaný: 27 máj 2009, 20:42
Bydlisko: Bratislava
Kontaktovať používateľa:

Re: Problem s parsovaním

Príspevok od používateľa harrison314 »

Matejko42 napísal:no neviem či zrovna moje .txt otvoria.
Co ti brani to vyskusat?
Matejko42
Novice
Novice
Príspevky: 6
Registrovaný: 23 okt 2013, 14:40

Re: Problem s parsovaním

Príspevok od používateľa Matejko42 »

Díkes, rozdelil som to do častí potom som to dal do excelu, to by som aj mal, to by sa už dalo použiť na nejaké štatistické metódy. Ale teraz hlavne či neveiete poradit ako to mam roztriedit aby som to analyzoval a nejako použil soft GEPHY, alebo PAJEK.
harrison314
Hardcore addict
Hardcore addict
Používateľov profilový obrázok
Príspevky: 8219
Registrovaný: 27 máj 2009, 20:42
Bydlisko: Bratislava
Kontaktovať používateľa:

Re: Problem s parsovaním

Príspevok od používateľa harrison314 »

Su tie subory verejne dostupne?
Matejko42
Novice
Novice
Príspevky: 6
Registrovaný: 23 okt 2013, 14:40

Re: Problem s parsovaním

Príspevok od používateľa Matejko42 »

Kód: Vybrať všetko

http://snap.stanford.edu/data/soc-pokec.html
a zoscroluj dole a je to soc-pokec-relationships.txt.gz.
Napísať odpoveď