Kde vznika velke mnozstvo dat ?

Programovacie jazyky, rady, poradňa...
ktozesomja
Medium Star
Medium Star
Príspevky: 326
Registrovaný: 07 máj 2013, 12:05

Kde vznika velke mnozstvo dat ?

Príspevok od používateľa ktozesomja »

Potreboval by som s niecim poradit. Mam za ulohu navrhnut nejaky system alebo nejaku oblast, kde vznika dynamicky velke mnozstvo dat. Pre pouzitie nosql databaz, ak ste o nich poculi. Najlepsie nieco zo skolskeho prostredia (VS) ale nie je to podmienkou.

Studujem problematiku tychto nosql databaz a kto by nevedel, tak pouzivaju sa hlavne tam, kde sa spracuva velke mnozstvo dat, tzv. big data. No a mal by som vymysliet nieco, nejaky priklad, kde by sa dali tieto databazy vyuzit a teda aby sa dalo to nieco aj zrealizovat. No nic ma nejak nenapada. Any ideas ?
Mek
Addict
Addict
Používateľov profilový obrázok
Príspevky: 4661
Registrovaný: 23 mar 2005, 23:00
Bydlisko: ZA <-> TN
Kontaktovať používateľa:

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa Mek »

Velke mnozstvo dat vznika pri logovani akcii systemu, ku ktoremu pristupuje velke mnozstvo uzivatelov, napr. tu na fore by to mohol byt kazdy http request na server. Alebo napriklad take Web API nejakeho systemu, ktore loguje dajme tomu kazdy jeden request a s nim aj kazde prihlasenie (kedze si nedrzi session).
awtt
Medium Professional
Medium Professional
Používateľov profilový obrázok
Príspevky: 1234
Registrovaný: 01 nov 2006, 19:37
Bydlisko: San Francisco
Kontaktovať používateľa:

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa awtt »

Rozne package manage.

Napriklad npm bezi na nosql: https://www.npmjs.org/
harrison314
Hardcore addict
Hardcore addict
Používateľov profilový obrázok
Príspevky: 8219
Registrovaný: 27 máj 2009, 20:42
Bydlisko: Bratislava
Kontaktovať používateľa:

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa harrison314 »

spehovanie pouzivatelov webu, napr budes logovat pozicie mysi, na ktorej casti textu to mali a potom s toho dolovat na ktore cati clankov/prispevkov sa najviac sustredili.
Potom logovanie roznych systmov alebo proxi serverov, prosto web toho genruje mtre vela (kvoli tomu nosql vzniklo).
IMHO: velke mnozstvo dat generuje aj velky hadronovy urychlovac :D
Numline1
Light Professional
Light Professional
Používateľov profilový obrázok
Príspevky: 858
Registrovaný: 04 dec 2006, 18:04

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa Numline1 »

Pripadne existuju aj samostatne projekty, ktore ti vedia vygenerovat kvanta rozneho typu (mena, adresy a podobne).
ktozesomja
Medium Star
Medium Star
Príspevky: 326
Registrovaný: 07 máj 2013, 12:05

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa ktozesomja »

A neviete nahodou ako je to s ukladanim nejakych suborov ako su .pdf, .zip a podobne do takej NoSQL databazy ? Lebo v relacnych databazach typu SQL to je asi tak, ze do DB sa vlozi len odkaz, cesta k suboru. Ale ako to je v NoSQL ? Je subor ulozeny priamo v databaze ?
harrison314
Hardcore addict
Hardcore addict
Používateľov profilový obrázok
Príspevky: 8219
Registrovaný: 27 máj 2009, 20:42
Bydlisko: Bratislava
Kontaktovať používateľa:

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa harrison314 »

ktozesomja napísal:A neviete nahodou ako je to s ukladanim nejakych suborov ako su .pdf, .zip a podobne do takej NoSQL databazy ? Lebo v relacnych databazach typu SQL to je asi tak, ze do DB sa vlozi len odkaz, cesta k suboru. Ale ako to je v NoSQL ? Je subor ulozeny priamo v databaze ?
U kazdej to je inak, musis si to nastudovat priamo v materialoch danej databazy.
ktozesomja
Medium Star
Medium Star
Príspevky: 326
Registrovaný: 07 máj 2013, 12:05

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa ktozesomja »

aha, už som sa k tomu dostal. Konkrétne mi išlo o MongoDB:
Large objects, or “files”, are easily stored in MongoDB. It is no problem to store 100MB videos in the database. For example, MusicNation uses MongoDB to store its videos.
This has a number of advantages over files stored in a file system. Unlike a file system, the database will have no problem dealing with millions of objects.
Prečo to je výhodnejšie mať priamo v DB ? Nejak som to nepochopil z toho.
harrison314
Hardcore addict
Hardcore addict
Používateľov profilový obrázok
Príspevky: 8219
Registrovaný: 27 máj 2009, 20:42
Bydlisko: Bratislava
Kontaktovať používateľa:

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa harrison314 »

Ak mas len jeden uzol, tak je lepsie mat na FS jeden velky subor ako miliardu malich.
Ale NoSQL je viac pouzivane pre distribuovane sytsemy, samo zebezpeci replikaciu a ukladanie v systeme, takze ta to odlahci od namahavej prace.
Aj ked podla mna to neplati obecne, vzdy zalezi od konkretneho pripadu.
Numline1
Light Professional
Light Professional
Používateľov profilový obrázok
Príspevky: 858
Registrovaný: 04 dec 2006, 18:04

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa Numline1 »

Ja sa pridam s jednou otazkou, cisto pre zaujimavost. Ako si MongoDB potom odklada subory (resp. trebars ten jeden subor) ak sa zaplni FS? Predpokladajme, ze pri suboroch sa da vytvorit hierarchia priecinkov a nasledne ulozit cesta do DB, ale ako je to pri DB storagi? Zatial som sa nestretol s tym, ze DB ma viacero datadirov.
Boccaccio
Medium Professional
Medium Professional
Používateľov profilový obrázok
Príspevky: 1097
Registrovaný: 01 mar 2014, 14:00
Bydlisko: Bratislava

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa Boccaccio »

Windows XP, za pár mesiacov vznikne plno GB balastu. :)
harrison314
Hardcore addict
Hardcore addict
Používateľov profilový obrázok
Príspevky: 8219
Registrovaný: 27 máj 2009, 20:42
Bydlisko: Bratislava
Kontaktovať používateľa:

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa harrison314 »

Numline1 napísal:Ja sa pridam s jednou otazkou, cisto pre zaujimavost. Ako si MongoDB potom odklada subory (resp. trebars ten jeden subor) ak sa zaplni FS?
Ked sa zaplni FS tak nijak :D, ale ak myslis distribovany system, tak ho da na iny nod, v tomto sa az tak nevyznam skus pozriet tu http://viktorpetersson.com/2012/01/29/n ... the-cloud/ .
Numline1 napísal:JPredpokladajme, ze pri suboroch sa da vytvorit hierarchia priecinkov a nasledne ulozit cesta do DB, ale ako je to pri DB storagi? Zatial som sa nestretol s tym, ze DB ma viacero datadirov.
Npriklad MS SQL 2008, sa dokaze k suborom ulozenym na FS spravat ako keby to boli binarne data ulozene priamo v DB (tranzakcie, atomicita, citane, zapis DB streamom...). Takisto vie riadky normalnej tabulky delit do viacerych datovych suborov, podla predefinovanch pravidiel.
Numline1
Light Professional
Light Professional
Používateľov profilový obrázok
Príspevky: 858
Registrovaný: 04 dec 2006, 18:04

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa Numline1 »

Jasne, rozumiem ti, aj ked ta druha otazka skor suvisela s tou prvou, ako sa to automatizuje pri clusteroch? Pri FS vies zvolit poriadny loadbalancing, tok dat na servery podla vytazenosti/zaplnenosti, kdezto pri tychto open source DB si to neviem tak lahko predstavit.
harrison314
Hardcore addict
Hardcore addict
Používateľov profilový obrázok
Príspevky: 8219
Registrovaný: 27 máj 2009, 20:42
Bydlisko: Bratislava
Kontaktovať používateľa:

Re: Kde vznika velke mnozstvo dat ?

Príspevok od používateľa harrison314 »

Priznam sa, to neviem. Ja som sa s distribuovanymi databazami stretol len v skole, kde povedali je to super a funguje to :lol: . A s MongoDB, Cassandra, MS SQL len lokalne. Rad by som si to vyskusal na clustry, len nejaky zohnat...
Ale ak to ide len o subory tak sa treba pozriet na hadoop.
A ak ide len o velke mnozstvo dat, to v pohode zvladaju aj komercne relacne databazy, dokonca zvladaju aj daco ako bezschemove ukladanie. Pri distribuovanych databazach je ich jedina vyhoda skalovatelnost.
Napísať odpoveď