Windows

Big Data 3 Vs - Concepts & Models

Hans Rosling: Let my dataset change your mindset

Hans Rosling: Let my dataset change your mindset

Sadržaj:

Anonim

Pojam "podaci" nije nama nov. To je jedna od primarnih stvari koje se podučavaju kada se odlučite za informacijsku tehnologiju i računala. Ako se možete sjetiti, podaci se smatraju sirovim oblikom informacija. Iako već tamo već desetljeće, pojam Big Data danas je zujati. Kao što se vidi iz pojma, opterećenja i opterećenja podataka, veliki su podaci i mogu se obrađivati ​​na različite načine pomoću različitih metoda i alata za dobivanje traženih informacija. Ovaj članak govori o konceptima velikih podataka, koristeći 3 V koji spominje Doug Laney, pionir na području skladištenja podataka za koje se smatra da su pokrenuli područje Infonomics (Information Economics).

Prije nego što nastavite, možda biste htjeli pročitati naše članke o Osnove velikih podataka i velikom korištenju podataka kako biste shvatili bit. Mogli bi dodati do tog posta za daljnja objašnjenja koncepata Big Data.

Big Data 3 Vs

Podaci, u svom ogromnom obliku, akumulirani različitim sredstvima pravilno su se podnijeli u različitim bazama podataka i kasnije su bili bačeni. Kada se koncept pojavi da što više podataka, to je lakše saznati - različite i relevantne informacije - koristeći prave alate, tvrtke su počele pohranjivati ​​podatke dulje vrijeme. To je poput dodavanja novih uređaja za pohranu ili korištenja oblaka za pohranu podataka u bilo kojem obliku koji su dobiveni podaci: dokumente, proračunske tablice, baze podataka i HTML itd. Zatim se organiziraju u odgovarajuće formate pomoću alata koji mogu obraditi ogromne komade Podaci

NAPOMENA: Opseg Big Data nije ograničen na podatke prikupljene i pohranjene u vašim prostorima i oblaku. Može uključivati ​​podatke iz različitih izvora, uključujući, ali ne ograničavajući se na stavke u javnoj domeni.

3D model velikih podataka temelji se na sljedećim V:

  1. Volumen: odnosi se na upravljanje pohranom podataka
  2. Brzina: odnosi se na brzinu obrade podataka
  3. Raznolikost: odnosi se na grupiranje podataka različitih, naizgled nepovezanih skupova podataka

Sljedeći paragrafi objašnjavaju Big Modeliranje podataka govoreći o svaku dimenziju (svaki V) detaljno.

A] Volumen velikih podataka

Govoreći o velikim podacima, može se razumjeti volumen kao velika zbirka neobrađenih podataka. Iako je to istina, to je također o troškovima pohrane podataka. Važni podaci mogu se pohraniti u prostorijama kao iu oblaku, a potonji je fleksibilna opcija. Ali morate li pohraniti sve i sve?

Prema dokumentu koji je objavio Meta Group, kada se povećava količina podataka, dijelovi podataka počinju izgledati nepotrebno. Nadalje, navodi se da treba zadržati samo onu količinu podataka koju tvrtke namjeravaju koristiti. Ostali podaci mogu se odbaciti ili ako tvrtke ne vole pustiti "navodno nebitne podatke", mogu se baciti na neiskorištene računalne uređaje, pa čak i na trake, tako da tvrtke ne moraju platiti za pohranu takvih podataka.

Koristio sam "navodno nevažne podatke" jer i ja vjerujem da se bilo koja vrsta poslovanja može zahtijevati od bilo kojeg biznisa u budućnosti - prije ili kasnije - i stoga je potrebno čuvati u dobrom vremenu prije nego što znate da su podaci doista nije važna. Osobno, bacam stariju podatke s tvrdih diskova iz prošlih vremena, a ponekad i na DVD-ima. Glavna računala i pohrana u oblaku sadrže podatke koje smatram važnima i znaju da ću ih koristiti. Među tim podacima također postoje vrste podataka koji se mogu koristiti nakon nekoliko godina, a mogu završiti na starom HDD-u. Gornji primjer samo je za vaše razumijevanje. Neće odgovarati opisu velikih podataka jer je iznos veći u usporedbi s onim što poduzeća percipiraju kao velike podatke.

B ] Brzina u velikim podacima

Brzina obrade podataka važan je čimbenik kada govorimo o konceptima velikih podataka. Postoje mnoge web stranice, posebno e-trgovina. Google je već priznao brzinu kojom je učitavanje stranice neophodno za bolje rangiranje. Osim ljestvice, brzina također pruža udobnost korisnicima dok oni kupuju. Isto vrijedi i za podatke koji se obrađuju za ostale informacije.

Dok govorimo o brzini, bitno je znati da je izvan samo veće širine pojasa. Kombinira podatke koji se lako koriste s različitim alatima za analizu. Jednostavno upotrebljivi podaci znače neke domaće zadaće za stvaranje struktura podataka koji se lako obrađuju. Sljedeća dimenzija - Raznolikost, širi daljnje svjetlo na to.

C] Raznolikost velikih podataka

Kada dođe do opterećenja i opterećenja podataka, postaje važno organizirati ih na način da analitički alati lako mogu obraditi podaci. Postoje i alati za organiziranje podataka. Pri pohranjivanju podataka mogu biti nestrukturirani i iz bilo kojeg oblika. Na vama je da shvatite koji je odnos s drugim podacima s vama. Kada shvatite odnos, možete odabrati odgovarajuće alate i pretvoriti podatke u željeni obrazac za strukturirano i sortirano pohranjivanje.

Sažetak

Drugim riječima, 3D Model velikih podataka temelji se na tri dimenzije: USABLE podaci koje posjedujete; pravilno označavanje podataka; i brže obrade. Ako se ta tri brine, vaši se podaci lako obrađuju ili analiziraju kako bi se utvrdilo što god želite.

Gore objašnjava oba koncepta i 3D model Big Data. Članci povezani u drugom para pokazat će dodatnu podršku ako ste novi u konceptu.

Ako želite dodati bilo što, molimo komentirati.