Velká data je nová věda o porozumění a předvídání lidského chování studiem velkých objemů nestrukturovaných dat. Velká data jsou také známá jako „prediktivní analytika“. Příkladem velkých dat je analýza příspěvků na Twitteru, kanály na Facebooku, vyhledávání na eBay, GPS trackery a bankomaty. Studium bezpečnostních videí, provozních údajů, počasí, příletů, protokolů věží mobilních telefonů a sledovačů srdečního tepu jsou další formy. Big data je nová chaotická věda, která se mění každý týden, a jen málo odborníků tomu všemu rozumí.
Příklady velkých dat v běžném životě
Předpovídání vypuknutí virů: studiem sociálně-politických údajů, údajů o počasí a klimatu a údajů z nemocnic/klinik nyní tito vědci předpovídají ohniska horečky dengue se 4týdenním předstihem.
Sledování vražd: tento projekt velkých dat profiluje oběti vražd, podezřelé a zločince ve Washingtonu, DC. Tento velký datový projekt je fascinující nejen jako způsob, jak uctít zesnulého, ale také jako zdroj informací pro lidi.
Transit Travel Planning, NYC: Rádiový programátor WNYC Steve Melendez spojil online jízdní řád metra se softwarem itineráře cesty. Jeho výtvor umožňuje Newyorčanům kliknout na jejich polohu na mapě a objeví se předpověď doby jízdy vlaků a metra.
Xerox snížil ztrátu své pracovní síly: práce call centra je emocionálně vyčerpávající. Společnost Xerox studovala datová pole za pomoci profesionálních analytiků a nyní mohou předpovídat, kteří zaměstnanci call center pravděpodobně zůstanou ve společnosti nejdéle.
Podpora boje proti terorismu: Díky studiu sociálních médií, finančních záznamů, rezervací letů a bezpečnostních údajů mohou orgány činné v trestním řízení předvídat a lokalizovat podezřelé teroristy dříve, než provedou své zlé skutky.
Úprava marketingu značky na základě recenzí na sociálních sítích: lidé otevřeně a rychle sdílejí své online myšlenky v hospodě, restauraci nebo fitness klubu. Je možné tyto miliony příspěvků na sociálních sítích prostudovat a poskytnout společnosti zpětnou vazbu o tom, co si lidé o jejich službách myslí.
Kdo používá Big Data? Co s tím dělají?
- Obchodní dům Macy: využívá big data k úpravě svých cen za běhu u více než 70 milionů produktů. Dokonce posílají svým zákazníkům přizpůsobené e -maily podle toho, o čem se Macy’s domnívá, že je zajímá.
- Reakce policie na bombový útok na Bostonský maraton: pomocí velkých dat ke studiu video a sledovacích snímků se policii podařilo rychle zúžit pátrání po podezřelých.
- Morton’s Steakhouse: používá Twitter k zahájení marketingových kaskadérských akcí, včetně slavné dodávky steaku z porterhouse na letiště v New Jersey a večeře s krevetami.
- Visa používá velká data k identifikaci a dopadení podvodníků: Jednotlivé transakce tu a tam mohou snadno skrýt nepoctivého uživatele kreditní karty, ale pozorným sledováním milionů transakcí lze odhalit vzorce podvodů.
- Facebook používá velká data k přizpůsobení reklamy: Díky pečlivému prostudování vašich zálib na FB a návyků při procházení má gigant sociálních médií děsivý přehled o vašem vkusu. Tyto reklamy na postranním panelu, které vidíte ve svém kanálu na Facebooku, vybírají velmi promyšlené a složité algoritmy, které sledovaly vaše návyky na Facebooku.
Proč jsou Big Data tak velká dohoda?
1. Data jsou obrovská – Nevejde se na jeden pevný disk, tím méně na USB flash disk. Objem dat daleko překračuje to, co lidská mysl dokáže vnímat (uvažujte o miliardě miliard megabajtů a poté to znásobte dalšími miliardami).
2. Data jsou chaotická a nestrukturovaná – 50% až 80% práce s velkými daty převádí a čistí informace tak, aby je bylo možné prohledávat a třídit. Pouze několik tisíc odborníků na naší planetě plně ví, jak provést toto vyčištění dat. Tito odborníci také potřebují k práci své specializované nástroje, jako jsou HPE a Hadoop. Možná, že za 10 let se z expertů na velká data stane desetník, ale prozatím jsou to velmi vzácné druhy analytiků a jejich práce je stále velmi nejasná a únavná.
3. Data se stala zbožím, které lze prodávat a kupovat – Existují datová tržiště, kde společnosti a jednotlivci mohou nakupovat terabajty sociálních médií a další data. Většina dat je cloudová, protože jsou příliš velká na to, aby se vešly na jakýkoli jeden pevný disk. Nákup dat obvykle zahrnuje poplatek za předplatné, když se připojíte ke cloudové serverové farmě.
Vedoucími nástroji a nápady pro velká data jsou Amazon, Google, Facebook a Yahoo. Protože tyto společnosti obsluhují svými online službami tolik milionů lidí, dává smysl, že by byli sběrným místem a vizionáři za analýzou velkých dat.
4. Možnosti velkých dat jsou nekonečné – Možná lékaři jednou předvídají infarkty a mrtvice pro jednotlivce týdny předtím, než k nim dojde. Srážky letadel a automobilů by mohly omezit prediktivní analýzy jejich mechanických dat, provozu a povětrnostních podmínek. Seznamování online lze vylepšit tím, že budete mít prediktory velkých dat o tom, kdo jsou pro vás kompatibilní osobnosti. Hudebníci mohou získat přehled o tom, jaká hudební skladba je nejpříjemnější pro měnící se vkus cílového publika. Odborníci na výživu by mohli být schopni předpovědět, která kombinace potravin zakoupených v obchodě zhorší nebo pomůže zdravotním stavům člověka. Povrch byl pouze poškrábaný a objevy ve velkých datech se dějí každý týden.
Big Data Is Messy
Big data jsou prediktivní analytika – převádění masivních, nestrukturovaných dat na něco, co lze prohledávat a třídit. Je to chaotický a chaotický prostor, který vyžaduje zvláštní druh znalostí a trpělivosti. Vezměte si například monolitickou doručovací službu UPS. Programátoři z UPS studují data z GPS a chytrých telefonů jejich řidičů, aby analyzovali nejefektivnější způsoby, jak se přizpůsobit dopravní zácpě. Tato data GPS a smartphonu jsou obrovská a nejsou automaticky připravena k analýze. Tato data se hrnou z různých databází GPS a map prostřednictvím různých hardwarových zařízení smartphonů. Analytici UPS strávili měsíce převáděním všech těchto dat do formátu, který lze snadno vyhledávat a třídit. Ta námaha ale stála za to. Od doby, kdy tyto velké datové analytiky začaly používat, UPS dnes ušetřilo přes 8 milionů galonů paliva. Protože velká data jsou nepořádná a vyžadují tolik úsilí, aby se uklidila a připravila k použití, datoví vědci se stali přezdívanými „správci dat“ pro veškerou únavnou práci, kterou dělají. Věda o velkých datech a prediktivní analytice se však zlepšuje každý týden. Očekávejte, že velké údaje budou do roku 2025 snadno dostupné pro každého.
Jsou Big Data rušivou hrozbou pro soukromí?
Ano, pokud naše zákony a individuální ochrana soukromí nejsou pečlivě spravovány, pak velká data zasahují do osobního soukromí. V současné době již Google, YouTube a Facebook sledují vaše každodenní online návyky. Váš smartphone a počítačový život zanechává digitální stopy každý den a sofistikované společnosti tyto stopy studují. Zákony kolem velkých dat se vyvíjejí. Soukromí je stav bytí, za který nyní musíte převzít osobní odpovědnost, protože jej již nemůžete očekávat jako výchozí právo.
Co můžete udělat pro ochranu svého soukromí
Největší krok, který můžete udělat, je zamaskovat své každodenní návyky pomocí VPN. Služba VPN zašifruje váš signál tak, aby vaše identita a poloha byly alespoň částečně maskovány ze sledovačů. Díky tomu nebudete 100% anonymní, ale VPN podstatně sníží, jak moc může svět sledovat vaše online návyky.