Klasifikace je těžební technika, která přiřazuje kategorie ke kolekci dat, aby pomohla s přesnějšími předpovědi a analýzou. Klasifikace je jednou z několika metod, které mají zefektivnit analýzu velmi velkých datových souborů.
Proč klasifikace?
Velmi velké databáze se v dnešním světě stávají normou velká data. Představte si databázi s terabajty dat – terabajt je jeden bilion bajtů dat. Samotný Facebook drtí každý den 600 terabajtů nových dat (od roku 2014, kdy tyto specifikace oznámil naposledy). Primární výzvou velkých dat je, jak to pochopit. A naprostý objem není jediným problémem: velká data mají také tendenci být různorodá, nestrukturovaná a rychle se měnící. Zvažte audio a video data, příspěvky na sociálních médiích, 3D data nebo geoprostorová data. Tento druh dat nelze snadno kategorizovat ani organizovat. Ke splnění této výzvy byla vyvinuta řada automatických metod pro získávání užitečných informací klasifikace.
Jak klasifikace funguje
Cílem analytika je vytvořit soubor klasifikačních pravidel, která zodpoví otázku, učiní rozhodnutí nebo předpovídají chování. Nejprve je vyvinuta sada tréninkových dat, která obsahuje určitou sadu atributů a pravděpodobný výsledek. Úkolem klasifikačního algoritmu je zjistit, jak tato sada atributů dosáhne svého závěru. Zvažte společnost vydávající kreditní karty, která se snaží určit, kteří vyhlídky by měly nabídku kreditních karet dostat. Údaje o školení společnosti mohou zahrnovat:
název | Stáří | Rod | Roční příjem | Nabídka kreditní karty |
---|---|---|---|---|
John Doe | 25 | M | 39 500 $ | Ne |
Jane Doe | 56 | F | 125 000 $ | Ano |
název | Stáří | Rod | Roční příjem | Nabídka kreditní karty |
---|---|---|---|---|
Jack Frost | 42 | M | 88 000 $ | |
Mary Murray | 16 | F | 0 $ |
Každodenní příklady klasifikace
Za naší každodenní zkušeností spotřebitelů stojí klasifikace a další těžební techniky. Předpovědi počasí využívají klasifikační techniky k hlášení, zda bude den deštivý, slunečný nebo oblačný. Lékařská profese analyzuje zdravotní stav a předpovídá pravděpodobné lékařské výsledky. Typ klasifikační metody, Naive Bayesian, používá podmíněnou pravděpodobnost ke kategorizaci nevyžádaných e-mailů. Více od Lifewire
-
Definování regresního statistického modelu
-
Co přesně jsou „velká data“?
-
Definování domény databáze
-
Atribut databáze definuje vlastnosti tabulky
-
Co je šifrování typu end-to-end?
-
Co je to kvantové počítání?
-
Co je dolování dat?
-
Cyclemeter GPS Bicycling App pro iPhone
-
Recenze SSD WD My Passport
-
Mobilní technologie: AI v telefonech
-
Definice relace databáze
-
Recenze Kaspersky Total Security
-
Definice diagramu entita-vztah
-
Co je shlukování K-znamená?
-
7 nejlepších aplikací šetřících peníze roku 2021
-
Plná funkční závislost v normalizaci databáze
Vaše práva na soukromí
Lifewire a naši partneři třetích stran používají soubory cookie a zpracovávají osobní údaje, jako jsou jedinečné identifikátory, na základě vašeho souhlasu s ukládáním a / nebo přístupem k informacím v zařízení, zobrazováním personalizovaných reklam a pro měření obsahu, přehled publika a vývoj produktů. Chcete-li změnit nebo odvolat váš výběr souhlasu pro Lifewire.com, včetně vašeho práva vznést námitku, kde je použit oprávněný zájem, klikněte níže. Nastavení můžete kdykoli aktualizovat pomocí odkazu „Ochrana osobních údajů v EU“ v dolní části jakékoli stránky. Tyto volby budou globálně signalizovány našim partnerům a nebudou mít vliv na data procházení. Seznam partnerů (prodejců)
My a naši partneři zpracováváme údaje pro:
Aktivně pro identifikaci skenujte vlastnosti zařízení. Používejte přesná geolokační data. Ukládejte a / nebo přistupujte k informacím na zařízení. Vyberte přizpůsobený obsah. Vytvořte si osobní profil obsahu. Měření výkonu reklamy. Vyberte základní reklamy. Vytvořte si přizpůsobený profil reklam. Vyberte přizpůsobené reklamy. Aplikujte průzkum trhu a získejte informace o publiku. Měření výkonu obsahu. Vyvíjejte a vylepšujte produkty. Seznam partnerů (prodejců)