Što je Data Mining?

Velike tvrtke znaju više o vama nego što ste ikad mogli zamisliti - evo kako

Data mining je analiza velikih količina podataka za otkrivanje obrazaca i znanja. Zapravo, podatkovno rudarstvo je također poznato kao otkrivanje podataka ili otkrivanje znanja.

Dijeljenje podataka koristi statistiku, načela strojnog učenja (ML), umjetnu inteligenciju (AI) i ogromne količine podataka (često iz baza podataka ili skupova podataka) kako bi se identificirali obrasci na način koji je što je više moguće automatiziran i korisan.

Što radi podatkovno rudarstvo?

Data mining ima dva osnovna cilja: opis i predviđanje. Prvo, rudarenje podataka opisuje uvide i znanja dobivena analizom obrazaca u podacima. Drugo, rudarenje podataka koristi opise priznatih obrazaca podataka za predviđanje budućih obrazaca.

Na primjer, ako ste potrošili vrijeme za pregledavanje vremena na web stranici za kupnju knjiga o tome kako prepoznati različite vrste biljaka, usluge rudarenja podataka koje rade iza scene na toj web stranici prijavljuju opis vaših pretraživanja u vezi s vašim profilom. Kada se ponovno prijavite dva tjedna kasnije, usluge rudarenja web stranica koriste opise prethodnih pretraga kako bi predvidjeli vaše trenutne interese i ponudili personalizirane preporuke za kupnju koje uključuju knjige o identifikaciji biljaka.

Kako funkcionira Data Mining

Dijeljenje podataka radi pomoću algoritama, setova uputa koje govore računalu ili procesu kako napraviti zadatak, kako bi otkrili različite vrste obrasca unutar podataka. Nekoliko različitih metoda prepoznavanja uzoraka koje se koriste u podatkovnom rudarstvu uključuju analizu klastera, otkrivanje anomalija, učenje povezanosti, ovisnost podataka, stabla odlučivanja, regresijski modeli, klasifikacije, outlier detekcija i neuronske mreže.

Dok se rudarenje podataka može koristiti za opisivanje i predviđanje obrazaca u svim različitim vrstama podataka, često se susreću mnogi ljudi, čak i ako to ne shvate, opisati obrasce u odabiru vašeg kupca i ponašanja kako bi predvidjeli buduće kupnje odluke.

Kao primjer, jeste li se ikad zapitali kako se čini da Facebook uvijek zna što ste gledali na mreži i prikazuje li se oglasi u vašem vijestu povezanim s drugim web stranicama koje ste posjetili ili s vašim pretraživanjima na webu? Facebook podatkovni rudar koristi podatke pohranjene u vašem pregledniku koji prati vaše aktivnosti, kao što su kolačići , zajedno s vlastitim poznavanjem vaših obrazaca na temelju vaše prethodne upotrebe usluge Facebooka kako bi otkrili i predvidjeli proizvode ili ponude za koje ste možda zainteresirani.

Kakve vrste podataka može biti minirano?

Ovisno o usluzi ili trgovini (fizičke trgovine također koriste podatkovno rudarstvo), iznenađujuća količina podataka o vama i vašim obrascima može se minirati. Podaci prikupljeni o vama mogu sadržavati vrstu vozila koje vozite, gdje živite, mjesta na kojima ste putovali, časopise i novine na koje ste se pretplatili te jeste li vjenčani ili ne. Također može odrediti da li imate djecu, koje su vaše hobije, koje vam bend želite, vaše političke sklonosti, ono što kupujete na mreži, ono što kupujete u fizičkim trgovinama (često kroz kartice nagrađivanja kupca) i sve pojedinosti koje dijelite o svom životu na društvenim medijima.

Na primjer, trgovci i modne publikacije ciljane na tinejdžere upotrebljavaju uvide iz fotografija s podacima o miniranju na uslugama društvenih medija poput Instagrama i Facebooka kako bi predvidjeli modne trendove koji će privući mlade kupce ili čitatelje. Uvid u otkrivanje podataka može biti toliko precizan da neki trgovci čak mogu predvidjeti može li žena biti trudna, na temelju vrlo specifičnih promjena u odabiru kupnje. Trgovina na malo, Target, izvještava se da je tako precizna s predviđanjem trudnoće na temelju obrazaca za kupnju povijesti koji je šalju kupone za dječje proizvode mladoj dami, dajući joj tajnu trudnoće prije nego što je rekla svojoj obitelji.

Dijeljenje podataka je posvuda, međutim, većina otkrivenih i analiziranih informacija o našim kupovnim navikama, osobnim preferencijama, izborima, financijama i online aktivnostima upotrebljava trgovine i usluge s namjerom da unaprijedi iskustvo korisnika.