Šta je data mining?

Velike kompanije znaju više o tebi nego što ste ikada mogli da zamislite - Evo kako

Data mining je analiza velikih količina podataka da bi se otkrili šabloni i znanje. Zapravo, data mining je poznat i kao otkrivanje podataka ili otkrivanje znanja.

Rudarstvo podataka koristi statistiku, principe mašinskog učenja (ML), veštačku inteligenciju (AI) i ogromne količine podataka (često iz baza podataka ili skupova podataka) da identifikuje obrasce na način koji je automatizovan i koristan što je više moguće.

Šta radi rudarenje podataka?

Data mining ima dva osnovna cilja: opis i predviđanje. Prvo, rudarstvo podataka opisuje uvide i znanje dobijeno od analize obrasca u podacima. Drugo, rukovanje podacima koristi opise priznatih obrazaca podataka kako bi predvidio buduće obrasce.

Na primjer, ako ste provjerili vrijeme na web lokaciji za kupovinu za knjige o tome kako prepoznati različite vrste biljaka, usluge rudarenja podataka koje rade iza scene na toj web lokaciji prijavljuju opis vaših pretraživanja u vezi sa vašim profilom. Kada se ponovo prijavite dve sedmice kasnije, usluge pretraživanja podataka na webu koriste opise vaših prethodnih pretraga kako bi predvidjeli svoje trenutne interese i ponudile personalizovane preporuke za kupovinu koje uključuju knjige o identifikaciji biljaka.

Kako radi rudarstvo podataka

Rudarstvo podataka radi koristeći algoritme, skupove instrukcija koje govore računaru ili procesuiraju kako da obavljaju zadatak, da otkriju različite vrste obrasca unutar podataka. Nekoliko različitih metoda prepoznavanja uzoraka koji se koriste u rukovanju podacima uključuju klastersku analizu, detekciju anomalije, učenje udruživanja, zavisnost podataka, drveće odlučivanja, regresione modele, klasifikacije, otkrivanje izvana i neuronske mreže.

Dok se rudarenje podataka može koristiti za opisivanje i predviđanje obrasca u svim različitim vrstama podataka, upotreba mnogih ljudi se najčešće susreće, čak i ako to ne shvate, je opisati obrasce u vašim kupovnim izborima i ponašanjima kako bi predvidio mogućnost kupovine u budućnosti odluke.

Kao primer, da li ste se ikada zapitali kako Facebook uvek izgleda da zna šta ste gledali online i prikazali vam oglase u vestima o vestima koji su povezani sa drugim sajtovima koje ste posetili ili vašim pretraživanjima na mreži? Facebook data mining koristi informacije uskladištene u vašem pregledaču koji prate vaše aktivnosti, kao što su kolačići , zajedno sa svojim poznavanjem vaših šema zasnovanih na vašoj prethodnoj upotrebi Facebook usluge da biste otkrili i predvideo proizvode ili ponude za koje možete biti zainteresovani.

Koje vrste podataka mogu biti minirane?

U zavisnosti od servisa ili prodavnice (fizičke prodavnice koriste i rudarenje podataka), iznenađujuća količina podataka o vama i vašim obrascima može biti minirana. Sakupljeni podaci o vama mogu uključivati ​​kakvu vrstu vozila vozite, gdje živite, mesta na kojima ste putovali, časopise i novine koje ste pretplatili i da li ste u braku ili ne. Takođe može utvrditi da li imate ili ne imate djecu, kakve su vaše hobije, koje volite, vaše političko naklonost, ono što kupujete na mreži, ono što kupujete u fizičkim prodavnicama (često putem kartica za nagrađivanje lojalnosti za kupce), te bilo koje podatke koje dijelite o vašem životu na društvenim medijima.

Na primer, trgovci na malo i modne publikacije namenjene tinejdžerima koriste uvide iz podataka za rukovanje fotografijama na uslugama socijalnih medija kao što su Instagram i Facebook, kako bi predvidjeli modne trendove koji će namamiti u kupcima tinejdžera ili čitaocima. Uvidi otkriveni kroz rudarenje podataka mogu biti tako precizni da neki trgovci na malo mogu predvideti da li žena može biti trudna, zasnovana na veoma specifičnim promenama u njenom kupovnom izboru. Trgovac Target je tako precizan sa predviđanjem trudnoće na osnovu obrasca u kupovini istorije da je mladoj dami poslao kupone za bebe proizvode, dajući joj tajnu trudnoće pre nego što je rekla svojoj porodici.

Rudarstvo podataka je svuda, međutim, većina informacija koje su otkrivene i analizirane o našim navikaima kupovine, ličnim preferencijama, izborima, finansijama i online aktivnostima prodavnice i usluge koriste u namjeri da poboljšaju iskustvo kupaca.