Vad är Data Mining?

Data mining använder en relativt stor mängd datorkraft som verkar på en stor uppsättning data för att fastställa regelbundenheter och samband mellan datapunkterna. Algoritmer som använder tekniker från statistik, maskininlärning och mönsterigenkänning användas för att söka stora databaser automatiskt. Data mining kallas även Knowledge-Discovery i databaser (Kdd).

Liksom begreppet artificiell intelligens , data mining är ett samlingsnamn som kan tillämpas på ett antal olika aktiviteter. I företagsvärlden är data mining används oftast för att bestämma riktningen av trender och förutse framtiden. Det används för att bygga modeller och beslutsstödssystem som ger människor information som de kan använda. Data mining tar ett frontlinjen roll i kampen mot terrorismen. Det var förmodligen använts för att fastställa ledare för the 9 /11 attackerna.

Data gruvarbetare statistiker som använder tekniker med namn som närmaste granne modeller , k-medel gruppering , utpost metod , k-faldig kors validering , kvar en-ut-metoden , och så vidare. Regressionsanalys används för att subtrahera irrelevant mönster, vilket innebär att endast användbar information. Termen Bayesiansk ses ofta i området, med hänvisning till en klass av slutsats tekniker som förutsäga sannolikheten för framtida händelser genom att kombinera tidigare sannolikheter och sannolikheter bygger på villkorad händelser. Skräppostfiltreringen är utan tvekan en form av data mining, som automatiskt ger relevanta meddelanden till ytan från ett kaotiskt hav av phisingförsök och Viagra platser.

beslut träd används för att filtrera berg av uppgifter. I ett beslut träd, går alla data via en ingång nod, där den står inför ett filter som separerar data till vattendrag beroende på dess egenskaper. Till exempel är uppgifter om konsumenternas beteende sannolikt kommer att filtreras utifrån demografiska faktorer. Data mining är inte i första hand fancy grafik och visualiseringsteknik, men det använder dem att visa vad den hittat. Det är känt att vi kan absorbera mer statistisk information visuellt än verbalt och detta format för presentation kan vara mycket övertygande och kraftfullt om de används i rätt sammanhang.

Som vår civilisation blir allt data-mättade och sensorer distribueras i massor i vår närmiljö, kommer vi att upptäcka misstag saker som kan gå förlorad på första passet över. Data mining kommer att låta oss rätta till dessa fel och upptäcka nya insikter grundar sig på tidigare uppgifter, som ger oss mer valuta för våra datalagring buck.


Kommentarer

  • Om oss
  • Reklam
  • Kontakta redaktören
  • Få nyhetsbrev
  • RSS-feed

Redaktör: Beáta Megyesi
Nyheter redaktör: Christiane Schaefer

Kundservice: Mats Schaefer,
Helena Löthman

Tel: +46 00 79 22 00
Fax: +46 00 79 22 01

© Copyright 2014 Debok.net - All rights reserved.