Vilka är de viktigaste Data Mining begrepp?

viktigaste data mining begrepp används för att analysera insamlade uppgifter, i synnerhet i arbetet med att observera ett beteende. Okänd växelverkan mellan data forskas om olika sätt att fastställa kritiska förhållanden mellan ämnen och sammanställda informationen. En utmaning inom datautvinning är att den egentliga information som samlas in får inte påminner om hela domänen. I ett försök att ta itu med detta kan korrelationer mellan uppgifterna metodiskt kontrolleras av de olika begrepp som data mining.

Normer för begreppen data mining tillämpas av Association for Computing Machinery's Special Interest Group om kunskap och Data Mining (SIGKDD). Denna organisation publicerar "International Journal of Information Technology och beslutsfattande" samt tidskriften SIGKDD Explorations. Verkställighet av etik och grundläggande principer för data mining gör att industrin arbetar effektivt och med begränsade juridiska problem.

inför behandlingen av uppgifterna är en av de viktigaste aspekterna av data mining. Rådata som måste brytas och tolkas. För att utföra denna åtgärd måste en process fastställas, den måldata skall monteras och mönster finns. Processen kallas Knowledge Discovery i databaser och har utvecklats av Gregory Piatetsky-Shapiro 1989.

Fyra olika klasser av begrepp data mining gör att processen kan äga rum. Klustring använder algoritmen skapas från data mining processen att samla föremål i liknande grupper. Till skillnad från klustring, är klassificering av den information när uppgifterna är monterad i fördefinierade grupper och analyseras. Association försök att finna samband mellan variabler, avgöra vilka grupper av uppgifter som i allmänhet förknippas. Den sista typen av data mining är regression , baserad på metoder för att identifiera en funktion i datainsamlingen.

Validera informationen är det sista steget i att upptäcka vad data mining ansökan representerar. Om inte alla algoritmer presentera en giltig uppsättning data, de mönster som uppstår kan leda till en situation som kallas overfitting. För att lösa detta problem är data jämfört med en provning som. Detta är ett koncept där mätningarna är i linje med ett antal algoritmer som skulle ge en rimlig uppsättning av data. Om den förvärvade informationen inte linje upp till den provning som, sedan den förmodade mönster i data måste vara felaktig.

Några av de viktigaste data mining begrepp förekommer i en mängd olika branscher. Gaming, affärer, marknadsföring, naturvetenskap, teknik och övervakning utnyttja alla data mining. Genom att genomföra dessa tekniker, kan varje fält bestämma de bästa metoderna eller bättre sätt att hitta resultat.


Kommentarer

  • Om oss
  • Reklam
  • Kontakta redaktören
  • Få nyhetsbrev
  • RSS-feed

Redaktör: Beáta Megyesi
Nyheter redaktör: Christiane Schaefer

Kundservice: Mats Schaefer,
Helena Löthman

Tel: +46 00 79 22 00
Fax: +46 00 79 22 01

© Copyright 2014 Debok.net - All rights reserved.