Vad är Data Skrubber?

Data skura, som ibland kallas data rensning, är processen att upptäcka och ta bort eller korrigera några uppgifter i en databas som har någon form av fel. Detta fel kan bero på att uppgifterna är felaktiga, ofullständiga, formaterade felaktigt, eller att ett exemplar av en annan post. Många data-branscher, såsom bank, försäkring, detaljhandel, transport och telekommunikation kan använda dessa avancerade programvaror för att rensa upp en databas information.

Fel i databaser kan vara ett resultat av mänskliga fel i att införa uppgifter, sammanslagningen av två databaser, en brist på hela företaget eller branschen uppgifter från hela kodningsstandarder, eller på grund av gamla system som innehåller felaktiga eller föråldrade uppgifter. Innan datorerna hade förmåga att sortera och rensa data, var de flesta uppgifter skrubbning för hand. Detta var inte bara tidskrävande och dyrt, men det Ofta ledde till ännu mer mänskliga faktorn.

Behovet av data skura klargörs när man överväger hur enkelt fel kan göras. Till exempel anser en databas med namn och adresser. Ett namn är Bobby Johnson i Needham, MA. Ett annat namn är Bob Johnson i Needham, MA. Denna variation av namn är mest sannolikt ett fel, och hänvisar till en person. Men skulle en dator normalt att den information som om den vore två olika personer. Specialiserade data skrubber programvara kan skilja skillnaden och rättar till det.

Även om dessa små fel kan verka som ett trivialt problem, när sammanslagningen korrupt eller felaktig data i flera databaser kan problemet multipliceras med miljoner . Denna så kallade "smutsiga data" har ett problem så länge det har funnits datorer, men problemet är att bli mer kritisk eftersom företag blir mer komplexa och lagerlokaler data går samman data från flera källor. Det finns ingen mening med att ha en omfattande databas om denna databas är fylld med fel och ifrågasatta uppgifterna.

Företag som använder specialiserade data skura programvara kan antingen utveckla det internt eller köper den från en mängd olika återförsäljare. Programvaran är inte billigt och kan variera allt från ett pris på $ 20. 000 till $ 300,000. Det Ofta krävs också vissa anpassningar så att mjukvaran kommer att arbeta för verksamhetens behov. Programvaran går igenom en process av att använda algoritmer för att standardisera, korrigera, match, och konsolidera data och kan arbeta med ett eller flera uppsättningar av uppgifter.

Data skura ibland hoppat som en del av ett Data Warehouse genomförandet, men det är en av de mest kritiska steg för att ha ett bra, korrekt slutprodukt. Eftersom misstag kommer alltid att göras i samband med inmatning, kommer behovet av uppgifter skura alltid att förekomma.


Kommentarer

  • Om oss
  • Reklam
  • Kontakta redaktören
  • Få nyhetsbrev
  • RSS-feed

Redaktör: Beáta Megyesi
Nyheter redaktör: Christiane Schaefer

Kundservice: Mats Schaefer,
Helena Löthman

Tel: +46 00 79 22 00
Fax: +46 00 79 22 01

© Copyright 2014 Debok.net - All rights reserved.