Data Mining

Hvad er Data Mining:

Data mining er et engelsk begreb knyttet til datalogi, hvis oversættelse er data mining . Den består af en funktionalitet, der aggregerer og organiserer data, finder i dem relevante mønstre, foreninger, ændringer og uregelmæssigheder .

Begrebet data mining opstod først i 1990 i databasemiljøer. Data mining er procesanalysesteget kendt som KDD ( Knowledge Discovery in Databases ), dets bogstavelige oversættelse er "Knowledge Discovery in Databases".

Data mining kan opdeles i nogle få grundlæggende trin: udforskning, modelbygning, mønsterdefinition og validering og verifikation.

Data mining er en forholdsvis ny praksis i computervirksomheden, og den anvender informationssøgning, kunstig intelligens, mønstergenkendelse og statistiske teknikker til at søge efter sammenhænge mellem forskellige data, der giver dig mulighed for at opnå gavnlig viden til en virksomhed eller individ. For et firma kan datautvinning være et vigtigt redskab, som forbedrer innovation og rentabilitet.

Brugen af ​​data mining er ret almindelig i store databaser, og slutresultatet af deres brug kan vises via regler, hypoteser, beslutnings træer, dendrogrammer mv.

Godt udført data mining skal udføre sådanne opgaver som: anomalitetsdetektering, associeringsregelindlæring (afhængighedsmodellering), gruppering, klassificering, regression og opsummering. Dataudvindingsprocessen opstår typisk ved hjælp af data indeholdt i datalageret .

Der er flere virksomheder og software, der er dedikeret til data mining, da identifikation af mønstre i databaser bliver stadig vigtigere. Identifikationen af ​​relevante standarder er imidlertid ikke unik for computerverdenen. Den menneskelige hjerne bruger en lignende proces til at identificere mønstre og erhverve viden.

I de seneste år har dataudvinding været anvendt i vid udstrækning inden for videnskab og teknik, såsom bioinformatik, genetik, medicin, uddannelse og elteknik.

Begrebet data mining er ofte forbundet med at udtrække information om folks adfærd. Af denne grund rejser dataudvinding i nogle situationer lovlige problemer og spørgsmål vedrørende privatlivets fred og etik. På trods af dette hævder mange mennesker, at data mining er etisk neutral, da det ikke har nogen etiske konsekvenser.

Eksempler på reelle data minedrift

Data mining bruges ofte af virksomheder og organisationer til at få viden om brugere / medarbejdere / kunder. For eksempel er det i den offentlige sektor muligt at krydstjekke mellem en civilarbejders civilstand og den løn, han tjener for at se, om dette påvirker hans ægteskabs liv.

Virksomheder som supermarkedskæder kan bruge denne cross-data til at bestemme produkter, der købes sammen. Hvis en kunde, der køber produkt X også køber produkt Y, kan det være en god idé at placere de to produkter i nærheden for at gøre det lettere for kunden at købe.