Czym jest oczyszczanie danych?

Pochodzący z angielskiego termin data cleansing to nic innego, jak proces przeglądania danych w celu sprawdzenia, czy są dokładne i poprawne.

Większość metod, które mają na celu naprawę lub zamianę błędnych danych, skupia się na ostrożnym przejrzeniu i sprawdzeniu zestawów danych oraz protokołów z nimi związanych.

Data cleansing jest czasem porównywana do robienia czystek w danych (ang. data purging), gdzie stare lub zbędne dane są usuwane z zestawów danych. Jednakże oczyszczanie danych może dotyczyć usuwania starych, niekompletnych lub zduplikowanych danych; oczyszczanie danych jest inne od robienia czystek w takim sensie, że data purging zazwyczaj skupia się na robieniu miejsca na nowe dane, podczas gdy data cleansing skupia się na dokładności danychw systemie. Metoda oczyszczania danych może użyć analizy gramatycznej lub innej metody, aby pozbyć się błędów w składni, błędów typograficznych lub całych fragmentów kodu. Ostrożna analiza może pokazać, jak łączenie wielu zestawów danych prowadziło do duplikacji – w tym wypadku data cleansing może być użyte do naprawienia problemu.

Więcej o oczyszczaniu danych znajdziecie na Techopedia