Standaryzacja danych

Standaryzacja danych polega na ujednoliceniu formy zapisu oraz weryfikacji poprawności względem słownika danych. Dzięki standaryzacji poprawia się jakość danych oraz podnosi się skuteczność wyszukiwania informacji w bazie.

Standaryzacja danych obejmuje m. in.:

  • Dane adresowe: forma zapisu zostaje sprawdzona względem słownika. Kody pocztowe zostają poprawione bądź uzupełnione.
  • Imiona i nazwiska: ujednolicenie kolejności imion i nazwisk lub rozdzielenia na osobne pola. Poprawienie literówek w imionach.
  • Numery telefonów: ujednolicenie formatu zapisu, uzupełnienie numerów kierunkowych.
  • Nazwy firm: ujednolicenie zapisu form prawnych i skrótów oraz wielkości liter.

Samo ujednolicenie zapisów (np. wielkość liter, zapis skrótów) nie wystarcza do jednoznacznego zapisu tych samych rekordów. Z tego powodu tam, gdzie jest to możliwe używane są słowniki pozwalające na znaczne podniesienie jakości danych.

Korzyści wynikające ze standaryzacji:

  • Łatwiejsze i bezbłędne wyszukiwanie danych
  • Łatwiejsze łączenie zbiorów danych