Standaryzacja danych polega na ujednoliceniu formy zapisu oraz weryfikacji
poprawności względem słownika danych. Dzięki standaryzacji poprawia się jakość danych oraz podnosi
się skuteczność wyszukiwania informacji w bazie.
Standaryzacja danych obejmuje m. in.:
- Dane adresowe: forma zapisu zostaje sprawdzona względem słownika. Kody pocztowe zostają poprawione bądź uzupełnione.
- Imiona i nazwiska: ujednolicenie kolejności imion i nazwisk lub rozdzielenia na osobne pola. Poprawienie literówek w imionach.
- Numery telefonów: ujednolicenie formatu zapisu, uzupełnienie numerów kierunkowych.
- Nazwy firm: ujednolicenie zapisu form prawnych i skrótów oraz wielkości liter.
Samo ujednolicenie zapisów (np. wielkość liter, zapis skrótów) nie wystarcza do jednoznacznego zapisu tych samych rekordów. Z tego powodu tam, gdzie jest to możliwe używane są słowniki pozwalające na znaczne podniesienie jakości danych.
Korzyści wynikające ze standaryzacji:
- Łatwiejsze i bezbłędne wyszukiwanie danych
- Łatwiejsze łączenie zbiorów danych