|
|
ENDA
ENDA jest systemem do deduplikacji i standaryzacji danych.
Korzyści
- obniżenie kosztów - pozwala na uniknięcie niepotrzebnych
kosztów związanych z dublowaniem się wysyłek lub z wysyłką materiałów
do firm już nieistniejących
- wizerunek firmy - dobrze utrzymana baza danych świadczy
- oszczędność czasu - program działa szybko i łatwo, stworzony
z myślą o wyeliminowaniu czynnika kontroli ludzkiej
- skuteczność działania i wysoka jakość - dzięki zastosowaniu
zaawansowanych technik porównywania danych oraz sieci
neuronowej została uzyskana bardzo wysoka efektywność procesu deduplikacji
danych, sięgająca nawet 99%.
- uniwersalność - dzięki możliwości uczenia się oraz konfigurowalnej
standaryzacji danych program może być dostosowany do dowolnej bazy danych.
Standaryzacja danych
- standaryzacja ogólna - jest podstawowym procesem prowadzonym
w systemie ENDA. Proces ten obejmuje podstawową standaryzację,
(poprawa nadmiarowych białych znaków, poprawa i usunięcie złych
znaków, liczb itp.), jak też standaryzację zaawansowaną
(wykorzystującą słowniki poprawy). Moduł standaryzacji ogólnej
pozwala na poprawienie dowolnej bazy danych oraz jest wykorzystywany
przez wszystkie pozostałe moduły systemu.
- standaryzacja danych adresowych - pozwala na poprawienie
zapisu danych adresowych oraz sprawdzenie ich poprawności względem
słownika. Dzięki temu możliwe jest między innymi uzupełnienie
brakujących danych (np. brakującego kodu pocztowego lub miasta).
- standaryzacja telefonów - pozwala na poprawienie zapisu
telefonów i przedstawienie ich w formie z wyodrębnionym numerem kierunkowym,
numerem właściwym oraz numerem wewnętrznym. Dane źródłowe mogą zostać
podane w formie luźno zapisanego tekstu. Podanie numeru kierunkowego
pomaga zwiększyć poprawność procesu.
- standaryzacja imion i nazwisk - pozwala na standaryzację
zapisu oraz na rozdzielenie imion od nazwisk.
Deduplikacja danych
- deduplikacja danych typu master-slave - jest to deduplikacja
wyszukująca odpowiedniki z bazy slave w bazie master. Doskonale sprawdza
się przy porównywaniu własnej bazy danych z bazą klienta lub nową bazą.
- deduplikacja danych typu multideduplikacja - multideduplikacja
pozwala na deduplikację dowolnej ilości baz danych w ramach jednego procesu.
Dzięki niej można znaleźć duplikaty we własnej bazie danych, lub stworzyć
jedną bazę danych z wielu różnych.
- porównanie par rekordów - pozwala na sprawdzenie podobieństwa
w rekordach, które nie wymagają wyszukiwania.
|
System RAAN wspiera dział handlowy i dział analiz dostarczając informacji o sprzedaży i odsprzedaży produktów. [...]
|
|