RASoft
quote
 

ENDA

ENDA jest systemem do deduplikacji i standaryzacji danych.

Korzyści

  • obniżenie kosztów - pozwala na uniknięcie niepotrzebnych kosztów związanych z dublowaniem się wysyłek lub z wysyłką materiałów do firm już nieistniejących
  • wizerunek firmy - dobrze utrzymana baza danych świadczy
  • oszczędność czasu - program działa szybko i łatwo, stworzony z myślą o wyeliminowaniu czynnika kontroli ludzkiej
  • skuteczność działania i wysoka jakość - dzięki zastosowaniu zaawansowanych technik porównywania danych oraz sieci neuronowej została uzyskana bardzo wysoka efektywność procesu deduplikacji danych, sięgająca nawet 99%.
  • uniwersalność - dzięki możliwości uczenia się oraz konfigurowalnej standaryzacji danych program może być dostosowany do dowolnej bazy danych.

Standaryzacja danych

  • standaryzacja ogólna - jest podstawowym procesem prowadzonym w systemie ENDA. Proces ten obejmuje podstawową standaryzację, (poprawa nadmiarowych białych znaków, poprawa i usunięcie złych znaków, liczb itp.), jak też standaryzację zaawansowaną (wykorzystującą słowniki poprawy). Moduł standaryzacji ogólnej pozwala na poprawienie dowolnej bazy danych oraz jest wykorzystywany przez wszystkie pozostałe moduły systemu.
  • standaryzacja danych adresowych - pozwala na poprawienie zapisu danych adresowych oraz sprawdzenie ich poprawności względem słownika. Dzięki temu możliwe jest między innymi uzupełnienie brakujących danych (np. brakującego kodu pocztowego lub miasta).
  • standaryzacja telefonów - pozwala na poprawienie zapisu telefonów i przedstawienie ich w formie z wyodrębnionym numerem kierunkowym, numerem właściwym oraz numerem wewnętrznym. Dane źródłowe mogą zostać podane w formie luźno zapisanego tekstu. Podanie numeru kierunkowego pomaga zwiększyć poprawność procesu.
  • standaryzacja imion i nazwisk - pozwala na standaryzację zapisu oraz na rozdzielenie imion od nazwisk.

Deduplikacja danych

  • deduplikacja danych typu master-slave - jest to deduplikacja wyszukująca odpowiedniki z bazy slave w bazie master. Doskonale sprawdza się przy porównywaniu własnej bazy danych z bazą klienta lub nową bazą.
  • deduplikacja danych typu multideduplikacja - multideduplikacja pozwala na deduplikację dowolnej ilości baz danych w ramach jednego procesu. Dzięki niej można znaleźć duplikaty we własnej bazie danych, lub stworzyć jedną bazę danych z wielu różnych.
  • porównanie par rekordów - pozwala na sprawdzenie podobieństwa w rekordach, które nie wymagają wyszukiwania.
System RAAN wspiera dział handlowy i dział analiz dostarczając informacji o sprzedaży i odsprzedaży produktów. [...]
 
Copyright © RASoft    Masz pytania? Zadzwoń: +48 22 3009912