DataCleaner je sve-u-jednom softver za analizu podataka i čišćenje baze podataka

click fraud protection

Alati za analizu baze podataka pomažu DBA-ovima u prepoznavanju nepodudarnosti i nelogičnih veza između skupova podataka kako bi ih se moglo ukloniti iz baze podataka. No, sposobnost alata za analizu baza podataka ovisi o platformi na kojoj je ugrađena baza podataka. Na primjer, za male relacijske baze podataka kreirane na MS Accessu treba čitav niz različitih uslužnih programa za analizu DB-a od one stvorene pomoću MySQL-a. Ako tražite alat za analizu baza podataka sve u jednom koji vam može pomoći u prepoznavanju i čišćenju suvišnih unosa iz baze podataka, šanse da se naiđete na uslužni program s plaćenim računom su velike. Danas smo otkrili program otvorenog koda, uslužni program temeljen na Javi, pod nazivom DataCleaner koja provodi razne analize baze podataka i koncepte čišćenja, uključujući Kvaliteta podataka, Upravljanje glavnim podacima, Profiliranje podataka, i Praćenje kvalitete podataka, da biste uklonili sve suvišne skupove podataka iz navedenog spremišta podataka. Aplikacija podržava širok raspon platformi baza podataka i podatkovnih datoteka, uključujući CSV, MS Excel (XLS i XLSX), MS Pristup, SAS knjižnica, baza podataka DBase, datoteka s fiksnom širinom, XML, baza podataka OpenOffice, MonoDB, MySQL, Oracle i MS SQL Poslužitelja.

instagram viewer

Uz to, nudi primjere nizova veza i druge mogućnosti za brže stvaranje veza s vašom bazom podataka. Jednom kada je baza podataka povezana ili se skupovi podataka preuzimaju iz određenog DB-a, ona omogućuje pregled kompletnosti Metapodaci informacije o DB tablicama, omogućujući vam jednostavnu izmjenu potrebnih polja i redaka. Štoviše, uključuje opsežnu filteri značajka koja vam može pomoći pregledati samo potrebni dio baze podataka. Na bazu podataka možete primijeniti brojne uvjetne filtre, uključujući Jednako, Maksimalni redovi, Nulta provjera, Brojni raspon, Jedna riječ, String pattern match, i Raspon vrijednosti nizova. Također se možete prilagoditi odabranim filtrima radi ispunjavanja zahtjeva za rudarjenje podataka.

DataCleaner dolazi s an transformator značajka koja vam omogućuje da prethodno obradite podatke za izdvajanje, kombiniranje i generiranje zasebnih vrijednosti. Ugrađeni Analyzer pruža sveobuhvatne Kvaliteta podataka i Profiliranje podataka postupci koji vam pomažu u analiziranju sadržaja odabrane baze podataka. To uključuje brojne značajke analize kao što su Boolov analizator, raspodjela skupa znakova, analizator jaza podataka, analizator podudaranja, pronalazač uzoraka, analizator struna, raspored u dani i vrijednost i više.

Glavno sučelje prikazuje podržane vrste podataka. Sve što trebate je odabrati vrstu baze podataka i konfigurirati detalje veze. Na primjer, ako želite očistiti i analizirati MySQL bazu podataka, unesite naziv baze podataka, naziv klase pogona, niz veze i korisničko ime i lozinku. Excel ili Access datoteku baze podataka možete otvoriti samo specificiranjem kompletnog puta. Jednom kada se uspostavi veza, baza podataka dodaje u popis. Sada provjerite bazu podataka koju želite analizirati i kliknite Analizirati.

analiza glavnog prozora

Lijeva bočna traka sadrži baze podataka iz odabrane baze podataka, omogućujući vam istraživanje baza podataka. Za analizu morate odabrati polja. Samo dvaput kliknite polja koja želite uvrstiti i ona će ih unijeti u popis Izvor kartica. Možete provjeriti skupove podataka i njihovu vrstu te ukloniti nepotrebna polja.

izvor podataka za čišćenje

Pod, ispod Metapodaci Na kartici ćete pronaći sve podatke meta podataka, uključujući tablicu, stupac, obitelj vrsta (na temelju pohranjenih podataka), tip, izvornu vrstu, veličinu, stanje nullabilnosti, stanje indeksa.

metapodataka

filteri kartica omogućuje vam da uključite sve gore navedene filtre kako biste izvukli određene informacije iz stupaca. Omogućuje vam dodavanje više vrsta filtera na popis kako biste lako filtrirali potrebne skupove podataka. Nakon dodavanja filtra, zatvorite prozor filtra i kliknite Dodajte filtar za odabir vrste filtra koji želite koristiti.

filteri

Analyzer je vjerojatno najkorisnija značajka aplikacije. Kao što je već spomenuto, omogućuje vam odabir brojnih vrsta analiza. Ne samo da vam daje detaljno izvješće o analizi, već vam omogućuje i izradu grafikona analize. Jednostavno odaberite potrebnu vrstu analize i ispunite potrebne podatke. Nakon završetka kliknite Pokrenite analizu.

pokrenuti analizu

Nakon klika započet će s izradom izvještaja o analizi. Napredak kartica informacija prikazuje sve procese koje pokreću tijekom generiranja analize.

nova 3

Možete dvaput kliknuti na grafikon gumb prisutan u prvom polju za iscrtavanje podataka na grafu. DataCleaner vam omogućuje spremanje poslova. Stvara XML datoteku koja drži izvještaj o analizi. Datoteke poslova analize mogu se pregledati otvaranjem XML datoteke iz Datoteka -> Otvorena analiza posao.

novi

DataCleaner nudi mogućnost pisanja podataka tijekom različitih faza analize podataka. Na primjer. značajka Filteri omogućuje vam upisivanje očišćenih podataka u zasebnu datoteku. Možete izvesti filtrirane podatke u CSV datoteku, stvoriti Excel proračunsku tablicu, napraviti inscenacijsku tablicu ili umetnuti podatke izravno u tablicu.

CSV datoteka

DataCleaner je ogroman uslužni program za analizu i čišćenje podataka koji podržava Windows, Linux i Mac OS X. Pokušali smo pokriti najistaknutije značajke aplikacije i možda smo propustili nekoliko korisnih alata i opcija. Na stranici proizvoda možete pronaći detaljne priručnike za pomoć i vodiče za upotrebu. Moramo napomenuti da je za rad potreban najnoviji JRE (Java Runtime Environment).

Preuzmite DataCleaner

watch instagram story