DataCleaner to wszechstronne oprogramowanie do analizy danych i czyszczenia baz danych

click fraud protection

Narzędzia analizy bazy danych pomagają DBA w identyfikowaniu rozbieżności i nielogicznych połączeń między zestawami danych, aby można je było usunąć z bazy danych. Jednak możliwości narzędzi do analizy baz danych zależą od platformy, na której zbudowana jest baza danych. Na przykład relacyjna baza danych na małą skalę utworzona w MS Access wymaga wielu innych narzędzi do analizy DB niż ta utworzona za pomocą MySQL. Jeśli szukasz kompleksowego narzędzia do analizy bazy danych, które pomoże Ci zidentyfikować i usunąć zbędne wpisy z bazy danych, szanse na znalezienie płatnego narzędzia są wysokie. Dzisiaj odkryliśmy narzędzie open source o nazwie Java DataCleaner który wdraża różne koncepcje analizy i czyszczenia baz danych, w tym Jakość danych, Zarządzanie danymi podstawowymi, Profilowanie danych, i Monitorowanie jakości danych, aby usunąć wszystkie zbędne zestawy danych z określonego magazynu danych. Aplikacja obsługuje szeroką gamę platform baz danych i plików danych, w tym CSV, MS Excel (XLS i XLSX), MS Dostęp, biblioteka SAS, baza danych DBase, plik o stałej szerokości, XML, baza danych OpenOffice, MonoDB, MySQL, Oracle i MS SQL Serwer.

instagram viewer

Ponadto zapewnia przykładowe parametry połączenia i inne opcje, które pomogą Ci szybko utworzyć połączenia z bazą danych. Po podłączeniu bazy danych lub pobraniu zestawów danych z określonej bazy danych można wyświetlić kompletne Metadane informacje o tabelach DB, umożliwiające łatwą modyfikację wymaganych pól i wierszy. Ponadto obejmuje obszerne Filtry funkcja, która może pomóc wyświetlić tylko wymaganą część bazy danych. Możesz zastosować wiele filtrów warunkowych w bazie danych, w tym Równa się, maksymalna liczba wierszy, kontrola zerowa, zakres liczb, pojedyncze słowo, dopasowanie wzorca ciągu, i Zakres wartości ciągu. Masz również swobodę dostosowywania wybranych filtrów, aby spełnić wymagania eksploracji danych.

DataCleaner zawiera transformator funkcja umożliwiająca wstępne przetwarzanie danych w celu wyodrębnienia, połączenia i wygenerowania osobnych wartości. Wbudowany Analizator zapewnia kompleksowe Jakość danych i Profilowanie danych operacje pomagające w analizie zawartości wybranej bazy danych. Zawiera szereg funkcji analitycznych, takich jak Analizator logiczny, rozkład zestawu znaków, analizator luki w danych, analizator dopasowywania, wyszukiwarka wzorców, analizator ciągów, rozkład dni i wartości i więcej.

Główny interfejs pokazuje obsługiwane typy magazynów danych. Wystarczy wybrać typ bazy danych i skonfigurować szczegóły połączenia. Na przykład, jeśli chcesz wyczyścić i przeanalizować bazę danych MySQL, wprowadź nazwę bazy danych, nazwę klasy dysku, parametry połączenia oraz nazwę użytkownika i hasło. Możesz otworzyć plik bazy danych Excel lub Access, podając tylko pełną ścieżkę. Po nawiązaniu połączenia dodaje bazę danych do listy. Teraz sprawdź bazę danych, którą chcesz przeanalizować, i kliknij Analizować.

analiza głównego okna

Lewy pasek boczny przechowuje bazy danych z wybranych magazynów danych, umożliwiając przeglądanie zbiorów danych. Musisz wybrać pola, aby przeprowadzić analizę. Wystarczy dwukrotnie kliknąć pola, które chcesz uwzględnić, a wyświetli się ich lista Źródło patka. Możesz sprawdzić zestawy danych i ich typ oraz usunąć niepotrzebne pola.

źródło datacleaner

Pod Metadane w zakładce znajdziesz wszystkie informacje o metadanych, w tym tabelę, kolumnę, rodzinę typów (na podstawie przechowywanych danych), typ, rodzimy typ, rozmiar, warunek dopuszczania wartości zerowej, status indeksu.

metadane

The Filtry Zakładka umożliwia dołączenie dowolnych wyżej wymienionych filtrów w celu wyodrębnienia określonych informacji z kolumn. Pozwala dodawać do listy wiele typów filtrów, dzięki czemu można łatwo odfiltrować wymagane zestawy danych. Po dodaniu filtra zwiń okno filtra, a następnie kliknij Dodaj filtr wybierz typ filtra, którego chcesz użyć.

filtry

Analizator jest prawdopodobnie najbardziej przydatną funkcją aplikacji. Jak wspomniano wcześniej, pozwala wybrać wiele rodzajów analiz. Nie tylko zapewnia szczegółowy raport z analizy, ale także umożliwia tworzenie wykresów analizy. Wystarczy wybrać wymagany typ analizy i wypełnić wymagane informacje. Po zakończeniu kliknij Uruchom analizę.

przeprowadzić analizę

Po kliknięciu rozpocznie tworzenie raportu z analizy. The Postęp karta informacji pokazuje wszystkie procesy uruchomione podczas generowania analizy.

nowy 3

Możesz dwukrotnie kliknąć wykres przycisk obecny w pierwszym polu, aby wykreślić dane na wykresie. DataCleaner pozwala zapisać zadania. Tworzy plik XML zawierający raport z analizy. Pliki zadań analizy można wyświetlić, otwierając plik XML z Plik -> Otwórz analizę praca.

Nowy

DataCleaner oferuje opcję zapisu danych na różnych etapach analizy danych. Na przykład. funkcja Filtry pozwala zapisywać oczyszczone dane w osobnym pliku. Możesz wyeksportować przefiltrowane dane do pliku CSV, utworzyć arkusz kalkulacyjny Excel, utworzyć tabelę pomostową lub wstawić dane bezpośrednio do tabeli.

plik csv

DataCleaner to potężne narzędzie do analizy i czyszczenia danych, które obsługuje systemy Windows, Linux i Mac OS X. Próbowaliśmy objąć najbardziej istotne funkcje aplikacji i mogliśmy przegapić kilka przydatnych narzędzi i opcji. Szczegółowe instrukcje pomocy i przewodniki użytkowania można znaleźć na stronie produktu. Należy zauważyć, że do działania wymaga najnowszego środowiska JRE (Java Runtime Environment).

Pobierz DataCleaner

watch instagram story