DataCleaner è un software All-in-One per l'analisi dei dati e la pulizia del database

click fraud protection

Gli strumenti di analisi del database aiutano gli amministratori di database a identificare le discrepanze e le connessioni illogiche tra i set di dati, in modo che possano essere rimossi dal database. Tuttavia, la capacità degli strumenti di analisi del database dipende dalla piattaforma su cui è costruito il database. Ad esempio, un database relazionale su piccola scala creato su MS Access necessita di molte utilità di analisi DB diverse rispetto a quelle create usando MySQL. Se stai cercando uno strumento di analisi del database all-in-one che possa aiutarti a identificare e pulire le voci ridondanti dal database, le probabilità che ti imbatti in un'utilità a pagamento sono alte. Oggi abbiamo scoperto un'utilità open source basata su Java chiamata DataCleaner che implementa una varietà di analisi di database e concetti di pulizia tra cui Qualità dei dati, Gestione dei dati anagrafici, Profilazione dei dati, e Monitoraggio della qualità dei dati, per rimuovere tutti i set di dati superflui dall'archivio dati specificato. L'applicazione supporta una vasta gamma di piattaforme di database e file di dati tra cui CSV, MS Excel (XLS e XLSX), MS Accesso, libreria SAS, database DBase, file a larghezza fissa, XML, database OpenOffice, MonoDB, MySQL, Oracle e MS SQL Server.

instagram viewer

Inoltre, fornisce stringhe di connessione di esempio e altre opzioni che consentono di creare rapidamente connessioni con il database. Una volta che il database è collegato o che i set di dati vengono recuperati dal DB specificato, consente di visualizzare completo Metadati informazioni sulle tabelle DB, che consentono di modificare facilmente i campi e le righe richiesti. Inoltre, include un vasto filtri funzionalità che può aiutarti a visualizzare solo la parte richiesta del database. È possibile applicare numerosi filtri condizionali sul database incluso Uguali, Max righe, Controllo null, Intervallo numerico, Parola singola, Corrispondenza schema corde, e Intervallo di valori stringa. Hai anche la libertà di modificare i filtri selezionati per soddisfare i requisiti di data mining.

DataCleaner viene fornito con un trasformatore funzionalità che consente di pre-elaborare i dati per estrarre, combinare e generare valori separati. Il built-in Analizzatore fornisce completo Qualità dei dati e Profilazione dei dati operazioni per assistere l'utente nell'analisi del contenuto del database selezionato. Include una serie di funzionalità di analisi come Analizzatore booleano, distribuzione di set di caratteri, analizzatore di gap di dati, analizzatore di corrispondenza, finder di pattern, analizzatore di stringhe, distribuzione giornaliera e di valore e altro ancora

L'interfaccia principale mostra i tipi di archivio dati supportati. Tutto ciò che serve è scegliere il tipo di database e configurare i dettagli della connessione. Ad esempio, se si desidera pulire e analizzare il database MySQL, immettere Nome database, Nome classe unità, stringa di connessione, nome utente e password. È possibile aprire il file di database di Excel o Access semplicemente specificando il percorso completo. Una volta stabilita la connessione, aggiunge il database all'elenco. Ora, controlla il database che desideri analizzare e fai clic Analizzare.

analisi della finestra principale

La barra laterale sinistra contiene database dall'archivio dati selezionato, che consente di esplorare i set di dati. È necessario selezionare i campi per eseguire l'analisi. Fai doppio clic sui campi che desideri includere e li elencherà fonte scheda. È possibile controllare i set di dati e il loro tipo e rimuovere tutti i campi non necessari.

origine del datacleaner

Sotto Metadati scheda, troverai tutte le informazioni sui metadati, tra cui Tabella, Colonna, Famiglia di tipi (basata su dati memorizzati), Tipo, Tipo nativo, Dimensione, Condizione nullable, Stato indice.

metadati

Il filtri scheda consente di includere tutti i filtri di cui sopra per estrarre informazioni specifiche dalle colonne. Ti consente di aggiungere più tipi di filtri all'elenco, in modo da poter facilmente filtrare i set di dati richiesti. Dopo aver aggiunto un filtro, comprimi la finestra del filtro e fai clic su Aggiungi filtro per scegliere il tipo di filtro che si desidera utilizzare.

filtri

Analizzatore è probabilmente la funzionalità più utile dell'applicazione. Come accennato in precedenza, consente di selezionare numerosi tipi di analisi. Non solo fornisce un rapporto di analisi dettagliato, ma consente anche di creare grafici di analisi. Basta selezionare il tipo di analisi richiesto e inserire le informazioni richieste. Una volta fatto, clicca Esegui analisi.

eseguire analisi

Al clic, inizierà la creazione del rapporto di analisi. Il Progresso la scheda informazioni mostra tutti i processi che esegue durante la generazione dell'analisi.

nuovo 3

È possibile fare doppio clic su grafico pulsante presente nel primo campo per tracciare i dati sul grafico. DataCleaner consente di salvare i lavori. Crea un file XML che contiene il rapporto di analisi. I file del lavoro di analisi possono essere visualizzati aprendo il file XML da File -> Apri analisi lavoro.

nuovo

DataCleaner offre l'opzione di scrittura dei dati durante le diverse fasi dell'analisi dei dati. Per esempio. la funzione Filtri consente di scrivere dati puliti in un file separato. È possibile esportare i dati filtrati in file CSV, creare un foglio di calcolo Excel, creare una tabella di gestione temporanea o inserire i dati direttamente in una tabella.

file CSV

DataCleaner è un'enorme utility di analisi e pulizia dei dati che supporta Windows, Linux e Mac OS X. Abbiamo cercato di coprire le funzionalità più salienti dell'applicazione e potremmo aver perso alcuni strumenti e opzioni utili. Puoi trovare manuali di aiuto dettagliati e guide d'uso dalla pagina del prodotto. Va notato che per funzionare richiede JRE (Java Runtime Environment) più recente.

Scarica DataCleaner

watch instagram story