DataCleaner е всичко в едно софтуер за анализ на данни и почистване на база данни

click fraud protection

Инструментите за анализ на база данни помагат на DBA при установяване на несъответствията и нелогичните връзки между наборите от данни, така че да могат да бъдат премахнати от базата данни. Възможностите на инструментите за анализ на база данни обаче зависят от платформата, на която е изградена базата данни. Например, малка мащабна релационна база данни, създадена на MS Access, се нуждае от много различни помощни програми за анализ на DB от тази, създадена с помощта на MySQL. Ако търсите инструмент за анализ на база данни в цял, който може да ви помогне да идентифицирате и изчистите излишни записи от базата данни, шансовете да се натъкнете на платена програма са големи. Днес открихме програма с отворен код, базирана на Java, наречена DataCleaner който прилага различни анализи и почистване на бази данни, включително концепции Качество на данните, Главно управление на данните, Профилиране на данни, и Мониторинг на качеството на данните, за да премахнете всички излишни набори от данни от определеното хранилище. Приложението поддържа широк спектър от платформи за бази данни и файлове с данни, включително CSV, MS Excel (XLS и XLSX), MS Достъп, SAS библиотека, база данни на DBase, файл с фиксирана ширина, XML, база данни OpenOffice, MonoDB, MySQL, Oracle и MS SQL Server.

instagram viewer

Освен това той предлага примерни низове за връзка и други опции, които ви помагат бързо да създавате връзки с вашата база данни. След като базата данни е свързана или се извличат набори от данни от посочена БД, тя ви позволява да видите завършена Metadata информация за DB таблици, което ви позволява лесно да променяте необходимите полета и редове. Освен това тя включва обширна Филтри функция, която може да ви помогне да видите само необходимата част от базата данни. Можете да приложите множество условни филтри в базата данни, включително Равни, Максимални редове, Проверка на нула, Диапазон от числа, Една дума, Съответствие на шаблон на низ, и Диапазон на стойността на струните. Имате и свободата да настройвате с избрани филтри, за да отговаряте на изискванията за извличане на данни.

DataCleaner се предлага с трансформатор функция, която ви позволява предварително да обработите данните за извличане, комбиниране и генериране на отделни стойности. Вграденото анализатор осигурява изчерпателна Качество на данните и Профилиране на данни операции за подпомагане на анализа на съдържанието на избраната база данни. Тя включва редица функции за анализ като Булов анализатор, Разпределение на набор от знаци, Анализатор на пролука на данни, Съответстващ анализатор, Търсач на шаблони, Анализ на струни, Разпределение през деня и стойност и още.

Основният интерфейс показва поддържаните типове хранилища на данни. Всичко, от което се нуждаете, е да изберете типа база данни и да конфигурирате подробностите за връзката. Например, ако искате да почистите и анализирате MySQL база данни, въведете име на база данни, име на клас на диск, низ за връзка и потребителско име и парола. Можете да отворите файла на базата данни на Excel или Access, като просто посочите пълния път. След като се установи връзка, тя добавя базата данни към списъка. Сега проверете базата данни, която искате да анализирате, и щракнете върху Анализирам.

анализ на главния прозорец

В лявата странична лента се съхраняват бази от избрани хранилища, което ви позволява да изследвате наборите от данни. Трябва да изберете полетата, за да извършите анализ. Просто щракнете двукратно върху полетата, които искате да включите, и той ще ги изброи източник раздел. Можете да проверите наборите от данни и техния тип и да премахнете ненужните полета.

източник за почистване на данни

при Metadata в раздела, ще намерите цялата информация за метаданни, включително таблица, колона, семейство тип (въз основа на съхранени данни), тип, естествен тип, размер, състояние за нулиране, състояние на индекса.

метаданни

Най- Филтри Разделът ви позволява да включите всички гореспоменати филтри, за да извличате конкретна информация от колони. Тя ви позволява да добавяте няколко типа филтри към списъка, за да можете лесно да филтрирате необходимите набори от данни. След като добавите филтър, свийте прозореца на филтъра и щракнете върху Добавете филтър за да изберете типа на филтъра, който искате да използвате.

филтри

анализатор е може би най-полезната функция на приложението. Както споменахме по-горе, той ви позволява да изберете много видове анализ. Не само ви дава подробен отчет за анализа, но също така ви позволява да създавате графики за анализ. Просто изберете необходимия тип анализ и попълнете необходимата информация. След като сте готови, щракнете Изпълнете анализ.

стартирайте анализ

След кликване той ще започне да създава отчет за анализа. Най- прогрес раздела информация показва всички процеси, които те изпълняват, докато генерира анализа.

нов 3

Можете да щракнете двукратно върху диаграма бутон, присъстващ в първото поле, за да начертае данните на графиката. DataCleaner ви позволява да запазите задачите. Той създава XML файл, който съдържа отчета за анализа. Файлове със задачи за анализ могат да се видят, като отворите XML файла от Файл -> Отворен анализ на работни места.

нов

DataCleaner предлага опция за запис на данни по време на различни етапи на анализ на данни. Например. функцията Филтри ви позволява да запишете изчистени данни в отделен файл. Можете да експортирате филтрираните данни в CSV файл, да създадете електронна таблица в Excel, да направите поетапна таблица или да вмъкнете данните директно в таблица.

CSV файл

DataCleaner е масивна програма за анализ и почистване на данни, която поддържа Windows, Linux и Mac OS X. Опитахме да покрием най-забележимите функции на приложението и може би сме пропуснали няколко полезни инструмента и опции. Можете да намерите подробни ръководства за помощ и ръководства за употреба от страницата на продукта. Трябва да се отбележи, че той изисква най-новата JRE (Java Runtime Environment), за да работи.

Изтеглете DataCleaner

watch instagram story