Удобный доступ, подготовка, объединение и обработка любых данных из любых источников
Интеграция данных Hitachi Vantara обеспечивает эффективную подготовку данных, включая извлечение, преобразование и загрузку (ETL - Extract-Transform-Load). Этот процесс необходим для создания отчетности, панелей мониторинга и аналитики.
Графические средства позволяют минимизировать процесс подготовки ETL трансформаций
- графические средства подготовки процедур извлечения-преобразования-загрузки данных (extract-transform-load);
- богатая библиотека встроенных компонентов для доступа и преобразования данных из различных источников;
- выполнение динамических трансформаций с использованием переменных и правил, изменяющих поведение процедур во время их работы;
- встроенный отладчик для тестирования и настройки исполнения процедур трансформаций данных.
Быстрая разработка и достижение исключительной производительности при работе с большим объемом данных
- доступ к ресурсам Hadoop, NoSQL (Cassandra, MongoDB, HBase и пр.) и аналитических баз данных (Greenplum, Terrdata, Vertica, Netezza, Infobright, MonetDB и пр.) через специализированные интерфейсы;
- визуальный дизайнер для разработки процедур MapReduce;
- мощный многопоточный механизм интеграции данных для быстрого исполнения;
- поддержка кластерной архитектуры с распределенным выполнением процедур на различных узлах;
- уникальные встроенные механизмы поддержки Hadoop;
- поддержка различных реализаций Hadoop, в том числе Cloudera, Hortonworks, MapR, Intel.
Простое управление процедурами трансформаций
- управление полномочиями пользователей на уровне ролей и учетных записей;
- возобновление процедур с последнего удачно завершившегося шага или откат шагов при неудачном выполнении;
- интеграция с LDAP и Active Directory;
- управление временем исполнения процедур трансформации;
- мониторинг и анализ исполнения процедур трансформации.
Базовые возможности для профилирования данных и оценки качества данных
- идентификация данных, которые не соответствуют бизнес правилам и стандартам;
- проверка, очистка данных и удаление дубликатов;
- управление качеством данных с использованием партнерских решений (Human Inference, Melissa Data).
Демонстрация возможностей Pentaho Data Integration 5.0 EE