Hitachi Vantara Data Integration

Удобный доступ, подготовка, объединение и обработка любых данных из любых источников

Интеграция данных Hitachi Vantara обеспечивает эффективную подготовку данных, включая извлечение, преобразование и загрузку (ETL - Extract-Transform-Load).  Этот процесс необходим для создания отчетности, панелей мониторинга и аналитики.

Графические средства позволяют минимизировать процесс подготовки ETL трансформаций

  • графические средства подготовки процедур извлечения-преобразования-загрузки данных (extract-transform-load);
  • богатая библиотека встроенных компонентов для доступа и преобразования данных из различных источников;
  • выполнение динамических трансформаций с использованием переменных и правил, изменяющих поведение процедур во время их работы;
  • встроенный отладчик для тестирования и настройки исполнения процедур трансформаций данных.

Быстрая разработка и достижение исключительной производительности при работе с большим объемом данных

  • доступ к ресурсам Hadoop, NoSQL (Cassandra, MongoDB, HBase и пр.) и аналитических баз данных (Greenplum, Terrdata, Vertica, Netezza, Infobright, MonetDB и пр.) через специализированные интерфейсы;
  • визуальный дизайнер для разработки процедур MapReduce;
  • мощный многопоточный механизм интеграции данных для быстрого исполнения;
  • поддержка кластерной архитектуры с распределенным выполнением процедур на различных узлах;
  • уникальные встроенные механизмы поддержки Hadoop;
  • поддержка различных реализаций Hadoop, в том числе Cloudera, Hortonworks, MapR,  Intel.

Простое управление процедурами трансформаций

  • управление полномочиями пользователей на уровне ролей и учетных записей;
  • возобновление процедур с последнего удачно завершившегося шага или откат шагов при неудачном выполнении;
  • интеграция с LDAP и Active Directory;
  • управление временем исполнения процедур трансформации;
  • мониторинг и анализ исполнения процедур трансформации.

Базовые возможности для профилирования данных и оценки качества данных

  • идентификация данных, которые не соответствуют бизнес правилам и стандартам;
  • проверка, очистка данных и удаление дубликатов;
  • управление качеством данных с использованием партнерских решений (Human Inference, Melissa Data).

 

Демонстрация возможностей Pentaho Data Integration 5.0 EE