Создание подсистемы сбора и анализа статистической информации системы доступа к электронным каталогам библиотек сферы образования и науки в рамках единого интернет-ресурса (ИС ЭКБСОН) на базе Pentaho BI

Разработана подсистема сбора и анализа статистической информации ИС ЭКБСОН (www.vlibrary.ru), которая обеспечивает сбор и анализ статистических данных, в том числе данных по активностям поставщиков библиографической информации, пользователей, о функционировании ИС ЭКБСОН в целом и ее подсистем на техническом уровне.

Заказчик
Государственная публичная научно-техническая библиотека России (ГПНТБ России)

Основана в 1958 году на базе Государственной научной библиотеки Минвуза СССР. Является центральным органом НТИ, государственным депозитарием отечественной и зарубежной научно-технической литературы, автоматизированным информационным центром, координационным центром по методологии комплектования, МБА, книгообмену среди научно-технических библиотек страны, головной организацией по ведению и развитию Автоматизированной системы Российского Сводного каталога по научно-технической литературе и Автоматизированной системы Интегрированного Сводного Каталога научно-технической информации.

Решение

Целью создания системы доступа к электронным каталогам библиотек сферы образования и науки в рамках единого интернет-ресурса (ИС ЭКБСОН) является обеспечение широкому кругу пользователей доступа к электронным каталогам библиотечной системы образования и науки в рамках единого интернет-ресурса на основе унифицированного каталога библиотечных ресурсов.  В состав каталога вошли библиотеки университетов и других учебных заведений, а также библиотеки научных организаций.

Для оценки эффективности использования ИС ЭКБСОН и принятия обоснованных решений по ее дальнейшему развитию была разработана подсистема сбора и анализа статистической информации, которая включает в себя следующие ключевые компоненты:

  • Хранилище статистической информации на PostgreSQL;
  • Компоненты сбора статистических данных, созданные с использованием  JMS JBoss AS;
  • Модуль анализа данных с свозможностью построения регламентированных и нерегламентированных отчетов на базе Pentaho BI.

В рамках подсистемы собирается и анализируется, в том числе, следующая информация:

  • Активность пользователей на основе их учётных записей по следующим основным критериям:
    • посещаемость (длительность сессии, число сессий и т.д.);
    • генерируемый трафик;
    • источники/переходы, навигация внутри Системы;
    • поисковые запросы – количество, типы, и т.д.;
    • тематический разрез запрашиваемых библиографических данных;
    • использование рубрикаторов, специальных лингвистических компонент Системы;
    • доступ к ресурсам;
    • доступ к полным текстам после нахождения библиографической информации;
    • география;
    • операционные системы и браузеры.
  • Активность поставщиков библиографических записей на основе их учётных записей по следующим основным критериям:
    • посещаемость (длительность сессии, число сессий и т.д.);
    • генерируемый информационный ресурс, число загружаемых записей, активность и временные интервалы загрузок и актуализации, число ссылок на полные тексты и т.д.;
    • данные об электронных образовательных ресурсах и коллекциях;
    • тематическое распределение коллекций;
    • использование рубрикаторов и классификаторов;
    • использование специальных данных о книгообеспеченности;
    • источники/переходы, навигация внутри Системы;
    • поисковые запросы – количество, типы, и т.д.;
    • доступ к ресурсам, число выгруженных записей, блоков и т.д.
  • Информация о техническом функционировании Системы, включая сбор информации о нагрузках, надежности функционирования, потоках внутрисистемного обмена.