Описание метаданных многомерных информационных систем с использованием кластерного метода (часть 3)

Объединение кластеров

При отсутствии разбиения множества измерений на слои МДС может быть представлено как объединение кластеров, соответствующих диаграмме сочетаемости измерений аналитического пространства. В случае разбиения множества измерений на слои МДС для каждого слоя должно быть построено как объединение кластеров сочетаний слоя, а МДС значений измерений многомерного куба получено как результат декартова произведения МДС для слоев.

Возможна ситуация, когда в наблюдаемом явлении можно выделить сильно различающиеся смысловые компоненты. В этом случае можно по отдельности сформировать подмножества сочетаний, соответствующих разным смысловым компонентам. Для этого надо в каждой компоненте провести свой анализ сочетаемости значений измерений и в соответствии с ним сформировать кластеры сочетаемости. Результирующее множество МДС может быть получено с использованием операций теории множеств, операндами в которых выступают подмножества сочетаний для компонент.

Можно выделить два случая, когда такой подход может быть успешно использован. Первый – когда при анализе разных смысловых компонент возникают разные разбиения измерений на слои, второй – когда имеется простой способ построения подмножества, описывающего МДС с избытком, и эффективный способ описания сочетаний, которые должны быть исключены из этого подмножества, чтобы сократить его до МДС. Рассмотрим эти случаи более подробно.

Смысловые компоненты

В первом случае разбиению наблюдаемого явления на l смысловых компонент соответствует объединение подмножеств сочетаний значений измерений:

МДС(H) = Q1 ∪ Q2 ∪ … ∪ Ql.

В силу семантических различий смысловых компонент множество измерений в разных подмножествах может быть по-разному разбито на слои:

D(H) = Li1 ∪ Li2 ∪ … ∪ Limi,

где i = 1…l – номер разбиения; mi – число слоев в i–м разбиении. Каждое подмножество Qi формируется в соответствии со своим разбиением множества измерений на слои.

Во втором случае множество допустимых сочетаний представляется в виде разности подмножеств:

МДС(H) = R / Q,

где R – множество сочетаний, описанное с избытком (сокращаемое подмножество); Q – множество исключаемых сочетаний.

Сокращаемое подмножество может быть сформировано с использованием следующего правила: в него включаются сочетания, полученные декартовым произведением всех значений измерений, дополненные набором сочетаний, содержащих значение «не используется» для некоторых измерений, с исключением тех сочетаний, которые могут быть получены заменой специального значения «не используется» на допустимое значение. Такой подход может быть использован в случае, если множество МДС(H) имеет сложную структуру и известен простой алгоритм формирования подмножества Q.

Метод построения множества допустимых сочетаний

Можно предложить алгоритм описания МДС, базирующийся на кластерном подходе и состоящий из следующих шагов:

  1. Выделить в наблюдаемом явлении n смысловых компонент (n ≥ 1) и сопоставить этим компонентам подмножества сочетаний Qi, i = 1, …, n.
  2. Построить формулу для МДС(H) с использованием Qi и операций теории множеств в соответствии с выявленными взаимосвязями между компонентами наблюдаемого явления.
  3. Сформировать подмножества сочетаний для каждого Qi:
    • произвести анализ попарных связей между измерениями, соответствующими семантике Qi, и сформировать группы значений измерений, выражающие эти связи;
    • выделить во множестве измерений слои измерений и построить диаграммы связности измерений для каждого слоя;
    • произвести разбиение групп значений измерений, заданных в слоях, в соответствии со связями, имеющимися в диаграммах связности слоев;
    • произвести формирование кластеров сочетаний и объединение этих кластеров в подмножества сочетаний для слоев;
    • произвести формирование подмножества сочетаний Qi декартовым произведением подмножеств сочетаний для слоев измерений.
  4. Вычислить МДС(H) с использованием формулы, построенной при выполнении шага 2.

Заключение

В случае разработки большой многоаспектной многомерной информационной системы использование кластерного подхода для описания множества допустимых сочетаний значений измерений позволяет обеспечить компактность при задании метаданных и выразить семантику наблюдаемого явления. В основе предлагаемого подхода лежит выявление связей между измерениями, отражающими свойства наблюдаемого явления, и формирование групп значений измерений, элементы которых объединены схожим поведением по отношению к этим связям.

Библиографический список

  1. Thomsen E. OLAP Solution: Building Multidimensional Information System. NY, Willey Computer Publishing, 2002. 688 p.
  2. Висков А.В., Фомин М.Б. Моделирование аналитических измерений в многомерных базах данных // Вестник ИрГТУ. 2012. № 4 (63). С. 15–19.
  3. Висков А.В., Фомин М.Б. Методы описания допустимых сочетаний реквизитов-признаков при использовании многомерных моделей в инфокоммуникационных системах // T-Comm.: Телекоммуникации и Транспорт. 2012. № 7. С. 45–47.

References

  1. Thomsen E. OLAP Solution: Building Multidimensional Information System. NY, Willey Computer Publishing, 2002, 688 p.
  2. Viskov A.V., Fomin M.B. Modelirovanie analiticheskikh izmerenii v mnogomernykh bazakh dannykh [Modeling of analytical dimensions in multidimensional databases]. Vestnik IrGTU [Proceedings of Irkutsk State Technical University]. 2012, no. 4 (63), pp. 15–19. (In Russian)
  3. Viskov A.V., Fomin M.B. Metody opisaniya dopustimykh sochetanii rekvizitov-priznakov priispol’zovanii mnogomernykh modelei v infokommunikatsionnykh sistemakh [Methods of a description of the permissible combination of detail-attributes when using multidimensional models in infocommunication systems]. T-Comm.: Telekommunikatsiii Transport [T-Comm: Telecommunications and Transport]. 2012, no. 7, pp. 45–47. (in Russian)

Критерии авторства и конфликт интересов

Критерии авторства
Фомин М.Б. провел исследование, оформил научные результаты и несет ответственность за плагиат.

Authorship criteria
Fomin M.B. has conducted the research, formalized the scientific results and bears the responsibility for plagiarism.

Конфликт интересов
Автор заявляет об отсутствии конфликта интересов.

Conflict of interests
The author declares that there is no conflict of interests regarding the publication of this article.

Статья поступила 22.06.2017 г.
The article was received 22 June 2017

Оцените статью
Сессия под ключ дистанционно
Добавить комментарий

Заявка на расчет