КЛАСТЕРИЗАЦIЯ: МАРКОВСЬКИЙ АЛГОРИТМ

  • Knignitska T. V. Чернівецький національний університет імені Юрія Федьковича
  • Malyk I. V. Чернiвецький нацiональний унiверситет iменi Юрiя Федьковича
  • Gorbatenko M. Yu. Чернівецький національний університет імені Юрія Федьковича
Ключові слова: стохастичнi матрицi, кластеризацiя часових рядiв, неструктурованi данi

Анотація

У данiй роботi розглянуто проблему кластеризацiї на графах на основi власних значень стохастичної матрицi графа. Доведено, що власнi значення стохастичної матрицi для
великих графiв (N > 100) подiляються на три групи, одна iз яких є визначальною для числа кластерiв у графi. Використовуючи теорiю випадкових матриць, вдалося показати, що
асимптотичний розподiл пiдгрупи дiйсних частин власних значень стохастичної матрицi
графу описується напiвколовим розподiлом Вiгнера, причому параметр даного розподiлу є O (1). Використання стохастичних матриць дало змогу точно локалiзувати власнi
значення, що вiдповiдають за кiлькiсть кластерiв, чого не вдавалося зробити для матриць
сумiжностi. Основнi припущення моделi пов’язанi з властивостями дискретних ланцюгiв
Маркова, що дозволяє розширити область застосування отриманих результатiв на бiльш
ширший клас об’єктiв. Теоретичнi результати перевiренi на кластеризацiї часових рядiв,
що описують вартостi N = 470 акцiй S&P500 в перiод 2013 –2018 рр. Результати кластеризацiї даних часових рядiв показали наявнiсть 5 чiтко виражених груп, якi узгоджується
iз використаними даними.

Завантаження

Дані завантаження ще не доступні.

Посилання

REFERENCES

Bagherikaram G., Motahari A., Khandani A. The Secrecy Capacity Region of the Gaussian MIMO

Broadcast Channel. Information Theory 2013, 59, 2673-2682.

https://doi.org/10.1109/TIT.2012.2236972

Bai Z., Fang Z., Liang Y. Spectral Theory of Large Dimensional Random Matrices and Its Applications

to Wireless Communications and Finance Statistics : Random Matrix Theory and Its Applications,

World Scientific Publishing Company, 2014.

Bender E.A., Williamson S.G. Lists, Decisions and Graphs - With an Introduction to Probability.

University of California at San Diego, San Diego, 2010.

Biely С., Thurner S. Random matrix ensembles of time-lagged correlation matrices: Derivation of eigenvalue spectra and analysis of financial time-series. Quantitative Finance 2008. 8, 705-722.

https://doi.org/10.1080/14697680701691477

Bolch G., Greiner S., Meer H., Trivedi K. Queueing Networks and Markov Chains. John Wiley, 2nd

edition 2006, 40 (5), 567-568.

https://doi.org/10.1097/00004836-200608000-00001

Crisan D., Del Moral P., Lyons T. Discrete filtering using branching and interacting particle systems.

Markov Processes and Related Fields 1999, 5 (4), 293-318.

Dongen S. Graph Clustering by Flow Simulation. PhD thesis, University of Utrecht, 2000.

Girvan M., Newman M. Community structure in social and biological networks. Proc. Natl Acad. Sci. USA 2002, 99 (12), 7821-7826.

https://doi.org/10.1073/pnas.122653799

Qiu R., Antonik P. Smart Grid using Big Data Analytics. A Random Matrix Theory Approach. Wiley

Online Library, 2017.

Knignitska T.V. Estimate of time series similarity based on models. Problems of Control and Informatics 2019, 51 (4), 94-104.

Marchenko V.A., Pastur L.A. Distribution of eigenvalues for some sets of random matrices. Mat. Sb. N.S. 1967, 72(114) (4), 507--536.

Опубліковано
2020-01-02
Як цитувати
[1]
V., K., V., M. і Yu., G. 2020. КЛАСТЕРИЗАЦIЯ: МАРКОВСЬКИЙ АЛГОРИТМ. Буковинський математичний журнал. 7, 2 (Січ 2020), 59-75. DOI:https://doi.org/10.31861/bmj2019.02.059.