Аннотация
в настоящей работе авторы приводят описание методики статистического анализа текстов Telegram-каналов, основанной на сравнении методами корреляционного анализа автоматически сформированных частотных словарей. Рассматриваются коэффициенты попарной ранговой корреляции для сравнения частотных характеристик текстов различных неявных сообществ на естественном языке. Метод предлагается для оценки качества выделения неявных сообществ на графе, полученном при импорте данных из сети каналов мессенджера Telegram.
Литература
Чеповский А. А. О неявных сообществах на графе взаимодействующих объектов. Успехи кибернетики. 2023;4(1):56–64. DOI: 10.51790/2712-9942-2023-4-1-08.
Fortunato S., Newman M. E. J. 20 Years of Network Community Detection. Nat. Phys. 2022;18:848–850.
Kanavos A., Voutos Y., Grivokostopoulou F., Mylonas P. Evaluating Methods for Efficient Community Detection in Social Networks. Information. 2022;13(5):209.
Базенков Н. И., Губанов Д. А. Обзор информационных систем анализа социальных сетей. Управление большими системами: сб. трудов. 2013:357–394.
Батура Т. В. Методы анализа компьютерных социальных сетей. Вестник НГУ. Серия: Информационные технологии. 2012;10(4):13–28.
Батура Т. В., Копылова Н. С., Мурзин Ф. А., Проскуряков А. В. Методы анализа данных из социальных сетей. Вестник НГУ. Серия: Информационные технологии. 2013;11(3):5–21.
Губанов Д. А., Новиков Д. А., Чхартишвили А. Г. Социальные сети: модели информационного влияния, управления и противоборства. М.: Физматлит: МЦНМО; 2010. 228 с.
Евин И. А., Хабибуллин Т. Ф. Социальные сети. Компьютерные исследования и моделирование. 2012;4(2):423–430. DOI: 10.20537/2076-7633-2012-4-2-423-430.
Newman M. E. J. Networks: An Introduction. Oxford University Press; 2010. 784 p.
Newman M. E. J. Modularity and Community Structure in Networks. Proc. Natl. Acad. Sci. USA. 2006;103(23):8577–8582.
Blondel V. D., Guillaume J.-L., Lambiotte R., Lefebvre E. Fast Unfolding of Communities in Large Networks. Journal of Statistical Mechanics: Theory and Experiment. 2008;10:P10008.
Rosvall M., Esquivel A., Lancichinetti A., West J., Lambiotte R. Memory in Network Flows and its Effects on Spreading Dynamics and Community. Nature Communications. 2014;5:4630.
Попов В. А., Чеповский А. А. Выделение неявных сообществ на графе взаимодействия Telegram-каналов с помощью «метода Галактик». Труды ИСА РАН. 2022;72(4):39–50. DOI: 10.14357/20790279220405.
Fortunato S. Community Detection in Graphs. Physics Reports. 2010;486(3):75–174.
Lancichinetti A., Fortunato S., Radicchi F. Benchmark Graphs for Testing Community Detection Algorithms. Physical Review E. 2008;78:046110.
Danon L., Dı́az-Guilera A., Duch J. & Arenas A. Comparing Community Structure Identification. J. Stat. Mech. 2005;P09008.
Чеповский А. А. Об особенностях построения и анализа графов взаимодействующих объектов в сети Telegram-каналов. Вопросы кибербезопасности. 2023;1:75–81. DOI: 10.21681/2311-3456-2023-1-75-81.
Аванесян Н. Л., Соловьев Ф. Н., Чеповский А. А. Характеристики текстов сообществ социальных сетей. Вестник НГУ. Серия: Информационные технологии. 2021;19(1):5–14. DOI: 10.25205/1818-7900-2021-19-1-5-14.
Попов В. А., Чеповский А. А. Модели импорта данных из мессенджера Telegram. Вестник НГУ. Серия: Информационные технологии. 2022;20(2):60–71. DOI: 10.25205/1818-7900-2022-20-2-60-71.
Чеповский А. М. Информационные модели в задачах обработки текстов на естественных языках. М.: Национальный открытый университет «ИНТУИТ»; 2015. 228 c.
Соловьев Ф. Н. Автоматическая обработка текстов на основе платформы TXM с учетом анализа структурных единиц текста. Вестник НГУ. Серия: Информационные технологии. 2020;18(1):74–82. DOI: 10.25205/1818-7900-2020-18-1-74-82.
Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.: Мир; 1989. 540 с.
Деза Е. И., Деза М. М. Энциклопедический словарь расстояний. М.: Наука; 2008. 444 с.