Аннотация
в настоящей работе авторы изучают проблему как оценки качества выделения неявных сообществ на графе, полученном при импорте данных из социальных сетей и мессенджеров, так и методов анализа таких сетей на предмет выявления информационного воздействия на их акторов. Рассматриваются два подхода к оценке корректности разбиения графа на сообщества. Первый способ оценки основан на методах теории информации и заключается в подсчете нормализованной взаимной информации (NMI) и асимметрично-нормализованной взаимной информации (ANRMI). В рамках второго подхода рассмотрены три метода оценки качества выделения неявных сообществ, основанные на анализе текстовых массивов сопоставленных сообществ. Определяются и сравниваются коэффициенты попарной ранговой корреляции для словарей разных текстовых массивов. Применяется анализ соответствий для исследования корпусов текстов сообществ. Третий метод анализа заключается в подсчете психолингвистических характеристик текстовых массивов неявных сообществ. На примерах реальных данных показана применимость методов исследования для оценки качества разбиений графа взаимодействующих объектов социальных сетей и мессенджеров на сообщества и анализа информационного воздействия в такой сети.
Литература
Fortunato S., Newman M. E. J. 20 Years of Network Community Detection. Nat. Phys. 2022;18:848–850.
Чеповский А. А. О неявных сообществах на графе взаимодействующих объектов. Успехи кибернетики. 2023;4:56-64. DOI: 10.51790/2712-9942-2023-4-1-08.
Чеповский А. А. Анализ графов взаимодействующих объектов. М.: Национальный открытый университет «ИНТУИТ»; 2022. 270 с.
Fortunato S. Community Detection in Graphs. Physics Reports. 2010;486:75-174.
Danon L., Díaz-Guilera A., Duch J., Arenas A. Comparing Community Structure Identification. J. Stat. Mech. 2005;P09008.
Lancichinetti A., Fortunato S., Radicchi F. Benchmark Graphs for Testing Community Detection Algorithms. Physical Review. 2008;E78:046110. 6 p.
Newman M. E. J., Cantwell G. T., Young J.-G. Improved Mutual Information Measure for Clustering, Classification, and Community Detection. Physical Review E. 2020;101:042304. DOI: 10.1103/PhysRevE.101.042304.
Jérôme A., Kirkley A. Asymmetrically Normalized Mutual Information: Unbiased Measure for Comparing Clusterings with Different Numbers of Clusters. Physical Review E. 2020;101:042301.
Jerdee M., Kirkley A., Newman M. E. J. Normalized Mutual Information is a Biased Measure for Classification and Community Detection. arXiv:2307.01282. DOI: 10.48550/arXiv.2307.01282.
Аванесян Н. Л., Зенькова В. В., Чеповский А. А., Чеповский А. М. Анализ текстов сообществ социальных сетей. Успехи кибернетики. 2023;4:33-39. DOI: 10.51790/2712-9942-2023-4-2-05.
Фокина А. И., Чеповский А. А., Чеповский А. М. Использование платформы TXM корпусного анализа для анализа текстов сообществ социальных сетей. Вестник НГУ. Серия: Информационные технологии. 2023;21:29–38. DOI: 10.25205/1818-7900-2023-21-2-29-38.
Чеповский А. А. Об особенностях построения и анализа графов взаимодействующих объектов в сети Telegram-каналов. Вопросы кибербезопасности. 2023;1:75-81. DOI: 10.21681/2311-3456-20231-75-81.
Мамаев И. Д., Митрофанова О. А. Лингвистические параметры для идентификации скрытых сетевых сообществ. Terra Linguistica. 2024;15:102–115. DOI: 10.18721/JHSS.15108.
Мамаев И. Д. Лингвистические профили скрытых сообществ: морфосинтаксический аспект. Филологические науки. Вопросы теории и практики. 2024;17:1155-1162. DOI: 10.30853/phil20240168.
Соловьев Ф. Н. Автоматическая обработка текстов на основе платформы TXM с учетом анализа структурных единиц текста. Вестник НГУ. Серия: Информационные технологии. 2020;18:74–82. DOI: 10.25205/1818-7900-2020-18-1-74-82.
Blondel V. D., Guillaume J.-L., Lambiotte R., Lefebvre E. Fast Unfolding of Communities in Large Networks. Journal of Statistical Mechanics: Theory and Experiment. 2008;10:P10008.
Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.: Мир; 1989. 540 с.
Деза Е. И., Деза М. М. Энциклопедический словарь расстояний. М.: Наука; 2008. 444 с.
Benzécri J.-P., Bellier L. L’analyse des données. V. 2: L’analyse des Correspondances. Paris: Dunod; 1976. 616 p.
Heiden S. The TXM Platform: Building Open-Source Textual Analysis Software Compatible with the TEI Encoding Scheme. Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation. Sendai, Japan. 2010:389–398.