Анализ и моделирование процессов в сложных социальных сетевых структурах на основе уравнения Фоккера-Планка
Проведено исследование стационарных и динамических распределений новостей по числу комментариев и показано, что наблюдаемый на практике степенной закон зависимости стационарной плотности вероятности распределения новостей по числу комментариев (состояниям системы x) может быть получен из решения стационарного уравнения Фоккера-Планка, если при его выводе сделать ряд допущений: коэффициент p(x), отвечающий в уравнении Фоккера-Планка за целенаправленное изменение состояния («снос») системы x (x - текущее число комментариев к новости) линейно зависит от состояния x, а коэффициент D(x), отвечающий за случайное изменение («диффузия»), зависит от x квадратично. Решение нестационарного дифференциального уравнения Фоккера-Планка при сделанных допущениях позволило получить уравнение для плотности вероятности переходов между состояниями системы в единицу времени, которая хорошо согласуется с наблюдаемыми данными с учетом влияния времени задержки между появлением комментария к новости и комментария к данному комментарию. Вклад авторов: все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.
Analysis and modeling of processes in complex social network structures based on the Fokker-Planck equation.pdf Описание поведения пользователей социальных сетей и информационных ресурсов является одним из важнейших направлений математической социологии. С практической точки зрения создание моделей, описывающих динамику проявления пользовательских мнений и предпочтений, позволяет разрабатывать системы автоматизированного мониторинга общественного настроения и тенденций его изменения. Преимуществом таких систем по сравнению с традиционными методами изучения общественного мнения является их технологичность в реализации. Следует отметить, что динамику изменения мнений и настроений пользователей сети Интернет можно в значительной степени отнести к стохастическим процессам. Присутствие человеческого фактора (множество людей с различными мнениями, предпочтениями и характером поведения), с одной стороны, создает случайность изменений (в силу большого разнообразия поведенческих моделей пользователей), а с другой - вносит в динамику изменений элементы целенаправленности. В статье [1] рассмотрена модель, описывающая пространственное и временное распространение информации в социальных сетях на основе стохастического дифференциального уравнения в частных производных. В работе была создана и исследована неавтономная диффузионная логистическая модель с граничными условиями Дирихле, которая показала, что на диффузию данных в социальных сетях сильно влияют коэффициент диффузии и внутренняя скорость роста (распространение информации или слухи можно рассматривать как своего рода вирусы, не обладающие физической формой). В этой связи наиболее перспективными, на наш взгляд, для анализа динамики изменения общественного настроения являются модели, которые можно создать на основе стохастических дифференциальных уравнений, например уравнения Фоккера-Планка, которое учитывает как упорядоченные («снос»), так и случайные изменения («диффузия»). Уравнение Фоккера-Планка широко применяется для анализа и моделирования поведения временных рядов при описании процессов в сложных системах [2-5]. Следует отметить, что помимо уравнения Фоккера-Планка для моделирования на основе дифференциальных уравнений используются и другие подходы, например уравнения Лиувилля [5, 6], уравнения диффузии [4, 7] и др. Помимо описания динамических процессов из уравнения Фоккера-Планка можно получить и стационарные решения, которые могут описывать состояние какой-либо системы в стационарном состоянии, когда, например, ее эволюция уже закончилась и изменения не происходят. 33 Математическое моделирование /Mathematical modeling Исследование процессов, происходящих в сложных системах с участием человеческого фактора, показывает, что очень часто для наблюдаемых характеристик параметров этих процессов выполняется степенной закон распределения р(х) ~ x ү (где ү - характеристическая степень) [8-13], но в то же время вопрос теоретического обоснования возможности его применения требует дальнейшего изучения. На наш взгляд, это обоснование очень важно. Выявление характера процессов, из которых возникает степенной закон, необходимо для более глубокого изучения поведения и анализа сложных социальных систем. В связи с этим мы считаем перспективным исследование возможности применения уравнения Фоккера-Планка для разработки моделей динамики социальных процессов. Результаты, полученные в работе: 1. Наблюдаемое на практике стационарное распределение новостей по числу комментариев к ним соответствует степенному закону: р(х) = [у - 1]x~Y, где р(х) - доля новостей в общем их числе, имеющая x комментариев, а ү - показатель степени. 2. Динамика изменения с течением времени числа комментариев к новости или блогу может иметь как «S'-образный вид, так и двухступенчатый, что может быть связанно с существенным различием в среднем времени появления комментариев второго уровня (интервал времени между появлением комментария первого уровня и комментария к данному комментарию), т.е. величиной средней задержки. 3. Наблюдаемый на практике степенной закон зависимости стационарной плотности вероятности распределения новостей по числу комментариев (состояниям x) может быть получен из решения стационарного уравнения Фоккера-Планка, если при его выводе сделать ряд допущений: в частности, предположить, что коэффициент p(x), отвечающий в уравнении Фоккера-Планка за целенаправленное изменение состояния системы x (x - текущее число комментариев к новости) линейно зависит от состояния х, а коэффициент D(x), отвечающий за случайное изменение, зависит от x квадратично. Все это позволяет предположить, что уравнение Фоккера-Планка может быть использовано для описания процессов в сложных сетевых структурах. 4. Решение нестационарного уравнения Фоккера-Планка при допущениях о линейной зависимости p(x) от состояния x и квадратичной зависимости D(x) от состояния x позволяет получить уравнение для плотности вероятности переходов между состояниями системы в единицу времени, которая хорошо согласуется с наблюдаемыми данными с учетом влияния времени задержки между появлением комментария первого уровня и комментария к данному комментарию. 5. Разработанные на основе уравнения Фоккера-Планка модели хорошо согласуются с наблюдаемыми данными, что позволяет создать алгоритмы мониторинга и прогнозирования эволюции общественного мнения пользователей новостных информационных ресурсов. В заключение отметим, что сложный характер динамики процессов в сложных социальных системах можно описывать не только на основе моделей, созданных на основе уравнения Фоккера-Планка. Например, в работах [14-17] представлены разработанные авторами модели описания стохастической динамики изменения состояний в сложных социальных системах, учитывающие процессы самоорганизации и наличие памяти (немарковские модели). 1. Сбор и обработка данных Для наших исследований были выбраны несколько новостных порталов и одно из сетевых сообществ социальной сети «ВКонтакте», посвященное обсуждению новостей информационного ресурса РИА «Новости» (https://vk.com/ria ). РИА «Новости» было выбрано, исходя из его узнаваемости и популярности в российском обществе, оно занимает первое место среди медиаресурсов (за март 2022 г.) по версии br-analytics (https://br-analytics.ru/mediatrends/media/?period=202203), входит в ТОП-3 самых цитируемых информационных агентств в СМИ и социальных медиа (за март 2022 г.), где занимает первое место (https://www.mlg.ru/ratings/media/federal/11110/#intemet). 34 Перова Ю.П., Лесько С.А., Жуков Д.О., Чечурин А.В. Анализ и моделирование процессов Сначала мы с помощью специального программного приложения (парсера) скачали интересующий нас новостной контент начиная с 1 января 2019 г. по апрель 2022 г. с ресурса «ВКонтакте», используя разработанный нами парсер и API сети (https://dev.vk.com/guide). Внутри социальной сети у каждого поста есть свой уникальный адрес (https://vk.com/ria?w=wall{owner_id}_{post_id}), где {owner_id} - уникальный идентификатор сообщества (в случае РИА «Новости» это «-15755094», а {post_id} - уникальный идентификатор поста (новости). Каждый пост (новость) имеет ряд основных параметров: уникальный идентификатор поста в социальной сети; текст поста; дата и время публикации; количество просмотров и комментариев пользователей. Комментарии, в свою очередь, имеют следующие параметры: уникальный идентификатор в сообществе социальной сети; уникальный идентификатор пользователя; текст комментария; дата и время появления; уровень иерархии комментария; связь по уровню комментирования с родительским комментарием (кто из пользователей комментировал кого из других пользователей при обсуждении новости). Поскольку комментарии могли оставлять чат-боты, спамеры и недобросовестные пользователи, которые пишут комментарии на профессиональной основе, необходимо было ввести правила отчистки данных. К недобросовестным были отнесены те, кто написал за год более 7 365 комментариев (в среднем более 20 за сутки) или писал с частотой более одного комментария в 5 минут. При анализе полученных данных необходимо было определить, какому закону распределения подчиняется наблюдаемая плотность распределения. Были рассмотрены три наиболее часто наблю- X2 _ даемых закона распределения: Гаусса р(х) = е 2ст2/аѴ2л, экспоненциальный р(х) = ае-ах и степенной р(х) = рх-ү. При обработке собранных данных с помощью линеаризации в соответствующих координатах обнаружено, что лучшая линеаризация наблюдается для степенного закона распределения (рис. 1), для остальных законов линеаризация была плохой. Прямая, проведенная на рис. 1, показывает, что линия тренда хорошо описывается выбранной нами линейной аппроксимацией у = -0,76 - 1,48z, где y = ln{p(x)}, z = ln{x}, ln{P} = -0,76, а коэффициент корреляции равен 0,95. Рис. 1. Линеаризация наблюдаемых данных для степенного распределения доли комментаторов от числа сделанных ими комментариев Fig. 1. Linearization of the observed data for the power distribution of the proportion of commentators from the number of comments they made Для подтверждения вывода о линейной аппроксимации можно исследовать поведение остатков и проверить гипотезу о том, что они нормально распределены со средним значением, равным нулю, и имеют однородную дисперсию. Вычисление остатков можно провести на основе реально наблюдаемых значений натурального логарифма доли комментаторов, давших данное число комментариев, 35 Математическое моделирование /Mathematical modeling и полученного нами уравнения. Рассчитанная величина математического ожидания для распределения остатков равна 0,25, а дисперсия 0,13. Проверка гипотезы о наклоне (двухвыборочный ^-тест для дисперсий) показывает, что дисперсия остатков, рассчитанная относительно линии тренда, существенно меньше, чем дисперсия отклонения точек линейной регрессии от среднего значения величины наблюдаемых данных (Lyjn = Е{р(1пхг)}/п): Она равна 2,11 (0,13
Ключевые слова
социальные сети,
моделирование социальных процессов,
уравнение Фоккера-Планка,
мониторинг,
управление,
нелинейная динамика,
степенной закон распределенияАвторы
Перова Юлия Петровна | Российский технологический университет (МИРЭА) | старший преподаватель кафедры телекоммуникаций Института радиоэлектроники и информатики | jul-np@yandex.ru |
Лесько Сергей Александрович | Российский технологический университет (МИРЭА) | кандидат технических наук, доцент кафедры моделирования систем Института кибербезопасности и цифровых технологий | lesko@testor.ru |
Жуков Дмитрий Олегович | Российский технологический университет (МИРЭА) | профессор, доктор технических наук, профессор кафедры информационного противоборства | zhukovdm@yandex.ru |
Чечурин Алексей Викторович | Российский технологический университет (МИРЭА) | кандидат технических наук, доцент кафедры моделирования систем Института кибербезопасности и цифровых технологий | chechurin@testor.ru |
Всего: 4
Ссылки
Du B., Lian X., Cheng X. Partial differential equation modeling with Dirichlet boundary conditions on social networks // Bounda ry Value Problems. V. 2018, is. 1. Art. 50.
Lux T. Inference for systems of stochastic differential equations from discretely sampled data: a numerical maximum likelihood approach // Annals of Finance. 2012. V. 9 (2), P. 217-248.
Hum A., Jeisman J., Lindsay K. Teaching an old dog new tricks: improved estimation of the parameters of stochastic differential equations by numerical solution of the Fokker-Planck equation // Financial Econometrics Handbook / G. Gregoriou, R. Pascalau (eds.). London : Palgrave, 2010
Elliott R.J., Siu T.K., Chan L.A PDE approach for risk measures for derivatives with regime switching // Annals of Finance. 2007. V. 4(1). P. 55-74.
Орлов Ю.Н., Федоров С.Л. Генерация нестационарных траекторий временного ряда на основе уравнения Фоккера- Планка // Труды МФТИ. 2016. № 8 (2). С. 126-133.
Chen Y., Cosimano T.F., Himonas A.A., Kelly P. An Analytic Approach for Stochastic Differential Utility for Endowment and Production Economies // Computational Economics. 2013. V. 44 (4). P. 397-443.
Savku E., Weber G.-W. Stochastic differential games for optimal investment problems in a Markov regime-switching jumpdiffusion market // Annals of Operations Research. 2022. V. 312. Р. 1171-1196. doi: 10.1007/s10479-020-03768-5 39
Dorogovtsev S.N., Mendes J.F.F. Evolution of networks // Adv. Phys. 2002. V. 51. P. 1079-1187.
Newman M.E.J. The structure and function of complex networks // SIAM Rev. 2003. V. 45. P. 167-256.
Dorogovtsev S.N., Mendes J.F.F., Samukhin A.N. Generic scale of the scale-free growing networks // Phys. Rev. E. 2001. V. 63. Art. 062101.
Golder S.A., Wilkinson D.M., Huberman B.A. Rhythms of social interaction: messaging within a massive online network // Communities and Technologies : Proc. of the 3rd Communities and Technologies Conference, Michigan State University. 2007. P. 41-66.
Kumar R., Novak J., Tomkins A. Structure and evolution of online social networks // Proc. of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. KDD’06. 2006. P. 611-617.
Mislove A., Marcon M., Gummadi K.P., Druschel P., Bhattacharjee B. Measurement and analysis of online social networks // Proc. of the 7th ACM SIGCOMM Conference on Internet Measurement. IMC’07. 2007. P. 29-42.
Sigov A.S., Zhukov D.O., Khvatova T.Yu., Andrianova E.G. A Model of Forecasting of Information Events on the Basis of the Solution of a Boundary Value Problem for Systems with Memory and Self-Organization // Journal of Communications Technology and Electronics. 2018. V. 18, № 2. P. 106-117.
Zhukov D., Khvatova T., Millar C., Zaltcman A. Modelling the stochastic dynamics of transitions between states in social systems incorporating self-organization and memory // Technological Forecasting and Social Change. 2020. V. 158. Art. 120134.
Zhukov D.O., Lesko S.A. Stochastic self-organissation of poorly structured data and memory realisation in an information domain when designing news events forecasting models // The 2nd IEEE International Conference on Big Data Intelligence and Computing. 2016. August 8-12, Auckland, New Zealand. doi: 10.1109/DASC-PICom-DataCom-CyberSciTec.2016.153
Zhukov D.O., Zaltcman A.D., Khvatova T.Yu. Forecasting Changes in States in Social Networks and Sentiment Security Using the Principles of Percolation Theory and Stochastic Dynamics // Proceedings of the 2019 IEEE International Conference “Quality Management, Transport and Information Security, Information Technologies”; IT and QM and IS 2019. Art. 8928295. P. 149-153.