К вопросу о научной осмысленности применения веб-скрейпинга как метода сбора данных в социологических исследованиях
Статья посвящена современному методу сбора открытых интернет-данных - веб-скрейпингу - и научной осмысленности его использования в социологических исследованиях. Основываясь на концепциях цифровой социологии, приводятся методологические и технические возможности и ограничения веб-скрейпинга. С позиции философии науки обосновывается место, отводимое веб-скрейпингу в структуре социологического знания. Приведен обзор недавних социологических исследований с применением данного метода.
Web Scraping as a Method of Data Extraction in Sociological Studies: On Scientific Applicability.pdf Введение С ростом цифровизации и постиндустриальными изменениями в социологической науке выделилось отдельное направление - цифровая социология. В 2015 г. на первой в мире конференции по цифровой социологии этой предметной области было дано определение субдисциплины, которая изучает цифровые средства, платформы и технологии как элементы повседневности, а также их влияние на поведение человека в группе - с использованием методов извлечения данных цифровых платформ [1. Р. 1]. Сегодня социологи вынуждены применять новые подходы к изучению трансформирующихся социальных реалий. Объектом исследования становится не индивид, а «со-циотехнический гибрид» (пользователь приложения, вебсайта, гаджета) и его «методологический аккаунт»; гаджеты накапливают информацию о социальном поведении, доступную для анализа, - так называемые большие социологические данные [2. С. 21]. Цифровая социология активно развивается, чувствительно реагируя на социально-экономические и политические изменения. В 2017 г. после голосования по Brexit и провозглашения нового президента США Д. Трампа выходит книга Нортье Маррес, значимого теоретика цифровой социологии, «Digital Sociology: The Reinvention of Social Research». В книге Маррес анализирует релевантность методов анализа цифровых данных для решения социологических задач. Книга оказалась востребованной, поскольку была издана после событий, породивших дискуссии о роли социальных сетей, медиа, фей-ковых новостях и инструментах их идентификации. Проявило интерес к цифровой социологии и отечественное академическое сообщество: в конце лета 2018 г. в Государственном университете управления учреждается журнал «Цифровая социология». Несмотря на признание академической актуальности, цифровая социология подвергается критике в отношении методов сбора и анализа данных. Д. Фаррелл и Дж. Петерсен, считавшиеся пионерами веб-технологий в социологии и призывавшие к сбору и анализу неструктурированных интернет-данных [3. Р. 1], в последних работах используют интернет для сбора структурированной информации - отдавая предпочтение интернет-опросам [4. Р. 1]. Анализ интернет-данных ученые считают проблематичным в силу возможного нарушения приватности данных и несоответствия показателям теоретической рамки исследования [5. Р. 2] (табл. 1). Таблица 1. Критические положения несоответствия измерений, проводимых методами цифровой социологии, теоретической рамке исследования Положение | Влияние на исследование 1. Нерепрезентативность выборок интернет-данных 1.1. Невозможно доказать репрезентативность: гарантировать, что данная выборка пользователей случайная и подчинена закону больших чисел Описывается частный случай, а не массовый социальный процесс /группа 1.2. Анонимность и безнаказанность интернет-среды искажет выборку за счёт спама. бот-активности и недостоверной информации Состояние социальной группы процесса искажается за счёт нерелевантных данных 2. Интернет как площадка искажает дискурс 2.1. При оценке общественных мнений настроений порог входа в интернет как площадку низкий: культура интернет-среды заменяет рациональные аргументы жёсткими эпитетами и обвинениями Описывается не действительное состояние социальной группы процесса, а семантические искажения, связанные с общедоступностью интернет-среды 2.2. Несмотря на всеобщую цифровизацию. имеет место цифровое неравенство: отдельные социальные группы могут быть не охвачены средствами, оставляющими цифровой след: существует проблема доступа к отдельным порталам: технические неполадки в работе интернет-платформы и т.п. Охватывается не вся выборка объекта предмета исследования из теоретической рамки исследования 2.3. Постиндустриальное общество необходимо рассматривать не только как пространство онлайн-среды. но и как офлайн-среды [6. С. 31]. Сложность при таком анатизе заключается в том. что не всегда онлайн- и офлайн-статусы индивида совпадают: необходимо искать пересечения между онлайн- и офлайн-статусом индивида, а не выстраивать их как автономные структуры Рассматривается только одна сторона медали - виртуальная действительность индивида: теоретическая рамка может включать и его офлайн-статус. который с помощью цифровых данных сложно описать 2.4. Цифровая социология стремится проводить анализ в режиме real-time, опираясь на потоки сообщений блогосферы. RSS-ленты. на лету формируя выборки и разрезы, отсеивая аномалии и выбросы [7. С. 6] Real-time извлечение и фильтрация данных могут дать существенные искажения на более длинном горизонте анализа, если таковая определялась теоретической рамкой исследования 3. Нарушение приватности персональных данных: сбор информации должен сопровождаться согласием носителей данных Угроза правонаршения и наказания для исследователя 4. Увлечение математическими методами: социологи в погоне за оптимальной математической спецификацией забывают основную задачу - описать социальную группу, институт или процесс [8. Р. 32] Цели и задачи теоретической рамки, замысел исследования не раскрываются Социологические исследования используют современные стратегии анализа данных, опираясь на теоретические описания их преимуществ [9. C. 132; 10. C. 4]. Однако исследования, системно описывающие возможности и ограничения метода сбора данных цифровой социологии - веб-скрейпинга - и его научной осмысленности, отсутствуют. В условиях тренда на доказательную социальную науку, призывающую «идти от данных» [11. C. 217], применение веб-скрейпинга актуализируется. Работа ставит задачей систематизировать возможности и ограничения веб-скрейпинга для преодоления стигматизации вокруг сбора интернет-данных в социологических исследованиях. Веб-скрейпинг в социологических исследованиях: определение, возможности, ограничения Веб-скрейпинг (син. парсинг, скрин-скрейпинг, веб-кроулинг) - практика сбора открытых данных с загруженных веб-страниц и форм, не предназначенных для этого (т.е. в большинстве случаев в обход интерфейсных правил пользования вебсайтом, API и других ограничений). Сбор открытых данных осуществляется автоматической программой (парсером), которая обращается к веб-серверу для запроса данных и их последующей обработки. Открытые данные представляют собой информацию в машиночитаемом формате, которая может свободно и бесплатно использоваться, перерабатываться и распространяться. Данные, полученные путем авторизации на веб-ресурсах, защищенные авторскими правами и не подлежащие свободному распространению, открытыми не являются. Если технически и существует способ извлечения, возможность использования в исследованиях должна согласовываться с источником. Веб-скрейпинг обладает комплексом преимуществ и ограничений, сгруппированных вокруг методологических, технических, правовых, финансовых факторов. 1. Возможности веб-скрейпинга. 1.1. Методологические. Полнота данных. С использованием веб-скрейпинга у социолога появляется возможность однозначно выделить генеральную совокупность объекта исследования при условии, что интернет-данные достаточны для проработки исследовательской проблемы. Становится выполнимым выделение списка всех контрагентов, их индивидуальных характеристик, оценка интернет-рынка - другими методами получить подобные данные без прямого взаимодействия с собственниками платформ невозможно. Открытые данные даже в качестве неосновного источника дополнят описание объекта. По сравнению с конвенциональными методами сбора данных (опросы, интервью), веб-скрейпинг элиминирует проблему низкого количества откликов в опросах [5. Р. 2; 12. С. 163], телефонных звонках и при личных обращениях [13. Р. 5]. Качество данных. Скрейпинг, в отличие от канонических способов сбора данных, не связан с отклонениями человеческого фактора: неправильной интерпретацией вопросов интервьюером и респондентом [14. C. 602]. Исключается необходимость валидации интервью на соблюдение программы исследования (корректности отбора респондента и поставленных вопросов, длительности интервью, соответствия ответов вопросам по понятийным критериям) [15. C. 123], допустимого уровня когнитивной нагрузки интервьюера [16. С. 627]. У социолога появляется шанс зафиксировать реальное поведение индивидов, минуя призму восприятия. Стратегия исследования. Социолог исходит не из теорий, а из доступных данных веб-платформ, которые могут являться маркерами наиболее значимых социальных явлений. Открывается возможность использовать интернет-данные если не как самостоятельный метод исследования, то как отправную точку для углубления методологии конвенциональных методов сбора данных. Так, анализ распределений генеральной совокупности способствует формированию более надежных стратификационных критериев подбора информантов либо точечной рассылки опросников. 1.2. Технические. Используя парсер, исследователь налаживает прямую связь с источником данных, создает информационную базу; ее можно обновлять на регулярной основе, отслеживать историю изменений. 1.2. Правовые, этические. Часто существует возможность получить открытые данные, не нарушая правовые и этические аспекты распространения и использования информации, поскольку четкого регулирования на российском законодательном уровне скрейпинг не имеет. Согласно ст. 5 закона «Об информации, информационных технологиях и о защите информации» информация может свободно передаваться в случае отсутствия ограничений к доступу и распространению в других федеральных законах [17. Ст. 5]. В соответствии с этим скрейпинг является законным при соблюдении установленных законодательством РФ ограничений: не нарушаются авторские права; не допускается сбор сведений, составляющих коммерческую тайну; не допускается ограничение конкуренции. Сбор персональных данных пользователей социальных сетей может осуществляться только при согласии [18. Ст. 9]; при этом персональными данными является любая информация, относящаяся прямо или косвенно к субъекту [Там же. Ст. 3]. В международном законодательстве скрейпинг также не получил четкого определения, его юридические рамки прецедентно обрисовываются в судебной практике США (табл. 2). Таблица 2. Наиболее заметные судебные дела, связанные с правомерностью скрейпинга Длительность судебных тяжб Истец Ответчик, осуществляющий скрейпинг Кого поддержали по решению суда Решение суда 2000-2009 eBay Bidder's Edge Сначала истца, потом ответчика Высокая активность роботов-парсеров создаёт дополнительную нагрузку к работоспособности сайта eBay; позднее установили, что подобные границы не распространяются к компьютерной среде, поскольку явного ущерба eBay причинено не было 2009 Facebook Power.com Истца Извлечение информации о пользователях - прямое и косвенное нарушение авторских прав 2011-2014 AT&T Andrew Auernlieimer Истца Извлечение конфиденциальной пользовательской информации (пусть и общедоступной) несанкционированно 2013 Associated Press Meltwater Истца Нарушается авторское право 2014 QVC Resutly Ответчика Боты ответчика не намеревались нанести ущерб 2017-2020 Liiikedln HiQ Ответчика Скрейпинг правомерен доя сбора любых общедоступных данных, не защищенных авторским правом 1.4. Финансово-экономические. Стоимость сбора данных, по сравнению с конвенциональными методами, может быть ниже, поскольку исключаются затраты на поиск и подбор интервьюеров, оценку их деятельности, поиск информантов, проведение интервью / опросов, аппроксимацию выборочных оценок на генеральную совокупность. 2. Ограничения веб-скрейпинга. 2.1. Методологические. Объект исследования. Ограниченная область применения: подходит для исследования объектов / явлений, которые могут быть описаны исключительно интернет-данными (блогосфера, взаимодействие через соцсети, цифровые биржи), либо исследование предполагает методику соотнесения онлайн- и офлайн-статусов индивидов [6. C. 30]. Стратегия исследования. Социолог вынужден руководствоваться data-driven подходом: отталкиваться не от теории и операционализации понятий, гипотез, а от данных. Маррес рекомендует на каждом из этапов работы с цифровыми данными обращаться к теоретической рамке и, методично рефлексируя, сравнивать, не отклонился ли исследователь в увлечении методами от своих задач. Если в конвенциональных методах сбора данных имеется свод правил и предписаний (по расчету выборки, шкалированию), то, применяя скрейпинг, социолог каждый раз должен изобретать новый дизайн исследования согласно структуре данных и контексту платформы (что пользователи пишут на страницах профилей, как общаются) [19. C. 35]. Качество данных. Нечасто имеется возможность выявить методологию заполнения и расчета показателей, интерпретировать пустые значения. Обращение к владельцам платформы при этом не всегда действенно: разработчики могут быть не готовы разглашать алгоритмы, являющиеся интеллектуальной собственностью. Кроме того, платформы чаще открывают доступ к набору стандартизированных данных, в то время как большая часть неструктурированной информации (коммуникация между пользователями, история посещений) остается закрытой. Так же как и в конвенциональных социологических методах сбора данных, при скрейпинге сложно однозначно верифицировать достоверность интернет-данных, особенно в условиях тренда на фейк-ньюс, «накрутки» комментариев и голосов, бот-активности. К счастью, часто веб-платформы самостоятельно заботятся о качестве данных, пытаются выявить и предупредить подозрительную активность. Однако в условиях анонимности интернет-среды отсутствуют гарантии того, что одному индивиду соответствует один аккаунт. Данные многих интернет-платформ содержат как большое количество полезной информации, так и информационного шума (несвязного набора слов, спама, символов выражения эмоциональной окрашенности) - могут потребоваться механизмы фильтрации для его устранения. 2.2. Технические. Социологии зависимы от проводимых платформой действий: платформа может установить ограничения на пагинацию, объем видимых данных, скорость загрузки во время веб-скрейпинга. Также платформа может внести изменения в структуру данных, что приведет к необходимости преобразования кода либо конфигурации ПО, использующегося для скрейпинга. Исследователь зависит от устойчивости, работоспособности, загруженности платформы. 2.3. Правовые, этические. Законодательно могут быть предусмотрены ограничения на веб-скрейпинг; его использование может нарушать соглашение об использовании интернет-платформы. Защищаясь от скрейпинга, платформа может предпринимать действия, ограничивающие возможность извлечения информации, являющейся ее интеллектуальной собственностью. Возникает этический вопрос использования закрытых данных, даже в агрегированном виде. 2.4. Финансово-экономические. В случаях, когда социолог не обладает компетенциями в программировании, привлечение программиста-подрядчика для скрейпинга может оказаться дороже по сравнению с конвенциональными методами сбора данных. 2.5. Квалификационные. Существует высокий порог входа в исследование, предполагающее веб-скрейпинг: требуется знание html-разметки, структуры веб-страниц, понимание технических основ сетей, работы интернета, базовое владение языками программирования и работы с базами данных. Платформы продуцируют множество показателей больших объемов, которые по своей сути являются неструктурированными большими данными: их сбор и анализ требует повышенной когнитивной нагрузки. Результаты энцефалограмм, измерений пульса, индекса утомления и анкетных опросов инженеров-программистов и операторов ПО показывают, что деятельность, связанная с большим количеством функциональных звеньев в системе переработки информации, сопряжена с психической напряженностью и, при отсутствии должного отдыха, прогрессирующим снижением работоспособности [20. С. 27; 21. С. 109]. Научная осмысленность веб-скрейпинга в социологических исследованиях с позиции философии науки Поскольку веб-скрейпинг, помимо возможностей, предполагает методологические ограничения, связанные с обратной операционализацией понятий, возникает вопрос, насколько теоретически оправданно его использовать. На текущий момент отсутствуют работы, которые давали бы теоретические доказательства научной обоснованности применения веб-скрейпинга в социологических исследованиях с позиции философии науки. Аргументируем, почему веб-скрейпинг можно считать научно обоснованным инструментом исследовательской оптики социолога. Веб-скрейпинг - метод цифровой социологии, относящейся к частной теории социологических наук. По теории научных революций [22. Р. 7] классическая социология выступает «нормальной наукой», в чью парадигму входят стандартные качественные и количественные методы анализа. Однако в связи с постиндустриальным переходом назревает смена парадигм: онлайн-опросы, средства бизнес-аналитики, потоковые данные, онлайн-платформы и существующие вокруг них научные сообщества способствовали зарождению новой нормальной науки - цифровой социологии. По Куну, в периоды научных революций разворачивается конкурентная борьба научных сообществ, объединенных разными парадигмами, где победа присуждается сообществу с более устойчивым социально-психологическим настроем и способностью «решать головоломки». Успех научной революции определяется беспрецедентностью теории: может ли привлечь на длительный срок сторонников конкурирующих направлений. Сторонники цифровой социологии только начинают «призывать» на свою сторону технических специалистов (бизнес-аналитиков, UX-исследователей, программистов) для совместного изучения данных цифровых платформ, поэтому говорить о научной революции, заданной вектором цифровой социологии, рано [7. С. 6]. Однако достаточно посмотреть глобальную статистику поисковых запросов к понятиям цифровых данных за последние 10-20 лет - интерес к большим социологическим данным не прекращается: согласно Google Trends всплеск общественного интереса стремится к максимуму в 2020 г. (рис. 1), а в Web of Science устойчиво растет количество цитирований понятия «интернет-данные» в социологии (рис. 2). Рис. 1. Уровень интереса к понятию больших социологических данных, у.е. По данным Google Trends на основе статистики поисковых запросов по всему миру; 100 у.е. - максимальный всплеск интереса Рис. 2. Число цитирований по теме web data sociology в системе научного цитирования Web of Science, шт. Дискуссии вокруг веб-скрейпинга справедливы и предсказуемы как для метода нового научного направления и совпадают со всплесками растущего общественного интереса (рис. 3). rtweiOViN^Nat нйноОЯОУКЧЬМауийнвОПО О О О ^ О i-'ООО О 1-i О О О О О 4-'ООО О >-i О О О О ^ 111 11 11111 11111 11 11111 11111 I OOOOOOOOOOl-'i-'i-' 1-ii-| i-ii-If-ii-ii-ii-ii-ii-ii-ii-ii-ii-i oooooooooooooooooooooooooooo (N (N (N (N (N (N (N (N (N (4 (N (N (N (4 (4 (4 (N (N (4 (4 (4 (4 (N (4 (4 (4 (4 ГЧ web scrap ng ......пар с инг Рис. 3. Уровень интереса к понятиям веб-скрейпинга и парсинга, у.е. По данным Google Trends на основе статистики поисковых запросов по всему миру; 100 у.е. - максимальный всплеск интереса Веб-скрейпинг - метод, чья ценность в ускорении научной верификации за счет быстрой агрегации данных. Согласно теории логического позитивизма, получившей развитие в рамках Венского кружка, для доказательства научной осмысленности теорий используется верификация - процедура проверки истинности знаний, в ходе которой сложные предложения разделяются на протокольные путем редукции [23. Р. 125]. Веб-скрейпинг используется для сбора больших данных, которые детализируются до уровня пользователя / аккаунта. Проверять данные генеральной совокупности, сгруппированные в массиве, на соответствие критериям быстрее и проще, чем осуществлять выборочные проверки аккаунтов. При этом проверка может устанавливаться еще в начале отбора данных (например, когда исследователю требуется отделить только активные аккаунты, ак-каунты, созданные в этом году и т.п.). При скрейпинге исследователь осуществляет верификацию протокольных предложений для максимально быстрого обобщения и сведения к теории. Извлекая данные интернет-платформ, веб-скрейпинг способствует целостному пониманию современной картины мира. Наука предназначена не только для сбора фактического материала, но и формирования целостного мировоззрения [24. С. 19]. Веб-скрейпинг полезен в случаях, когда официальная статистика не помогает описать суть социальных явлений либо отсутствует. Примером группы, для изучения которой веб-скрейпинг представляется единственным источником, являются фрилансеры, осуществляющие поиск контрактов через интернет-биржи труда: только начинают внедряться законодательные инициативы по учету таких работников. В основе той же синергетики для ученого реальность является миром структур, упорядоченных в соответствии со строгими закономерностями. Интернет-платформы предполагают упорядоченную структуру представления данных (в виде HTML-разметки / прямых запросов через API), разделенных для на простые для восприятия смысловые блоки. Во многом подобная структура и состав информации, представленной на платформе, продиктованы рыночными правилами, а значит, высвечивает наиболее значимые факты. Веб-скрейпинг - инструмент социолога, готового к междисциплинарному подходу изучения социальной действительности. Порой даже малейшие изменения внешних условий могут приводить к внезапным и радикальным изменениям в системе, которые могут оказать влияние не только на науку, но и на систему подготовки научных кадров. Социолог должен чувствительно реагировать на изменения подходов и методологий, обладать мультидисци-плинарными навыками, в том числе использовать программирование для получения доступа к открытой информации. Однако исследование не должно превращаться в механический анализ данных пользователей: «жестким ядром» [25. С. 1] исследовательской программы социолога должны оставаться стандартные элементы исследования (стратегия, теоретическая рамка, объект, предмет), а «защитным поясом» могут быть цифровая социология, STS и веб-скрейпинг. Обзор социологических исследований с применением веб-скрейпинга на примере фрилансеров как объекта исследования Рассмотрим возможности использования интернет-данных, полученных с помощью веб-скрейпинга, на примерах исследований фрилансеров. По данным крупнейшей российской биржи фрилансеров, собранным веб-скрейпингом, был изучен механизм конкурсов - открытых состязаний между фрилансерами по выполнению задания от заказчика, где за победу присуждается денежное вознаграждение [19. С. 25]. Выборка составила 6 тыс. конкурсов, в которых приняли участие более 300 тыс. фрилансеров. Исследование показывает, что в выборе победителя важное значение отводится репутации фри-лансера (рейтингу, отзывам заказчиков на странице профиля) и активному взаимодействию с заказчиком в комментариях. Социально-демографические признаки при этом не являются значимыми и дискриминирующими выбор победителя. Продолжая тему конкурсов, по данным 30 тыс. проектов биржи freelancer.com были выделены факторы, определяющие победу фрилансера на аукционе с понижением [26. Р. 133]. Так, в категории дорогостоящих задач вероятность победы тех назначающих более высокую цену с большим сроком выполнения решения выше и действует в обратном направлении для дешевых задач. Чем сильнее конкуренция за проект, тем ниже конечная стоимость проекта. Успех будущих проектов фрилансера определяется результатами его предыдущих работ. Так, по данным более миллиона задач, выполненных фрилансерами биржи oDesk, исследователи построили модель предсказания успешности фрилансера по отзывам о его работе на предыдущих проектах [27. Р. 1]. Однако не все фрилансеры с равной вероятностью могут стать успешными: на основе анализа 13,5 тыс. профилей фрилансеров бирж TaskRabbit и Fiverr (демографических характеристик, рейтингов и оценок заказчиков, мест фрилансеров в поисковой выдаче) была выявлена расовая и гендерная дискриминация [28. Р. 1]. Белые женщины-фрилансеры получают на 10% оценок меньше, чем мужчины с соответствующим опытом работы, а афроамериканцы в целом обладают более низким рейтингом. Только фрилан-серы без фото в профиле ниже по рейтингу, чем афроамериканцы. Отзывы о работе афроамериканских женщин-фрилансеров содержат меньше положительных прилагательных. Среди всех категорий работников мужчины-азиаты располагают наибольшим рейтингом. Заключение Веб-скрейпинг обладает потенциалом обогащения социологического знания и вписывается в теоретическую рамку социологических наук. Несмотря на технические и методологические ограничения, стигматизацию интернет-данных, факт появления дискуссий об (анти)научности современных методов цифровой социологии - явление положительное для научного сообщества. Рост знаний достигается в процессе рациональной дискуссии, неизбежно выступающей критикой существующего знания. Критика конвенциональных источников социологического знания должна привести к популяризации веб-скрейпинга как метода получения информации об объективной действительности, а прогрессивная социология - стать проповедником мультидисциплинарности. Поддержание подобных тенденций нуждается в содействии научного сообщества. Освоение веб-скрейпинга требует переподготовки социологов на уровне понимания функционирования интернета, усовершенствования навыков программирования и работы с неструктурированной информацией.
Ключевые слова
веб-скрейпинг,
цифровая социология,
социология интернета,
методы социологических исследований,
web scraping,
digital sociology,
sociology of Internet,
methods of sociological studiesАвторы
Вилкова Ольга Владимировна | Национальный исследовательский университет Высшей школы экономики (НИУ ВШЭ) | аспирант кафедры экономической социологии департамента социологии | olg.vilkova@gmail.com |
Всего: 1
Ссылки
Lupton D. Digital Sociology: Beyond the Digital to the Sociological // The Australian Sociological Association (TASA) Conference 2013. Melbourne, 2013.
Кравченко С.А. Новации в социологическом знании: по итогам XIII конференции ECA // Социологические исследования. 2018. № 2. С. 18-24.
Farrell D., Petersen J. The growth of internet research methods and the reluctant sociologist // Sociological Inquiry. 2010. № 1. P. 114-125.
Petersen J., Farrell D. Internet Surveys // The Blackwell Encyclopedia of Sociology. New York : John Wiley & Sons, 2016.
Petersen J., Farrell D. Online Research Methods // The Blackwell Encyclopedia of Sociology. New York : John Wiley & Sons, 2016.
Гришаева С.А., Куликова О.А. Социально-психологические особенности процесса трансформации социальной структуры общества и процесса коммуникации в цифровом пространстве // Цифровая социология. 2018. № 1. С. 29-34.
Крыштановская О.В. Бесконтактная социология: новые формы исследований в цифровую эпоху // Цифровая социология. 2018. № 1. С. 4-9.
Marres N. Digital Sociology: The Reinvention of Social Research. Cambridge : Polity Press, 2017.
Давыдов А.А. Компьютерные технологии для социологии (обзор зарубежного опыта) // Социологические исследования. 2005. № 1. С. 131-138.
Толстова Ю.Н. Социология и компьютерные технологии // Социологические исследования. 2015. № 8. С. 3-13.
Губа К.С. Большие данные в социологии: новые данные, новая социология? // Социологическое обозрение. 2018. № 1. С. 213-236. DOI: 10.17323/1728-192X-2018-1-213-236
Назарова И.Б. Непроведение опроса и отказ от интервью // Социологический журнал. 1998. № 1-2. С. 161-167.
Dillman D.A. et al. Response rate and measurement differences in mixed-mode surveys using mail, telephone, interactive voice response (IVR) and the Internet // Social science research. 2009. № 1. P. 1-18.
Markou E., Bourgeat E. Observing the work of interviewers: how the quality of the data collection is constructed // 13th Conference of the European Sociological Association (Un)Making Europe: Capitalism, Solidarities, Subjectivities / ed. by F. Welz. Athens: European Sociological Association, 2017. August 29 - September 1. P. 602.
Берестнева О.Г., Романчуков С.В., Шухарев С.О. Технология оценки качества работы интервьюеров // Здоровье и образование в XXI веке. 2016. № 3. C. 123-125.
Девятко И.Ф. Разработка подхода к количественной мультимодальной оценке когнитивной нагрузки интервьюеров: результаты пилотного квазиэксперимента // Вестник РУДН. Социология. 2018. № 4. С. 626-637.
Об информации, информационных технологиях и о защите информации: федер. закон от 27.07.2006 г. № 149-ФЗ.
О персональных данных: федер. закон от 27.07.2006 г. № 152-ФЗ.
Стребков Д., Шевчук А., Лукина А., Мелианова Е., Тюлюпо А. Социальные факторы выбора контрагентов на бирже удаленной работы: исследование конкурсов с помощью «больших данных» // Экономическая социология. 2019. № 3. С. 25-65.
Петрукович В.М., Иванов А.О., Зотов М.В., Федоров С.И. Влияние гипоксии на умственную работоспособность операторов с различными стратегиями переработки информации в оперативной памяти // Вестник СПбГУ. Социология. 2015. № 3. С. 27-37.
Дружилов С.А. Психическая напряженность в профессиональной деятельности операторов прокатных станов // Международный журнал прикладных и фундаментальных исследований. Психологические науки. 2014. № 5. С. 109-112.
Kuhn T. The Structure of Scientific Revolutions. Chicago : University of Chicago Press, 1962.
Carnap R. Scheinprobleme in der Philosophie. Hamburg : Felix Meiner Verlag, 1929.
Хакен Г. Тайны природы. Синергетика: учение о взаимодействии. Москва ; Ижевск : Институт компьютерных исследований, 2003.
Лакатос И. История науки и ее рациональные реконструкции // Из Бостонских исследований по философии науки. М. : Прогресс, 1978. С. 203-235.
Ogtit H. Factors Affecting Professionals' Selection in High and Low-Value Online Service Procurements // The Service Industries Journal. 2013. № 1 (33). P. 133-149.
Kokkodis M., Ipeirotis P. Reputation Transferability in Online Labor Market // Management Science. 2016. № 62 (6). P. 1687-1706.
Hannak A. et al. 2017. Bias in Online Freelance Marketplaces: Evidence from TaskRabbit and Fiverr // ACM Conference on Computer Supported Cooperative Work and Social Computing. 2017.