Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Социодинамика
Правильная ссылка на статью:

След как знак: эпистемология и методология цифровых данных в социологии

Матвеев Михаил Сергеевич

ORCID: 0000-0002-5378-6559

аспирант, кафедра Социологии и политологии, СПбГЭТУ «ЛЭТИ»

195276, Россия, г. Санкт-Петербург, Культуры, 25, кв. 184

Matveev Mikhail Sergeevich

Postgraduate student, Department of Sociology and Political Science, St. Petersburg State Technical University 'LETI'

195276, Russia, Saint Petersburg, Kultury, 25, sq. 184

mikhail.matveev97@gmail.com
Другие публикации этого автора
 

 

DOI:

10.25136/2409-7144.2025.4.74248

EDN:

MUOPRO

Дата направления статьи в редакцию:

24-04-2025


Дата публикации:

01-05-2025


Аннотация: Статья посвящена анализу эпистемологических и методологических проблем интеграции цифровых следов в эмпирическую социологию. Актуальность темы определяется ростом объёма цифровых данных и необходимостью их осмысленной интеграции в социальные науки. Как показывает опыт других исследователей, на текущий момент анализ цифровых поведенческих данных вызывает скорее объект критики. Из этого напрямую вытекает цель данной статьи — проанализировать и выявить эпистемологические и методологические сложности интеграции цифровых следов в социологическую традицию, а также показать, что работа с подобного типа данными находится в гораздо более широкой историко-теоретической рамке. Кроме того, поставлена задача обосновать необходимость интерпретативного подхода на любых объемах цифровых данных и подчеркнуть необходимость контекстуализации и критической рефлексии на всех этапах исследования. Методологическую основу статьи составляют общенаучные методы — теоретико-методологический анализ, сравнение и обобщение научных источников по проблеме исследования. В результате исследования обоснована необходимость комплексного подхода, предполагающего различную основу источников цифровых поведенческих данных, сочетание количественного анализа цифровых данных с интерпретацией, учёта платформенной специфики, возможной алгоритмической селекцией при формировании выборки выгружаемых данных и необходимость проверки аутентичности данных на наличие автоматизированной активности. Сделан вывод о необходимости критического отношения на всех этапах исследования к цифровым данным и понимания их как знаков, требующих научной рефлексии, а не как готовых эмпирических фактов. Тем не менее, выявлено, что такая точка зрения прослеживается и в более ранних ключевых работах о нереактивной исследовательской стратегии в социологии. На основе проведенной работы были предложены рекомендации и примеры работ, использующих интепретативную рамку, как на уровне качественной стратегии цифровых исследований, так в масштабах, понимающихся в широком дискурсе, как Большие данные.


Ключевые слова:

цифровые следы, цифровая социология, интерпретация данных, методология социологических исследований, эпистемология цифровых данных, Большие данные, социальные медиа, нереактивная стратегия, эмпирическая социология, цифровые поведенческие данные

Abstract: The article is dedicated to the analysis of epistemological and methodological problems related to the integration of digital traces into empirical sociology. The relevance of the topic is determined by the growth in the volume of digital data and the necessity for their meaningful integration into the social sciences. As experience from other researchers shows, the analysis of digital behavioral data currently tends to attract criticism. This directly leads to the goal of this article—to analyze and identify the epistemological and methodological complexities of integrating digital traces into the sociological tradition, as well as to demonstrate that working with such data types is situated within a much broader historical and theoretical framework. Furthermore, the task is to justify the necessity of an interpretative approach to any volumes of digital data and emphasize the need for contextualization and critical reflection at all stages of research. The methodological basis of the article consists of general scientific methods—theoretical and methodological analysis, comparison, and generalization of scientific sources on the research problem. As a result of the research, the necessity for a comprehensive approach has been substantiated, which suggests a diverse basis for sources of digital behavioral data, a combination of quantitative analysis of digital data with interpretation, consideration of platform specificity, possible algorithmic selection in the formation of the sample of extracted data, and the need to check the authenticity of the data for automated activity. It was concluded that a critical attitude towards digital data is necessary at all stages of research and that these data should be understood as signs requiring scientific reflection rather than as ready-made empirical facts. Nevertheless, it has been identified that such a perspective can also be traced in earlier key works on non-reactive research strategies in sociology. Based on the conducted work, recommendations and examples of studies using an interpretative framework were proposed, both at the level of qualitative strategies for digital research and on scales understood in the broader discourse as Big Data.


Keywords:

digital footprints, digital sociology, data interpretation, methodology of sociological research, epistemology of digital data, Big Data, social media, non-reactive strategy, empirical sociology, digital behavioral data

Введение

Не бросаясь громкими формулировками о том, что цифровые данные стали основополагающей чертой современного общества, а лишь приводя в качестве примера тот факт, что индивиды, взаимодействуя с компьютерными технологиями генерируют 463 эксабайт данных каждый день, можно сделать вывод о том, что интенция анализировать эти данные уже возникла в самых различных институтах современного социума[1]. И действительно, цифровые поведенческие данные уже используются маркетологами в условиях «знающего капитализма», а также в государственном управлении. Возник даже дискурс о предстоящем кризисе в социологии в духе эпистемологического «конца теории». В 2008-м году К. Андерсон выпустил статью «The End of Theory», где заявил, что отныне в центр внимания нужно ставить данные, столь легкодоступные и легкоанализируемые компьютерными методами. Теории и гипотезы больше не нужны, а на первый план выходят корреляции на больших выборках данных [2].

Нарративы в некоторых технооптимистичных публикациях по данной тематики, описывающие все потенциальные преимущества, и слова о том, что наконец-то «сбылась мечта социолога — добраться до следов, которые остаются от действий людей, независимо от намерений исследователей» спустя продолжительный отрезок времени не изменили теоретико-методологический скепсис насчет использования цифровых следов в эмпирической социологии, который отметила в своей статье К. Губа: исследователи скорее воспринимают их как объект для критики, нежели вносят свой вклад в их развитие [3].

Из этого напрямую вытекает цель данной статьи — проанализировать и выявить эпистемологические и методологические сложности интеграции цифровых следов в социологическую традицию, а также показать, что работа с подобного типа данными находится в гораздо более широкой историко-теоретической рамке и обосновать необходимость интерпретативного подхода.

Обсуждение

Прежде всего, стоит дать рабочее определение «цифровых следов» (digital footprint) – данные, характеризующих сетевую активность индивида [4]. В качестве эмпирического источника они вполне следуют логике, что они возникают, в отличие, к примеру, от результатов опроса, независимо от воли исследователя— клики, посты, комментарии, лайки, видимые взаимодействия в соцсетях и т.д. Поэтому ряд работ относят поведенческие цифровые данные, исходя из источника их возникновения, к нереактивным данным [5],[6]. Однако несмотря на то, что появление такой социологической информации не требует участия индивида в исследовании и, следовательно, у него не возникает осознание факта участия в исследовании, что снижает риск возникновения эффекта Готорна (по Э. Гидденсу), стоит отметить, что цифровые следы стоит отнести к условно реактивным или малореактивным: да, пользователи соцсетей могут не знать, что оставляемые им следы будут использоваться для какой-то конкретной научной цели, но так или иначе в своих повседневных практиках управляют самопрезентацией в Сети, а значит их поведение также может быть «реактивным» — просто по отношению не к исследователю, а к аудитории, однако «естественность» такого снимка социальной действительности сохраняется.

Из этого вытекает и первая сложность, как таковая нереактивная традиция до сих пор не стала частью канонического исследовательского арсенала в социологии: это связано с отсутствием методологической «контролируемости» получаемых данных, недостаток методических работ для их использования и определенный уровень методологического консерватизма: Господствующий научный стиль социологии… предполагает применение опросных инструментов и статистики для проверки заранее сформулированных гипотез» [3].

Переход в цифровую эпоху лишь усилил эту проблематику: накопленных, видимых и анализируемых данных стало все больше, маркетологи и бизнес-аналитики уже интегрировали цифровые следы в свои нереактивные исследовательские практики, поскольку, по словам М. Буравого и его коллег, находятся в более выигрышной позиции, нежели академическая социология, являясь и хранителями, ведь именно на их серверах агрегируется вся полнота данных, если это, к примеру, крупная технологическая компания, и менее «ответственными исследователями», поскольку коммерческие структуры оценивают данные с практической точки зрения, а не с точки зрения строго академического подхода к верификации [7].

Социологи же столкнулись с тем, что теперь необходимо развивать уровень междициплинарной подготовки, в том числе и осваивать новые языки программирования для: работы с API, веб-скрейпингом, тематическим моделированием. То есть, буквально заново осваивать доступ к получению социологической информации.

Также важной проблематикой является: вопросы валидности и репрезентативности цифровых следов, поскольку они редко содержат информацию о поле, возрасте, образовании. В классической методологии такие данные является базисными для любого опроса. К этому стоит добавить присутствие ботов и поддельных аккаунтов, которые при автоматизированном анализе на большом объеме попадают в выборку данных. Сложности в объединении результатов цифрового анализа с другими данными (например, опросными) для обеспечения верификации и кросс-валидации [6]. И наконец, проблема, связанная с сущностным различием виртуальной и константной реальности: к примеру, можно ли сказать, что присутствие друг у друга «в друзьях» в одном из социальных медиа является признаком наличия реального социального взаимодействия. М. Б. Богданов и И. Б. Смирнов описали это как конструктная валидность. То есть, в ходе исследовательской работы исследователь постоянно должен задаваться вопросом: «Действительно ли его данные отражают то, что он хочет изучить?» [5].

Если убрать за скобки проблемы, связанные с недостатком компетенции у академических исследователей и малое количество исследовательских центров, занимающихся цифровыми методам, поскольку это проблема решится само собой, когда предметная область преодолеет теоретико-методологические проблемы и будет способна вносить сущностный вклад в социологическое знание, представляется, что для ответа на вопрос необходимо признать, что цифровые следы не просто «готовый» эмпирический артефакт, обладающий одновременно и масштабом и при этом сохраняющий единицу социальной информации, а всегда объект интерпретации, контекстуализации и распознавания.

Для этого стоит использовать более широкую историческую оптику. Одним из первых, кто использовал понятие «след» в социологии стал С. Роккан. Он понимал его, как данные, созданные самим социальным процессом: от простых материальных доказательств через всевозможные артефакты до разнообразных символических представлений и идей, зафиксированных в рисунках, рассказах, или сообщениях [8].

Один из ключевых эмпирических исследователей той эпохи социолог П. Лазарсфельд напрямую не использовал понятие “следов”, тем не менее следовал логике соотнесения «индикаторов», «симптомов», «подсказок» и «знаков» с более фундаментальным положением дел, той социальной реальности, которая привела к появлению этих показателей: «Это тот же самый процесс, когда мужчины на протяжении всей истории спрашивали своих возлюбленных: «Ты действительно меня любишь?» [9].

Социолог Ю. Уэбб c коллегами в своей основополагающей работе по нереактивным мерам три типа получаемых в результате такой стратегии данных: найденные данные, извлеченные данные и схваченные данные [10]. Под термином «найденные данные» авторы подразумевают материал, непреднамеренно оставленный субъектами и группами по мере их жизни. Найденные данные (спрессованная трава, выброшенные предметы и т. д.) определяются именно как следы». «Извлеченные данные» охарактеризованы Уэббом и коллегами как материалы, намеренно созданные отдельными лицами и группами для достижения своих целей. Они могут быть публичными (законы, постановления, газетные статьи, рекламные щиты, песни) или частными (семейные фотографии, письма друзьям, личные заметки). Они различают «текущие записи», которые представляют собой архивные материалы, охватывающие длительные периоды (данные, собранные для административных целей, данные о продажах, материалы СМИ, которые появляются в регулярной форме) и «эпизодические записи», которые являются прерывистыми (предложение, несколько писем, несколько романов). Извлеченные данные, по задумке авторов, показывают, как события и значения социально конструируются.

«Схваченные данные» определяются как поведение и невербальные сигналы, такие как движения, позы, жесты и даже разговоры «на месте», зафиксированные с использованием методов наблюдения. Это не постоянные, а эфемерные данные, которые возникают во время социальных взаимодействий и моментально исчезают, поэтому их необходимо фиксировать исследователям. Примерами являются: анализ невербального поведения, чтобы понять социальную динамику группы, прослушивание разговоров на рынке между продавцами и покупателями.

В другой предметной области, из исследователей, придерживающихся схожей исследовательской логики можно отметить историка К. Гинзбурга, развивавшего парадигму обнаружения цепочек следов доказательств или каких-либо указаний для научной рефлексии и интерпретации[11]. Стоит отметить, что в исторической науке, теоретизация в данной предметной области насчитывает более продолжительную историю: ещё в XIX веке исследователи предложили различие между: непреднамеренными следами и намеренно созданными свидетельствами, передаваемыми сознательно: буквально, традициями [12]. Безусловно, в связи с особенность объекта исследования след становится методологическим «мостом», то, что нельзя извлечь напрямую, а нужно реконструировать.

На эпистемологическом уровне, объединяя все вышеперечисленные примеры, можно увидеть то общее, что часто упускается сторонниками сугубо компьютерных методов, автоматизации и датафикации, то, что след — не является чем-то самообъясняющим, его смысл, полезный для исследователя, создаётся в контексте и познается через интерпретацию. Именно активная деятельность исследователя позволит сблизить артефакты самого социального поведения и знания о нем.

То есть, цифровые следы стоит понимать не как «смысл, а как «данные, потенциально содержащие его»: «лайк» не всегда равно «поддержка», а переход по ссылке не всегда означает интерес. С философской точки зрения, след — это знак, который напрямую связан с каким-то событием или объектом, но и одновременно является замещением: он говорит о чём-то отсутствующем, чего уже исследователь не видит напрямую. Г. Рава, используя концепции. Ж Деррида и У. Эко, изучила феномен интернет-троллинга и постулировала различие между преднамеренными и непреднамеренными знаками, первые из которых представляют собой знаки в строгом смысле, а вторые — это нечто нераскодируемое на данный момент, но потенциально в них заложена определенная доля смысла, готовая раскрыться в любой момент. Цифровые следы троллей, по словам исследовательницы, кажутся бессмысленными, это совокупность провокационных комментариев или поддразниваний, но в результате анализ показал, что целью является «нагнетание чувства неуверенности и подозрительности внутри виртуального сообщества [13, с. 269]. В этом смысле крайне интересным представляется исследование цифровой тишины: что означит молчание в публичных цифровых пространствах? Как исчезновение поста, «прочитано, но не отвечено», смена аватара без сообщения становятся социально значимыми действиями, влияющими на коммуникацию? Автоматизированный количественный контент-анализ упустит отсутствие поста, потеряв важный смысловой блок. С эпистемологической точки зрения, важно отметить, что в этом случае отказ от классической парадигмы эмпирического невозможен: теоретическая рамка конструирует модели объяснения, а без них цифровые данные не становятся научным знанием — они нуждаются в контексте и интерпретации. Нахождение корреляции не является объяснением причинности, да и сами данные вполне могут быть подвержены искажениям. Вышеупомянутая логика К. Андерсона «Сначала данные – потом концептуальные модели» — это не освобождение от теории, это отказ от понимания.

Разумеется, такая интерпретативная рамка представляется крайне эффективной «в изучении замкнутых или малоизученных сообществ» в виртуальном пространстве [4]. Уже существуют этнографические исследовательские подходы, в которых комбинируется качественные методы и количественный анализ цифровых следов: сетевой анализ, тематическое моделирование и этнографическое наблюдение для изучения профессиональных онлайн-сообществ позволило менее прагматично воспринимать дискуссии и уловить эмоциональные нюансы коммуникаций [14].

Такой подход полностью укладывается в предложенную Б. Латуром и его коллегами двойную стратегию: для того, чтобы получить неразрывную ткань (fabric) социальной жизни: нужно использовать-качественно-количественные методы: наблюдение и понимание логики локального с помощью эмических категорий и их картирование и выявление паттернов компьютерными методами: то есть не «читать по цифрам», а использовать цифры как сетку для фокусировки чтения. Это позволит наблюдать не готовые структуры, а становление смысла и взаимодействия в реальном времени [15].

Но означает ли это, что в условиях, когда речь идет масштабности и анализа и выводов в исследованиях следование контекстуальной методологии невозможно? Нет, ведь реконструкция смысла необходима, иначе цифровые следы теряют свой эвристический потенциал. Т. Шелтон с коллегами анализировали данные из соцсетей о передвижениях людей в городе. Объем выборки в 500000 постов показал, что сугубо цифровые данные неравномерно репрезентируют социальные группы: более богатые районы создают больше следов. И из этого возникает еще один важный исследовательский вопрос: что означает «цифровое молчание» жителей отдельных районов, в этом смысле цифровые следы (или их отсутствие) уже несет потенциальный смысл [16].

Следующий аспект, который необходимо учитывать при автоматизированных выгрузках и анализе: это критический подход к источнику цифровых следов (платформа, существующие в ней алгоритмы и технические протоколы взаимодействия). Более того, как убедительно показала В. Чун в исследовании пользовательских практик, в различных социальных медиа «лайк» и «репост» изначально несет разный смысл: от случайного действия, согласия или оценки, до жеста присутствия. А затем становится ритуализированными действиями, которые формируют и поддерживают идентичность внутри одной платформы: к примеру, человек как пользователь одной из платформ всегда должен оценить профиль своего виртуального собеседника перед началом коммуникации [17]. Таким образом, представляется необходимым дифференцировать разные типы следов, как минимум, преднамеренные и непреднамеренные следы и дальнейшую интерпретацию строить с учетом этого подхода. В этом смысле представляется интересной более общая классификация следов, предложенная рядом исследователей: по принципу их естественного происхождения или спроектированности для исследовательских целей (A/B-тестирования и контролируемые эксперименты на онлайн-платформах), или по принципу непереднамеренности и намеренности. В первом случае логи, клики, поисковые запросы, куки выступают как остатки других активностей, а загруженные пользоватем изображения, тексты, видео как коммуникативные акты [18] [19]

В этом контексте важно учитывать и алгоритмическую проблематику. В этом исследовании социальных медиа показано, что технические структуры, в том числе, так называемые ленты новостей, создают информационные пузыри, исключая целые категории контента из доступности для пользователя, следовательно отсутствие коммуникативных следов не связано с деятельностью исследуемой выборки, а анализируемые поведенческие данные уже предварительно отобраны и трансформированы цифровой средой. То есть, необходимо сопоставлять видимые данные и механизмы их формирования [20]. В этом же смысле, дополнительная работы с выгружаемыми данными нужна и с учетом проблематики автоматизированных аккаунтов (всевозможных ботов), что существенно искажает структуру коммуникации между реальными пользователями.

Ну и наконец, использовать смешанные методы, как на уровне дихотомии реальный-виртуальный. К примеру, исследование З. Туфекчи, в котором количественные цифровые следы стали основой для гипотез, а полевые наблюдения проверили, насколько онлайн-активность коррелировала с реальной вовлеченностью участников в социальные движения [21]. Либо как противопоставление автоматический анализ-ручная проверка, когда, к примеру, тематическое моделирование (выделение тем в больших текстовых массивах) является лишь этапом ручной интерпретации для уточнения смыслов в интересующих исследователя тематиках. Или стратегия, когда автоматический сетевой анализ (например, через Python-библиотеки NetworkX) поможет увидеть паттерны взаимодействий, степень вовлечённости, выявить лидеров мнений. Однако их конкретные коммуникативные практики и контексты нужно дополнительно верифицировать через наблюдение - ручная выборка и анализ микрокейсов.

Заключение

Таким образом, цифровые следы и их анализ в современной социологии не являются не полной противоположностью классическим реактивным данным, сколько их продолжением в иной среде — технологически опосредованной, алгоритмически управляемой и фрагментарной. Главным в этом смысле остается отказ от представления о таких данных как о «готовом знании» и перехода к исследовательской позиции, в которой анализ — это всегда акт интерпретации, контекстуализации и распознавания. След — это не факт, а потенциальный знак, который становится значимым только в определённой ситуации, через определённую оптику.

Вполне возможно, что некоторая степень институциональной инерции в современной социологии связана с недостаточной осведомленностью о формирующихся практиках в работе с такого типа данными. Хотя историко-методологический обзор показал, что работа со следами — от физического остатка до цифрового артефакта — всегда была частью гуманитарного и социологического знания, главное, это прослеживающийся везде тезис: исследователь — это не просто сборщик данных, а читающий по следам..

Выгрузить десятки тысяч комментариев из социального медиа – это может быть полезным, но без понимания, что делает эти комментарии именно следами, — это не социология, а, к примеру, практика обучения текстовых нейросетевых моделей для моделирования человеческой коммуникации, и скорее относится к области информатики. А цифровая социология, в этом смысле, представляется не просто новым направлением, но и точкой возвращения к ключевым вопросам всей дисциплины: что наблюдаем? как мы это понимаем? что делает наблюдаемое — значимым?

Библиография
1. World Economic Forum. How much data is generated each day? [Электронный ресурс]. 2019. URL: https://www.weforum.org/stories/2019/04/how-much-data-is-generated-each-day-cf4bddf29f/ (дата обращения: 11.04.2025).
2. Anderson C. The End of Theory: The Data Deluge Makes the Scientific Method Obsolete // Wired [Электронный ресурс]. June 23, 2008.
3. Губа К. Большие данные в социологии: новые данные, новая социология? // Социологическое обозрение. 2018. № 1. С. 213-236. DOI: 10.17323/1728-192X-2018-1-213-236 EDN: XNYZFZ.
4. Николаенко Г. А., Фёдорова А. А. Нереактивная стратегия: применимость незаметных методов сбора социологической информации в условиях Web 2.0 на примере цифровой этнографии и Big Data // Социология власти. 2017. № 4. С. 39-53. DOI: 10.22394/2074-0492-2017-4-36-54 EDN: XSLXPV.
5. Богданов М. Б., Смирнов И. Б. Возможности и ограничения цифровых следов и методов машинного обучения в социологии // Мониторинг общественного мнения: экономические и социальные перемены. 2021. № 1. С. 27-48. DOI: 10.14515/monitoring.2021.1.1760 EDN: SXSBFV.
6. Сапонова А. В., Куликов С. П. Интеграция опросных данных и цифровых следов: обзор основных методологических подходов // Социология: 4М. 2021. № 53. С. 117-147. DOI: 10.19181/4m.2021.53.4 EDN: LUWLVB.
7. Savage M., Burrows R. The coming crisis of empirical sociology // Sociology. 2007. Vol. 41, no. 5. P. 885-899. DOI: 10.1177/0038038507080443 EDN: JPVNGP.
8. Rokkan S. Comparing nations: The use of quantitative data in cross-national research // Merritt R. L., Rokkan S. (eds.). Comparative cross-national research: The context of current efforts. New Haven: Yale University Press, 1966. P. 3-25.
9. Lazarsfeld P. F. A conceptual introduction to latent structure analysis // Lazarsfeld P. F. (ed.). Mathematical thinking in the social sciences. Glencoe, IL: The Free Press, 1953. P. 349-387.
10. Webb E. J., Campbell D. T., Schwartz R. D., Sechrest L. Unobtrusive measures: nonreactive research in the social sciences. Chicago: Rand McNally, 1966. 220 p.
11. Ginzburg C. Clues: Roots of a scientific paradigm // Theory and Society. 1979. Vol. 7, no. 3. P. 273-288. DOI: 10.1007/bf00207323 EDN: ILBEOI.
12. Bernheim E. Lehrbuch der historischen Methode und der Geschichtsphilosophie: mit Nachweis der wichtigsten Quellen und Hilfsmittel zum Studium der Geschichte. 6th ed. Berlin: Duncker & Humblot, 1908.
13. Rava G. Traces and Their (In)significance // What People Leave Behind: Digital Footprints as Socio-Material Resource in the Age of Big Data / eds. C. Ciborra, A. Caliandro. Cham: Palgrave Macmillan, 2023. P. 329-343.
14. Бархатова Л. А. Структурные особенности коммуникации российских социологов: кейс онлайн-сообщества // Мониторинг общественного мнения: экономические и социальные перемены. 2020. № 5. С. 204-221. DOI: 10.14515/monitoring.2020.5.1656 EDN: OXNELV.
15. Venturini T., Latour B. The Social Fabric: Digital Traces and Quali-quantitative Methods // Proceedings of Future En Seine. Paris: Cap Digital, 2010.
16. Shelton T., Poorthuis A., Zook M. Social Media and the City: Rethinking Urban Socio-Spatial Inequality Using User-Generated Geographic Information // Landscape and Urban Planning. 2015. Vol. 142. P. 198-211.
17. Chun W. H. K. Updating to Remain the Same: Habitual New Media. Cambridge, MA: MIT Press, 2016. 264 p.
18. Golder S. A., Macy M. W. Digital Footprints: Opportunities and Challenges for Online Social Research // Annual Review of Sociology. 2014. Vol. 40, No. 1. P. 129-152. DOI: 10.1146/annurev-soc-071913-043145.
19. Arosio L. What People Leave Behind Online: Digital Traces and Web-Mediated Documents for Social Research // In: Comunello F., Martire F., Sabetta L. (eds.) What People Leave Behind: Digital Traces in Context. Cham: Springer, 2022. P. 311-324. DOI: 10.1007/978-3-031-11756-5_20.
20. Gillespie T. The relevance of algorithms // In: Media technologies: essays on communication, materiality, and society / eds. T. Gillespie, P. J. Boczkowski, K. A. Foot. Cambridge (MA): MIT Press, 2014. P. 167-194.
21. Tufekci Z. Big questions for social media big data: representativeness, validity and other methodological pitfalls // Proceedings of the Eighth International AAAI Conference on Weblogs and Social Media (ICWSM-14). Michigan: AAAI Press, 2014. P. 505-514.
References
1. World Economic Forum. (2019). How much data is generated each day? Retrieved April 11, 2025, from https://www.weforum.org/stories/2019/04/how-much-data-is-generated-each-day-cf4bddf29f/
2. Anderson, C. (2008, June 23). The end of theory: The data deluge makes the scientific method obsolete. Wired.
3. Guba, K. (2018). Big data in sociology: New data, new sociology? Sociological Review, 1, 213-236. https://doi.org/10.17323/1728-192X-2018-1-213-236
4. Nikolaenko, G. A., & Fedorova, A. A. (2017). Non-reactive strategy: The applicability of unobtrusive methods of sociological information collection in the conditions of Web 2.0 using digital ethnography and big data as an example. Sociology of Power, 4, 39-53. https://doi.org/10.22394/2074-0492-2017-4-36-54
5. Bogdanov, M. B., & Smirnov, I. B. (2021). Opportunities and limitations of digital traces and machine learning methods in sociology. Public Opinion Monitoring: Economic and Social Changes, 1, 27-48. https://doi.org/10.14515/monitoring.2021.1.1760
6. Saponova, A. V., & Kulikov, S. P. (2021). Integration of survey data and digital traces: Overview of main methodological approaches. Sociology: 4M, 53, 117-147. https://doi.org/10.19181/4m.2021.53.4
7. Savage, M., & Burrows, R. (2007). The coming crisis of empirical sociology. Sociology, 41(5), 885-899. https://doi.org/10.1177/0038038507080443
8. Rokkan, S. (1966). Comparing nations: The use of quantitative data in cross-national research. In R. L. Merritt & S. Rokkan (Eds.), Comparative cross-national research: The context of current efforts (pp. 3-25). Yale University Press.
9. Lazarsfeld, P. F. (1953). A conceptual introduction to latent structure analysis. In P. F. Lazarsfeld (Ed.), Mathematical thinking in the social sciences (pp. 349-387). The Free Press.
10. Webb, E. J., Campbell, D. T., Schwartz, R. D., & Sechrest, L. (1966). Unobtrusive measures: Nonreactive research in the social sciences. Rand McNally.
11. Ginzburg, C. (1979). Clues: Roots of a scientific paradigm. Theory and Society, 7(3), 273-288. https://doi.org/10.1007/bf00207323
12. Bernheim, E. (1908). Lehrbuch der historischen Methode und der Geschichtsphilosophie: mit Nachweis der wichtigsten Quellen und Hilfsmittel zum Studium der Geschichte (6th ed.). Duncker & Humblot.
13. Rava, G. (2023). Traces and their (in)significance. In C. Ciborra & A. Caliandro (Eds.), What people leave behind: Digital footprints as socio-material resource in the age of big data (pp. 329-343). Palgrave Macmillan.
14. Barkhatova, L. A. (2020). Structural features of communication among Russian sociologists: A case study of an online community. Public Opinion Monitoring: Economic and Social Changes, 5, 204-221. https://doi.org/10.14515/monitoring.2020.5.1656
15. Venturini, T., & Latour, B. (2010). The social fabric: Digital traces and quali-quantitative methods. In Proceedings of Future en Seine. Cap Digital.
16. Shelton, T., Poorthuis, A., & Zook, M. (2015). Social media and the city: Rethinking urban socio-spatial inequality using user-generated geographic information. Landscape and Urban Planning, 142, 198-211.
17. Chun, W. H. K. (2016). Updating to remain the same: Habitual new media. MIT Press.
18. Golder, S. A., & Macy, M. W. (2014). Digital footprints: Opportunities and challenges for online social research. Annual Review of Sociology, 40(1), 129-152. https://doi.org/10.1146/annurev-soc-071913-043145
19. Arosio, L. (2022). What people leave behind online: Digital traces and web-mediated documents for social research. In F. Comunello, F. Martire, & L. Sabetta (Eds.), What people leave behind: Digital traces in context (pp. 311-324). Springer. https://doi.org/10.1007/978-3-031-11756-5_20
20. Gillespie, T. (2014). The relevance of algorithms. In T. Gillespie, P. J. Boczkowski, & K. A. Foot (Eds.), Media technologies: Essays on communication, materiality, and society (pp. 167-194). MIT Press.
21. Tufekci, Z. (2014). Big questions for social media big data: Representativeness, validity and other methodological pitfalls. In Proceedings of the Eighth International AAAI Conference on Weblogs and Social Media (ICWSM-14) (pp. 505-514). AAAI Press.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

В рецензируемой статье «След как знак: эпистемология и методология цифровых данных в социологии» предмет эпистемологических и методологических сложности, связанных с интеграцией цифровых следов в социологические исследования. Автор рассматривает цифровые следы как объект интерпретации, подчёркивая необходимость создания теоретической рамки для их осмысления в рамках современной социологии.
В данной работе ни методология, ни методы исследования не заявлены. Можно считать, что в качестве метода исследования автор использует анализ научной литературы — включая классические и современные работы по социологии, философии познания, методологии и цифровым исследованиям. Именно данные работы формируют теоретико-методологический фундамент для исследования нереактивных данных и интерпретация следов, отражают дискуссии о роли больших данных и цифровых методов в социологии, освещают современные вызовы, в частности этику данных, алгоритмическую предвзятость, интерпретацию «молчания» в цифровой среде.
Тема статьи крайне актуальна в условиях цифровизации общества и роста объема данных, генерируемых пользователями. Современная социальная жизнь всё больше перемещается в онлайн: соцсети, платформенная экономика, цифровые госуслуги. Это приводит к взрывному росту объёма данных, которые могут быть использованы для изучения поведения людей. Однако их анализ требует новых методологических подходов, что и обсуждает автор.
Научная новизна работы заключается в комплексном анализе цифровых следов через призму историко-методологической перспективы, а также в предложении интерпретативного подхода, который сочетает качественные и количественные методы. Автор критически переосмысливает тезис К. Андерсона о «конце теории», подчеркивая важность теоретической рефлексии даже в эпоху больших данных. Статья определяет понятие цифровых следов как совокупность сложных артефактов цифровой активности, нуждающихся в интерпретации применительно к конкретному контексту и зависящих от множества технологических и социальных факторов. Это определение подчёркивает двоякую сущность цифровых следов — объективную, обусловленную характером самих данных, и субъективную, связанную с необходимостью их дальнейшего осмысления и раскодирования. В работе последовательно рассматриваются проблемы классификации следов, валидности, репрезентативности и алгоритмических искажений. В общем представляется возможным констатировать, что данная статья обладает несомненной научной значимостью и существенным образом обогащает методологический аппарат социологического анализа цифровой эмпирики.
Статья имеет четкую структуру: введение, обсуждение и заключение. Сильной стороной исследования являются примеры исследований, демонстрирующих эффективность смешанных методов. Статья написана в академическом стиле, соответствует требованиям научной публикации.
Список работ включает 21 ссылку на работы российских и зарубежных исследователей. Библиография объединяет работы по социологии, истории, методологии науки и цифровым исследованиям. Источники структурированы, даны с полными библиографическими описаниями. В целом стоит признать, что апелляция к основным оппонентам присутствует в должной мере.
Статья будет интересна социологам, интересующихся методологией исследования и анализом данных.
Таким образом, статья «След как знак: эпистемология и методология цифровых данных в социологии» имеет научно-теоретическую значимость. Работа может быть опубликована.