Nature (Великобритания): как «Фейсбук», «Твиттер» и другие массивы данных сделали революцию в социологии - «Наука»

  • 00:00, 24-июн-2020
  • Наука
  • Novosti-Dny
  • 0

© REUTERS, Dado Ruvic/Illustration/File PhotoНовое поколение исследователей обращается к вычислениям, чтобы лучше понять общество — и изменить его. Некоторые социологи переживают, что «вычислители» плохо знакомы с предыдущими исследованиями и теорией. В лагере социологов разгорелась своего рода борьба за власть, но все же враждующие стороны помаленьку примиряются.Елизавета Сивак училась социологии почти десять лет. Но затем, посреди исследовательского проекта, она вдруг осознала, что ей пора вновь сесть за парту.
Сивак изучает семью и детство в Национальном исследовательском университете Высшей школы экономики в Москве. В 2015 году она изучала перемещения подростков, — в серии интервью респондентов просили перечислить десять мест, где они побывали за последние пять дней. Год спустя она проанализировала данные и ощутила разочарование, — настолько ограниченным ей показался метод личных опросов. Дело в том, что коллега рассказал ей о «Копенгагенских сетях» (Copenhagen Networks Study), новаторском проекте, который отслеживал контакты в социальных сетях, демографию и местоположение около 1 000 студентов, с пятиминутной детализацией и в течение пяти месяцев. Тут она поняла, что назрели крутые перемены. «Я поняла, что эти новые виды данных сделают настоящую революцию в общественных науках, — говорит она. — И подумала: вот здорово».
После этого Сивак решила научиться программировать и влиться в революцию. Теперь они с коллегами по компьютерным наукам изучают огромные и неуправляемые массивы данных, разбираясь в цифровом отпечатке общества. Они отслеживают активность людей в интернете; изучают оцифрованные книги и исторические документы; толкуют данные с носимых датчиков, которые фиксируют каждый шаг и каждый контакт; проводят онлайн-опросы и эксперименты, собирая миллионы единиц информации; и исследуют базы данных, которые настолько велики, что раскрывают тайны общества лишь после кропотливого анализа.
Последнее десятилетие исследователи взяли эти методы на вооружение, чтобы докопаться до сути проблем, над которыми социологи ломают голову уже больше века: от психологических основ человеческой нравственности до влияния дезинформации и до факторов, которые делают одних художников успешнее других. Так, одно исследование выявило широко распространенный расизм в алгоритмах принятия решений в области здравоохранения; в другом данные с мобильных телефонов использовались для картографирования бедных регионов Руанды.
«Самое большое достижение — это сдвиг в понимании цифровых поведенческих данных как интересного и полезного источника», — говорит Маркус Штромайер (Markus Strohmaier), специалист по вычислительной социологии из Института социальных наук имени Лейбница в немецком Кёльне.
Но не все приняли этот сдвиг с готовностью. Некоторые социологи переживают, что «вычислители», чьи амбиции столь же велики, как и их базы данных, плохо знакомы с предыдущими исследованиями. Еще одна жалоба: некоторые вычислители смотрят только на закономерности, не берут в расчет причины и делают веские выводы из неполных и «грязных» данных, — нередко они получены из социальных сетей и других источников, где гигиена данных оставляет желать лучшего.
Но обмен «любезностями» взаимный. Так, социологи-вычислители, которые пришли из таких областей как физика и инженерия, считают, что многие общественные теории слишком туманны, неясно определены и не проходят проверку опытом.
В лагере социологов разгорелась своего рода борьба за власть, говорит Марк Койшнигг (Marc Keuschnigg), аналитический социолог из Линчёпинского университета в шведском Норрчёпинге. «Кто победит, тому и решать, какими будут общественные науки».
И все же враждующие стороны помаленьку примиряются. «Точек пересечения у вычислительной социологии с традиционной стало больше, — говорит Койшнигг, отмечая целый бум совместных журналов, конференций и учебных программ. — Взаимного уважения тоже прибавилось».
Вычислительная революция
В 2007 году маленькая группа ученых с большими амбициями созвала конференцию, чтобы обсудить новый метод анализа данных в общественных науках. Своими знаниями они хотели изменить мир. Политолог Гари Кинг (Gary King) из Гарвардского университета в Кембридже, штат Массачусетс, заявил, что поток цифровой информации «позволит намного больше узнать о нашем обществе и в конечном итоге начать решать — решать по-настоящему — основные проблемы на пути к процветанию человечества».
К тому времени уже было опубликовано несколько вычислительных социологических исследований. В исследовании 2006 года изучалась роль общественного влияния на популярность музыки — для этого был создан искусственный онлайн-рынок музыки с 14 341 пользователем. Участники эксперимента скачивали разные композиции — иногда зная, насколько они популярны, иногда вслепую. Оказалось, что популярность той или иной песни предсказать тем труднее, чем больше слушателей влияют друг на друга. Это отчасти объясняет, почему угадать сенсацию получается редко.
Два года спустя другое исследование проанализировало перемещения 100 тысяч пользователей мобильных телефонов в течение полугода. Оказалось, что люди в целом придерживаются простых и повторяемых маршрутов. Авторы смогли рассчитать вероятность нахождения того или иного человека в конкретном месте и предположили, что выявление закономерностей облегчит городское планирование, понимание эпидемий или подготовку к чрезвычайным ситуациям.
В том же году технический журнал Wired опубликовал статью, где утверждалось, что эра «больших данных» положит конец теории во всех науках. Хотя на нее обрушился шквал критики за схематизм и упрощенчество, статья попала в точку: прошло более десяти лет, а социологи по-прежнему ссылаются на нее как пример того, что актуальность теории под вопросом.
Но массивы данных продолжили свое триумфальное шествие. Дункану Уоттсу (Duncan Watts), социологу из Пенсильванского университета в Филадельфии, перемены в социологии напомнили события в биологии 1990-х годов, когда высокопроизводительные методы породили огромное количество данных о последовательностях ДНК и экспрессии генов. «Это была лавина новых данных, и она потребовала совершенно иного подхода», — говорит он.
Но многие традиционные социологи первыми плодами революции не впечатлились, а методы ее сочли сомнительными. Скептики считают исследования социальных сетей своего рода экспериментом на тысячах неосведомленных участниках, не дававших к тому же своего согласия. В 2018 году появились сведения, что британская консалтинговая фирма «Кембридж аналитика» (Cambridge Analytica) собирала данные миллионов пользователей «Фейсбука» без их согласия. Этот скандал и его отголоски породили некий скепсис к исследованиям социальных сетей. Некоторым ученым даже пришлось свернуть научные проекты, потому что платформы внедряют новую политику конфиденциальности.
Социально незрелые
Поначалу это направление даже ругали за «игрушечные» проблемы, — на некоторые можно ответить при помощи данных, но животрепещущих проблем социологии они не решают. Например, как бороться с неравенством или как влиять на общественное мнение. «Вначале было много исследований в „Твиттере", которые, как мне кажется, социологи приняли в штыки», — рассказывает Клаудия Вагнер (Claudia Wagner) социолог-вычислитель из Института социальных наук имени Лейбница.
Некоторые утверждают, что увлечение «игрушечными» проблемами было лишь этапом становления. С усложнением анализа и разнообразием источников, поднимаемые проблемы становились все важнее, например, — истоки дискриминации, неравенства и радикализации, говорит Штромайер. «Только сейчас мы начали получать данные, благодаря которым можем заняться важными проблемами», — говорит он.
Например, в прошлом году исследователи здравоохранения и поведенческой экономики проанализировали медицинские карточки более чем 50 тысяч американцев, чтобы оценить часто используемый алгоритм, который определяет, какие сложные пациенты с особыми медицинскими потребностями получат дополнительный уход или дополнительное вмешательство. Команда воспользовалась моделированием, чтобы показать, что алгоритм систематически дискриминирует чернокожих, — а это сказывается на здоровье миллионов людей. Затем исследователи обратились к установленным различиям в сфере здравоохранения, чтобы отследить источники этой предвзятости и предложить способы ее устранения. Так, алгоритмы не должны считать сумму, потраченную на медицинское обслуживание того или иного пациента хорошим критерием необходимой помощи: из-за неравного доступа к медицинскому обслуживанию на чернокожих американцев обычно тратится меньше денег, чем на белых американцев, даже при одинаковых потребностях.
Но доступ к хорошим данным — не единственная проблема: ученых, переходящих из физики или информатики, нередко ругают за пренебрежение к социологическим теориям, которые объясняют человеческое поведение. «Они ищут лишь закономерности», — говорит Джулия Андригетто (Giulia Andrighetto). Она изучала философию, но теперь стала социологом-вычислителем в Институте когнитивных наук и технологий при Национальном исследовательском совете в Риме. «Но механизмы, которые провоцируют такое поведение, они не ищут».
Для этого требуется твердое понимание социологической теории. Специалист по вычислительной социологии из Университета имени Хамада бен Халифа в Дохе Цзисунь Ань защитила докторскую диссертацию в 2010 году, когда эта сфера только начала набирать обороты. Тогда она изучала обмен новостями в социальных сетях. Поначалу она работала только с другими учеными-«компьютерщиками» и разбираться в строго социологических вопросах было тяжело. Теперь она сотрудничает с политологами, изучая влияние средств массовой информации на общественное мнение и наоборот, а заодно как побудить людей разнообразить свои источники новостей. «Со временем каждая сторона понимает язык и методы другой», — говорит Ань.
Сегодня наметились конкретные признаки сближения. Первая крупная конференция, объединяющая оба подхода, запланирована на 2021 год. Чтобы преодолеть разрыв, университеты создают кафедры с участием представителей разных направлений. Так, в университете Джорджа Мейсона в Фэйрфаксе, штат Виргиния, есть специальный отдел. Летние лагеря вычислительной социологии проходят в более чем 30 местах по всему миру, и множество молодых студентов-энтузиастов (вместе с приростом рабочих мест) вселяют некоторую надежду, что борьба за власть сменится плодотворным сотрудничеством.
Больше общения
Союз двух подходов может дать плоды. Исследователь данных Джошуа Блюменсток (Joshua Blumenstock) из Университета Вашингтона в Сиэтле и его коллеги сделали выводы — по данным с мобильных телефонов миллионов жителей Руанды — об их социально-экономическом статусе, а затем подтвердили результаты, сравнив их с данными обычных опросов. Этим методом смогут воспользоваться политики, чтобы определить, какие районы страны нуждаются в помощи, и лучше отслеживать результаты принятых мер.
Но недостаток общения все еще сказывается. Социолог из Гарварда Джоан Донован (Joan Donovan) приводит в пример прошлогоднее исследование, где авторы наметили сеть «ненавистников» на платформах «Фейсбук» и «ВКонтакте» и показали, как ее структура менялась с течением времени. Она говорит, что авторы исследования, физики и ученые-компьютерщики, не ссылаются на ключевые работы в области социологии, и оценка результатов вышла беднее, чем могла бы. Еще они исследовали слишком мало социальных сетей, ведь даже прошлые исследования показали, что «ненавистники» следуют за харизматичным лидером во многих областях. Как она считает, команда пришла к опасному выводу: платформы социальных сетей могут направлять дискуссии в «ненавистнических» группах, создавая, в частности, фальшивые профили или симулируя внутреннюю вражду. Это чревато неприятными последствиями: так наращивается объем дискуссии в группе и повышается ее рейтинг в поисковых алгоритмах, говорит она. Она считает, что лучшая стратегия — сдержать распространение ненавистнических сообщений, ограничив их видимость в поисковике.
Физик Нил Джонсон (Neil Johnson) из Университета Джорджа Вашингтона в Вашингтоне, округ Колумбия, и ведущий автор исследования ненависти уже привык к критике со стороны социологов. Он считает, что привел лишь наиболее релевантные ссылки. А что касается поисковых алгоритмов, то компании социальных сетей могут ими манипулировать, считает он, — «точно так же, как они и сейчас делают, заглушая популярность страниц и групп с дезинформацией насчет вакцин и covid-19». Он изучал дезинформацию, конфликты и экстремизм и говорит, что получает жалобы всякий раз, когда публикует громкую статью. Однако его работа нашла отклик у политиков: к нему часто обращаются за консультацией организации, которым нравится количественный характер его работы и возможность моделировать воздействие определенных вмешательств. «Мы действительно можем взглянуть на конкретные вопросы во взаимодействии с другими учеными — так, как раньше не делалось», — говорит он. Со своей стороны, Джонсон переживает, что социологи слишком часто стремятся к вычислительным методам, не имея надлежащей подготовки.
Социология для решения мировых проблем
Некоторые теории все же более конкретны. Андригетто изучает социальные нормы — общие правила, определяющие, что приемлемо, а что нет. Она говорит, что исследователи потратили целое десятилетие на составление четких определений и выработку теории. Так, теория предполагает, что общественные сдвиги меняют реакцию людей к данной ситуации. Считается, что общественные нормы меняются медленно и за счет интенсивных социальных взаимодействий. Благодаря таким проверяемым утверждениям Андригетто сочетает вычислительную работу с социологической теорией: она проводит онлайн-эксперименты, чтобы проверить, как моделируемые изменения социальных норм влияют на поведение.
Она не одинока в своем желании изменить мир с помощью социологии. Уоттс говорит, что он и другие ученые слишком часто гоняются за публикациями, забывая о реальных решениях. «Мне казалось, что работа выполнена, когда выходит статья, — говорит он. — Моя задача — выложить идеи на суд общественности, а кто-то еще придет и выяснит, как воплотить их ради перемен в реальном мире».
Чтобы этот сдвиг произошел, считает Уоттс, исследователи из обоих лагерей должны развивать тягу к сотрудничеству. Некоторые считают, что это уже происходит. «Традиционная социология и вычислительная социология становятся все ближе, — говорит Вагнер. — Через 20 лет разрыва не будет совсем».

© REUTERS, Dado Ruvic/Illustration/File PhotoНовое поколение исследователей обращается к вычислениям, чтобы лучше понять общество — и изменить его. Некоторые социологи переживают, что «вычислители» плохо знакомы с предыдущими исследованиями и теорией. В лагере социологов разгорелась своего рода борьба за власть, но все же враждующие стороны помаленьку примиряются.Елизавета Сивак училась социологии почти десять лет. Но затем, посреди исследовательского проекта, она вдруг осознала, что ей пора вновь сесть за парту. Сивак изучает семью и детство в Национальном исследовательском университете Высшей школы экономики в Москве. В 2015 году она изучала перемещения подростков, — в серии интервью респондентов просили перечислить десять мест, где они побывали за последние пять дней. Год спустя она проанализировала данные и ощутила разочарование, — настолько ограниченным ей показался метод личных опросов. Дело в том, что коллега рассказал ей о «Копенгагенских сетях» (Copenhagen Networks Study), новаторском проекте, который отслеживал контакты в социальных сетях, демографию и местоположение около 1 000 студентов, с пятиминутной детализацией и в течение пяти месяцев. Тут она поняла, что назрели крутые перемены. «Я поняла, что эти новые виды данных сделают настоящую революцию в общественных науках, — говорит она. — И подумала: вот здорово». После этого Сивак решила научиться программировать и влиться в революцию. Теперь они с коллегами по компьютерным наукам изучают огромные и неуправляемые массивы данных, разбираясь в цифровом отпечатке общества. Они отслеживают активность людей в интернете; изучают оцифрованные книги и исторические документы; толкуют данные с носимых датчиков, которые фиксируют каждый шаг и каждый контакт; проводят онлайн-опросы и эксперименты, собирая миллионы единиц информации; и исследуют базы данных, которые настолько велики, что раскрывают тайны общества лишь после кропотливого анализа. Последнее десятилетие исследователи взяли эти методы на вооружение, чтобы докопаться до сути проблем, над которыми социологи ломают голову уже больше века: от психологических основ человеческой нравственности до влияния дезинформации и до факторов, которые делают одних художников успешнее других. Так, одно исследование выявило широко распространенный расизм в алгоритмах принятия решений в области здравоохранения; в другом данные с мобильных телефонов использовались для картографирования бедных регионов Руанды. «Самое большое достижение — это сдвиг в понимании цифровых поведенческих данных как интересного и полезного источника», — говорит Маркус Штромайер (Markus Strohmaier), специалист по вычислительной социологии из Института социальных наук имени Лейбница в немецком Кёльне. Но не все приняли этот сдвиг с готовностью. Некоторые социологи переживают, что «вычислители», чьи амбиции столь же велики, как и их базы данных, плохо знакомы с предыдущими исследованиями. Еще одна жалоба: некоторые вычислители смотрят только на закономерности, не берут в расчет причины и делают веские выводы из неполных и «грязных» данных, — нередко они получены из социальных сетей и других источников, где гигиена данных оставляет желать лучшего. Но обмен «любезностями» взаимный. Так, социологи-вычислители, которые пришли из таких областей как физика и инженерия, считают, что многие общественные теории слишком туманны, неясно определены и не проходят проверку опытом. В лагере социологов разгорелась своего рода борьба за власть, говорит Марк Койшнигг (Marc Keuschnigg), аналитический социолог из Линчёпинского университета в шведском Норрчёпинге. «Кто победит, тому и решать, какими будут общественные науки». И все же враждующие стороны помаленьку примиряются. «Точек пересечения у вычислительной социологии с традиционной стало больше, — говорит Койшнигг, отмечая целый бум совместных журналов, конференций и учебных программ. — Взаимного уважения тоже прибавилось». Вычислительная революция В 2007 году маленькая группа ученых с большими амбициями созвала конференцию, чтобы обсудить новый метод анализа данных в общественных науках. Своими знаниями они хотели изменить мир. Политолог Гари Кинг (Gary King) из Гарвардского университета в Кембридже, штат Массачусетс, заявил, что поток цифровой информации «позволит намного больше узнать о нашем обществе и в конечном итоге начать решать — решать по-настоящему — основные проблемы на пути к процветанию человечества». К тому времени уже было опубликовано несколько вычислительных социологических исследований. В исследовании 2006 года изучалась роль общественного влияния на популярность музыки — для этого был создан искусственный онлайн-рынок музыки с 14 341 пользователем. Участники эксперимента скачивали разные композиции — иногда зная, насколько они популярны, иногда вслепую. Оказалось, что популярность той или иной песни предсказать тем труднее, чем больше слушателей влияют друг на друга. Это отчасти объясняет, почему угадать сенсацию получается редко. Два года спустя другое исследование проанализировало перемещения 100 тысяч пользователей мобильных телефонов в течение полугода. Оказалось, что люди в целом придерживаются простых и повторяемых маршрутов. Авторы смогли рассчитать вероятность нахождения того или иного человека в конкретном месте и предположили, что выявление закономерностей облегчит городское планирование, понимание эпидемий или подготовку к чрезвычайным ситуациям. В том же году технический журнал Wired опубликовал статью, где утверждалось, что эра «больших данных» положит конец теории во всех науках. Хотя на нее обрушился шквал критики за схематизм и упрощенчество, статья попала в точку: прошло более десяти лет, а социологи по-прежнему ссылаются на нее как пример того, что актуальность теории под вопросом. Но массивы данных продолжили свое триумфальное шествие. Дункану Уоттсу (Duncan Watts), социологу из Пенсильванского университета в Филадельфии, перемены в социологии напомнили события в биологии 1990-х годов, когда высокопроизводительные методы породили огромное количество данных о последовательностях ДНК и экспрессии генов. «Это была лавина новых данных, и она потребовала совершенно иного подхода», — говорит он. Но многие традиционные социологи первыми плодами революции не впечатлились, а методы ее сочли сомнительными. Скептики считают исследования социальных сетей своего рода экспериментом на тысячах неосведомленных участниках, не дававших к тому же своего согласия. В 2018 году появились сведения, что британская консалтинговая фирма «Кембридж аналитика» (Cambridge Analytica) собирала данные миллионов пользователей «Фейсбука» без их согласия. Этот скандал и его отголоски породили некий скепсис к исследованиям социальных сетей. Некоторым ученым даже пришлось свернуть научные проекты, потому что платформы внедряют новую политику конфиденциальности. Социально незрелые Поначалу это направление даже ругали за «игрушечные» проблемы, — на некоторые можно ответить при помощи данных, но животрепещущих проблем социологии они не решают. Например, как бороться с неравенством или как влиять на общественное мнение. «Вначале было много исследований в „Твиттере", которые, как мне кажется, социологи приняли в штыки», — рассказывает Клаудия Вагнер (Claudia Wagner) социолог-вычислитель из Института социальных наук имени Лейбница. Некоторые утверждают, что увлечение «игрушечными» проблемами было лишь этапом становления. С усложнением анализа и разнообразием источников, поднимаемые проблемы становились все важнее, например, — истоки дискриминации, неравенства и радикализации, говорит Штромайер. «Только сейчас мы начали получать данные, благодаря которым можем заняться важными проблемами», — говорит он. Например, в прошлом году исследователи здравоохранения и поведенческой экономики проанализировали медицинские карточки более чем 50 тысяч американцев, чтобы оценить часто используемый алгоритм, который определяет, какие сложные пациенты с особыми медицинскими потребностями получат дополнительный уход или дополнительное вмешательство. Команда воспользовалась моделированием, чтобы показать, что алгоритм систематически дискриминирует чернокожих, — а это сказывается на здоровье миллионов людей. Затем исследователи обратились к установленным различиям в сфере здравоохранения, чтобы отследить источники этой предвзятости и предложить способы ее устранения. Так, алгоритмы не должны считать сумму, потраченную на медицинское обслуживание того или иного пациента хорошим критерием необходимой помощи: из-за неравного доступа к медицинскому обслуживанию на чернокожих американцев обычно тратится меньше денег, чем на белых американцев, даже при одинаковых потребностях. Но доступ к хорошим данным — не единственная проблема: ученых, переходящих из физики или информатики, нередко ругают за пренебрежение к социологическим теориям, которые объясняют человеческое поведение. «Они ищут лишь закономерности», — говорит Джулия Андригетто (Giulia Andrighetto). Она изучала философию, но теперь стала социологом-вычислителем в Институте когнитивных наук и технологий при Национальном исследовательском совете в Риме. «Но механизмы, которые провоцируют такое поведение, они не ищут». Для этого требуется твердое понимание социологической теории. Специалист по вычислительной социологии из Университета имени Хамада бен Халифа в Дохе Цзисунь Ань защитила докторскую диссертацию в 2010 году, когда эта сфера только начала набирать обороты. Тогда она изучала обмен новостями в социальных сетях. Поначалу она работала только с другими учеными-«компьютерщиками» и разбираться в строго социологических вопросах было тяжело. Теперь она сотрудничает с политологами, изучая влияние средств массовой информации на общественное мнение и наоборот, а заодно как побудить людей разнообразить свои источники новостей. «Со временем каждая сторона понимает язык и методы другой», — говорит Ань. Сегодня наметились конкретные признаки сближения. Первая крупная конференция, объединяющая оба подхода, запланирована на 2021 год. Чтобы преодолеть разрыв, университеты создают кафедры с


Рекомендуем


Комментарии (0)




Уважаемый посетитель нашего сайта!
Комментарии к данной записи отсутсвуют. Вы можете стать первым!