Some fake news
Sep. 9th, 2017 09:59 amДля разнообразия, пара положительных статей об администрации Трампа (связанных с sexual assault on campus):
https://www.nytimes.com/2017/09/08/opinion/betsy-devos-title-iv.html?action=click&pgtype=Homepage&clickSource=story-heading&module=opinion-c-col-left-region®ion=opinion-c-col-left-region&WT.nav=opinion-c-col-left-region
https://www.theatlantic.com/education/archive/2017/09/the-uncomfortable-truth-about-campus-rape-policy/538974/
Но поскольку они публикованы в New York Times и The Atlantic, то там наверное все вранье, не правда ли?
https://www.nytimes.com/2017/09/08/opinion/betsy-devos-title-iv.html?action=click&pgtype=Homepage&clickSource=story-heading&module=opinion-c-col-left-region®ion=opinion-c-col-left-region&WT.nav=opinion-c-col-left-region
https://www.theatlantic.com/education/archive/2017/09/the-uncomfortable-truth-about-campus-rape-policy/538974/
Но поскольку они публикованы в New York Times и The Atlantic, то там наверное все вранье, не правда ли?
(no subject)
Date: 2017-09-09 05:39 pm (UTC)(no subject)
Date: 2017-09-09 07:47 pm (UTC)Напримѣръ, если 30 статей утверждаютъ, что каждая четвертая женщина на кампусѣ была жертвой изнасилованiя, и что всѣ мужчины "потенцiальные насильники". Еще 30 статей клеймятъ позоромъ любого, кто посмѣетъ усомниться въ этихъ утвержденiяхъ или не повѣрить какимъ-либо женщинамъ, утверждающимъ, что ихъ изнасиловали.
А сейчасъ, послѣ выборовъ, когда Демократы проиграли - появляются, скажемъ, двѣ статьи о томъ, что это все было, оказывается, несправедливо по отношенiю и къ мужчинамъ, и къ настоящимъ жертвамъ настоящихъ изнасилованiй. Когда то-же самое раньше говорили другiе люди, ихъ называли мужскими шовинистами и "сексистами", выгоняли съ телевидѣнiя, увольняли съ работы и т.д. Напримѣръ, Warren Farrell былъ убѣжденнымъ сторонникомъ феминизма, работалъ большимъ начальникомъ въ National Organization for Women, но немедленно вылетелъ отовсюду и сталъ persona non grata на телевидѣнiи, какъ только сталъ копать поглубже и гдѣ-то заикнулся о какомъ-то небольшомъ несоотвѣтствiи понятiя о правовомъ государствѣ и огульныхъ обвиненiй въ изнасилованiяхъ.
Сейчасъ мы вдругъ читаемъ, что Betsy DeVos - которую заклеймили позоромъ, какъ только она была назначена - приняла, молъ, очень важное и своевременное рѣшенiе. Все, о чемъ пишетъ статья въ The Atlantic, - если вычеркнуть эмоцiональный хламъ, - всѣ аргументы уже были детально представлены 20 лѣтъ назадъ въ книгахъ Уоррена Фаррелла и другихъ людей, обычно называемыхъ Men's Rights Activists. Я думаю, что если бы этимъ людямъ всѣ предыдущiя 20 лѣтъ не затыкали ротъ, то не было бы и сегодняшней ситуацiи на кампусахъ. Можетъ, я ошибаюсь. Но, во всякомъ случаѣ, непродуктивно затыкать ротъ людямъ, излагающимъ аргументы противъ какой-либо широко распространенной позицiи.
Если 97% статей въ газетѣ говорятъ одно, а остальные 3% въ раздѣлѣ "opinion" - другое, то это какъ-то подозрительно, но четкихъ выводовъ о враньѣ сдѣлать нельзя. Можетъ, эти 3% утверждаютъ, что Земля плоская и ей 6000 лѣтъ, а остальные 97% строго научны. А можетъ, и то, и другое мотивировано чисто политически. Предыдущая администрацiя поощряла статьи о томъ, какiе мужчины плохiе, а теперешняя наоборотъ, вотъ журналисты и пытаются подыграть новой администрацiи и какъ-то оправдаться за предыдущiя 97% статей.
Я уже когда-то началъ прикидывать, какими алгоритмами можно было бы проанализировать тексты статей газетъ, чтобы автоматически опредѣлять political bias хотя-бы приблизительно. Сегодня технологiя для этого въ общемъ уже разработана, - студенты MIT или Стенфорда выполняютъ домашнiя заданiя такого-же уровня сложности.
Какъ это могло-бы работать:
- опредѣлить процентъ эмоцiонально заряженныхъ словъ, положительныхъ или отрицательныхъ,
- опредѣлить корреляцiи эмоцiонально заряженныхъ словъ и другихъ маркеровъ - сюжета статьи (выборы, внѣшняя политика, феминизмъ, расизмъ, финансы и т.д.), именъ конкретныхъ политиковъ, принадлежность къ политической партiи, принадлежность къ опрѣделенной расовой группѣ, полу, соцiальному классу, и т.п.
Послѣ этого можетъ оказаться, что абсолютное большинство статей въ такой-то газетѣ критикуетъ Израиль и одновременно хвалитъ Мао и Фиделя Кастро, напримѣръ; и никогда не критикуетъ Арабскiе Эмираты, Египетъ или Iорданiю. Или въ другой газетѣ, можетъ оказаться, что политикъ, совершившiй эмоцiонально негативное дѣйствiе, въ большинствѣ случаевъ либо названъ какъ представитель Республиканской партiи или какъ "богатый человѣкъ", либо его партiйная принадлежность и соцiальный статусъ никакъ не упомянуты; и что терминъ "right-wing" употребляется всегда въ негативномъ контекстѣ, въ то время какъ слово "left-wing" практически никогда не встрѣчается ни въ какомъ контекстѣ. А въ третьей газетѣ можетъ оказаться, что процентъ эмоцiонально насыщенныхъ словъ совершенно зашкаливаетъ, но только, если рѣчь идетъ о двухъ-трехъ сюжетахъ, и тамъ всегда одно и то-же мнѣнiе, напримѣръ, что тоталитарная диктатура - это всегда плохо, что носить оружiе - это долгъ гражданина, или что свободный рынокъ - панацея отъ всѣхъ бѣдъ.
Для того, чтобы детектировать такiя вещи, придется вручную составить предметный указатель терминовъ и ключевыхъ словъ, но потомъ вычисленiя довольно просты - это задача unsupervised classification + regression. Было-бы интересно получить реальныя цифры, - врядъ-ли наша интуицiя всегда работаетъ правильно.
Вотъ попытки собрать статьи изъ NYT, но безплатно получаются только summaries.
http://dlab.berkeley.edu/blog/scraping-new-york-times-articles-python-tutorial
Дорога ложка к обеду
Date: 2017-09-09 11:20 pm (UTC)Эта ирония была бы особенно уместна несколько месяцев назад, когда некоторые граждане возмущались, как можно в приличном обществе цитировать Breitbart News.
Re: Дорога ложка к обеду
Date: 2017-09-10 04:47 am (UTC)Практика -- критерий истины
Date: 2017-09-10 06:13 pm (UTC)Re: Практика -- критерий истины
Date: 2017-09-10 08:03 pm (UTC)(no subject)
Date: 2017-09-10 12:49 am (UTC)