Голосование по поправкам завершилось, на сайт vybory.izbirkom.ru выложенны результаты по изберкомам.
А это значит, что пришло время спарсить оттуда всего, да побольше, заварить чай покрепче и наконец узнать, почем в Росии демократия.
В датасете у нас 89 тысяч пунктов для голосования. Для каждого пункта указанно сколько прикрепленно за участком, сколько из них явилось, число негодяев испортивших бюллетень(жаль без фамилий а то бы мы им!!!), а так же сколько подсчтали самые честные в мире изберкомы галочек да и нет в конце трудового дня.
Начнем с простого.Построим гистограмму распределения явки избирателей. Для нормально проведенных выборов, это гистограмма должна напоминать нормальное распределение. К примеру на картинке 1 изображены такие распределения для 3х выборов в ГД РФ. Видны характерные купола, разве что правая часть выглядит несколько завышенной, но терпимо. На рисунке 2 изображено такое же распределение но для поправок в конституцию. Выглядит как смесь из двух распределений. Нормального с явкой примерно на уровне 43 процентов и еще одного. Загадочное второе распределение обладает удивительным свойством. Оно имеет ярковыраженные пики на ровных значениях явки в 70, 75, 80, 85 процентов. Если бы мы жили не в Росии, можно было бы предположить, что в изберкомах или через работодателей пытаюстся подогнать явку под некие целевые значения. Слава Богу мы взрослые люди и понимаем что это не так.
Переходим дальше. На рисунке 3 и 4 нанесенны все участки голосования. По оси Y отложен процент ЗА, на оси X явка. Видна зависимость. Чем выше явка на участке, тем выше голосов за. На увеличенной (4й) картинке заметно, что точки имеют некоторую тенденцию группироваться вдоль ровных значений. Мы уже замечали такое поведение раньше, но тут же значения голосов ЗА. Неужели есть целевые значенич и по положительным ответам?
Впрочем вернемся обратно. 5й график показывает нам изменение голосов ЗА и ПРОТИВ по мере изменения явки для Москвы. Не каждая пара синхронисток выступая на олимпийских играх покажет такой убедительный результат. Существуют некоторые небрежности, но их можно легко простить.
6й график показывает нам такую же зависимость но для всей России.
Большее спасибо цику за интереснейший датасет по детекции аномалий. Отдельное спасибо Чечне и Дагестану, которые по этическим соображениям были удаленны из данных как выбросы.
Отчет подготовлен штатным аналитиком 9б класса.