Замруководителя Федеральной службы государственной статистики (Росстата) Павел Смелов проинформировал о том, как технологии помогают делать статистику доступной и работать с данными по‑умному, в авторской колонке рассказал.
В задачи государства входит достижение «цифровой зрелости» не только участниками рынка, но и государственными учреждениями: Росстат, например, уже осваивает новые методы в работе с большими данными и готовится провести первую цифровую перепись в апреле 2021 года.
Есть потребность в информации? Надо еёпредоставить!
Перепись населения — это сотни томов таблиц, бесконечные столбцы и строки в Excel… Еще десять лет назад, несмотря на высокий уровень компьютеризации российского общества, эта информация была понятна лишь узким профессионалам и фанатам статистики. Те, кто не умел работать с «сырыми» цифрами, со сложными таблицами или написать хитрый код для анализа разрозненных данных, испытывали настоящую скуку от обилия «ненужных» чисел.
Однако интерес к данным значительно увеличился как со стороны бизнеса, так и со стороны простых людей. Раз есть потребность в информации, значит, надо ее предоставить. Цифровые инструменты позволяют открыть перепись заново и в буквальном смысле показать каждому, какую бесценную информацию она содержит. И один из таких инструментов — BI-платформа.
Это полностью российское решение для сбора и визуализации данных, которое примет всю информацию примерно от 147 млн жителей страны (точнее узнаем уже после завершения переписи-2021). Сведения поступят с планшетов переписчиков, с портала госуслуг (где россияне смогут ответить на вопросы переписи), бумажных анкет (для тех, кто хочет заполнить по старинке). Технология позволит аккумулировать и обрабатывать данные ежедневно, но гораздо более заметная эволюция произойдет в их презентации. Огромный цифровой поток будет преобразован в яркие графические презентации для широкого круга пользователей.
Пилотирование платформы прошло достаточно успешно на этапе подготовки к переписи. Для отслеживания готовности регионов был создан ситуационный центр, куда автоматически стекалась вся информация. Благодаря этому появилась возможность в режиме реального времени увидеть, как обстоят дела в любом районе, и оперативно отправить помощь туда, где это было необходимо. При этом все данные защищены от утечек, за этим очень строго следит Федеральная служба по техническому и экспортному контролю.
Внедряя новую систему, мы рассчитываем, что всего через полтора года после завершения переписи (это обещает быть рекордом скорости по обработке результатов) оценить преимущества BI-платформы сможет каждый желающий. Разработчики сейчас доделывают набор инструментов, с помощью которых на интерактивных картах страны, регионов, городов можно будет вывести информацию о том, сколько мужчин и женщин, детей и пожилых здесь проживают; какое количество граждан имеет высшее образование, сколько людей живут на пенсию, много ли многодетных семей и т. д. Планируется демонстрировать таким образом статистику занятости и образования, состава семей. Технология предусматривает возможность увидеть цифры за последние несколько лет, сравнить их со статистикой соседнего региона или укрупнить масштаб до микрорайонов. Правда, «дойти» до конкретного дома не получится, чтобы не нарушать главное правило переписи — деперсонификацию.
Внешний контур планируется в первую очередь приоткрыть для федеральных и региональных вузов, где готовят экономистов, статистиков. Они получат доступ к данным еще во время самой переписи, чтобы понимать, как проходит процесс в разных регионах. Также приоритетные права будут у СМИ и экспертов. Первые интерактивные отчеты с BI-платформы ожидаются уже в этом году.
Новые инструменты, успешно проявившие себя на этапе подготовки и проведения переписи, планируется применять и для других продуктов Росстата. Наша цель — трансформировать все сухие табличные данные в понятные отчеты, открыть статистику по промпроизводству или по динамике потребительских цен на информационных панелях, где можно мгновенно выстроить график, наложить статистику на карту, посмотреть пересечение показателей. Наш новый дашборд позволяет пользователю выбрать тот набор показателей, на основе которых он хочет построить аналитическую работу. Это может быть кастомизированная формула на микросрезах данных — все инструменты для этого платформа предоставляет.
И чиновникам, и бизнесу
Столь же удобным призвано стать получение информации для наших основных «клиентов» — чиновников различных уровней. Чтобы обеспечить власти населенных пунктов информацией для планирования, мы еще недавно обрабатывали около 10 тыс. запросов в год, или более 30 ежедневно. Во время прошлой переписи населения нам казалось, что сократить этот поток практически нереально. Теперь понимаем: именно в этом и заключается одна из задач статистики будущего — предоставить людям прямой доступ к нужной информации.
Благодаря новым цифровым технологиям у главы региона появляется возможность в несколько кликов получить нужную ему концентрированную информацию, у муниципалов — еще более детализированную. Например, после переписи 2010 года мы получили запрос от властей Подмосковья на информацию, которая позволяла лучшим образом реализовать проект строительства новых заводов.
Данные о числе жителей мужского пола определенного возраста и образования позволяли понять, какие ресурсы имеются в регионе, сделать уточненный бизнес-план и привлечь инвестора. Но на получение первичной статистики требовалось время. «Умные» статистические системы увеличивают скорость подобных расчетов. А это вопрос выживания и лидерства в конкуренции, в том числе и на глобальных рынках.
Ещё один потребитель статистической информации — бизнес. Для предпринимателя крайне важно знать половозрастные характеристики населения в конкретных точках страны, видеть демографические тренды. Эта информация позволяет решить, открывать ли в этом регионе детский магазин, строить ли завод, будет ли для его продукции спрос и рабочая сила. Наверное, показательнее всего интерес к платформе Росстата со стороны «Яндекса». Российский IT-гигант хочет использовать наши данные для наполнения информацией собственных карт, где будут стоять геометки и визуальные «фишечки» самой компании и партнеров.
Нам статистики не жалко — пусть берут все, кому это надо: мы открыты всегда и, самое главное, не собираемся зарабатывать на россиянах, то есть поделимся данными бесплатно.