Хакатон «Audithon 2021», Росводоресурсы примут участие

Хакатон «Audithon 2021»

С 25 по 28 марта Счётная палата РФ проведёт хакатон «Audithon 2021» для решения задач цифровой трансформации. Участники выполнят 21 задание по аналитике и визуализации данных. 

Призовой фонд мероприятия – 1 миллион рублей. Также победители получат возможность продолжить работу над решением задачи совместно с Счетной палатой и ее официальными партнерами по хакатону.

Хакатон «Audithon 2021» — уже третье открытое соревнование по аналитике данных Счетной палаты. В 2019 году состоялся хакатон «DataAudit», а в 2020 был проведен конкурс «DataContest». 

Принять участие в новом хакатоне может каждый: заявки принимаются как от готовых команд, так и от индивидуальных участников из любой точки России. Финальный отбор и награждение победителей будет проходить в четырех номинациях: 

  • Визуализация данных
  • Аналитика данных
  • Программное решение
  • Нестандартное решение (специальная номинация) 

Заявки от участников принимают до 23 марта включительно на официальном сайте мероприятия http://audithon.ru/. В команду могут войти разработчики и пользователи ПО в области анализа данных, специалисты по поиску данных в открытых источниках, дизайнеры, журналисты и др.

«Все задачи, которые предстоит решать участникам «Audithon 2021», — это совершенно реальные кейсы по аналитике данных, с которыми имеют дело сотрудники Счетной палаты и организаций-партнеров по проведению этого хакатона. Стратегия развития Счетной палаты предусматривает использование цифровых решений, и мы видим, что технологии действительно становятся все более востребованными во всех областях и направлениях контрольно-счетной деятельности. Идеи и разработки, возникающие в результате проведения открытых конкурсов, позволяют опробовать новые методы аналитической работы с данными каждому сотруднику, что меняет культуру организации и ускоряет трансформационные процессы», – заявил директор Департамента цифровой трансформации Счетной палаты РФ Михаил Петров. 

Хакатон «Audithon 2021» решает 6 задач непосредственно связаных с природоохранной тематикой

ЗАДАЧА 1 — Построение цепочки движения средств федерального бюджета до конечного получателя в рамках федерального проекта «Оздоровление Волги»

Краткое описание проблематики:

Завышение затрат на выполнение мероприятий федерального проекта «Оздоровление Волги» получателями средств федерального бюджета.

Ожидаемый результат:

Последовательная детализация объема финансирования от получателя до субподрядчика мероприятий федерального проекта «Оздоровление Волги» .

Формат решения:

Визуальное представление данных (дашборд).

Критерии оценки итогового продукта или решения:

  1. Удобство использования (характеристики: понятный интерфейс в разрезе получатель — подрядчик — субподрядчик);
  2. Достоверность;
  3. Полнота.

Ресурсы, позволяющие решить задачу:

  1. Схема расходов федерального проекта в разрезе кодов бюджетной классификации до получателя.
  2. Реестр контрактов, заключенных с целью реализации федерального проекта «Оздоровление Волги»

ЗАДАЧА 14 — Оценка достижения стратегических целей в сфере экологической безопасности Арктической зоны Российской Федерации

Краткое описание проблематики:

Стратегия развития Арктической зоны РФ до 2035 года, утвержденная в 2020 году, определила 14 целей в сфере обеспечения экологической безопасности. Крайне важно своевременно оценивать их достижение, а также прогнозировать их изменение на горизонте до 2035 года. Для эффективности этого анализа важно выбрать соответствующие индикаторы оценки по каждой из целей.

Ожидаемый результат:

Набор индикаторов для оценки реализации Стратегии.

Формат решения:

Графики с описанием и обоснованием выбранной методики расчета.

Критерии оценки:

  1. Достоверность;
  2. Полнота покрытия целей.

ЗАДАЧА 15 — Визуализация динамики состояния окружающей среды в регионах России

Краткое описание проблематики:

Аудит в области экологии – одно из ключевых направлений деятельности Счетной палаты Российской Федерации. Ведомство проводит постоянный мониторинг этой сферы и модернизирует методики оценки. Разработанный набор индикаторов, характеризующий состояние окружающей среды, и дальнейшая визуализация помогут наглядно показать, насколько хорошо мы заботимся о нашей природе.

Ожидаемый результат:

Набор индикаторов, характеризующих состояние окружающей среды, и визуализация значений этих индикаторов: по шкале времени (предлагаемый интервал: с 2010 по 2020 гг) и на карте субъектов Российской Федерации.

Формат решения:

Интерактивная тепловая карта (хороплет) с возможностью листания временной шкалы и визуализацией отдельных показателей в виде графиков.

Критерии оценки:

  1. Достоверность;
  2. Полнота показателей;
  3. Использование Big Data.

*Сложность решения задачи на примере регионов, входящих в Арктическую зону РФ (АЗРФ), состоит в том, что в АЗРФ входят 4 субъекта РФ полностью, а 5 субъектов РФ входят частично. От команды требуется творческое решение этой задачи.

ЗАДАЧА 16 — Сравнительный анализ расходов на охрану окружающей среды по субъектам РФ

Краткое описание проблематики:

Не все субъекты Российской Федерации имеют одинаковые расходы (в том числе удельные) на охрану окружающей среды. Решение этой задачи поможет продемонстрировать разницу в этих расходах на охрану окружающей среды в каждом из субъектов Российской Федерации.

Ожидаемый результат:

  1. Интерактивная тепловая карта (хороплет);
  2. Рейтинг субъектов.

Формат решения:

Web-страница с интерактивной тепловой картой.

Критерии оценки:

  1. Достоверность;
  2. Полнота решения.

ЗАДАЧА 18 — Визуальная схема данных о воде

Краткое описание проблематики:

Росводресурсы регулярно актуализируют информацию о качестве воды в России. Для этих целей существует нескольких информационных систем. Наборы данных в этих системах не связаны между собой: у разных дата-сетов разная логика построения, данные дублируются. Фактически сейчас в работе используются не «данные», а «документированные формы», с которыми работают люди — не машины.

Задача состоит в том, чтобы провести анализ совокупности дата-сетов на предмет дублирования данных. Также необходимо провести логическую проверку на связанность данных в разных формах. Далее необходимо создать визуальную модель единого дата-сета о воде, которая будет построена на основе анализа 4-х различных дата-сетов. Модель должна визуально отражать логические связи между различными сущностями. На основе данной модели нужно построить единый дата-сет.

Итоговый дата-сет поможет сделать данные о воде более публичными и читаемыми, чтобы их могли использовать люди для дальнейшего анализа.

Ожидаемый результат:

Визуальная модель единого дата-сета о воде, построенная на основе анализа 4-х различных дата-сетов. Модель визуально отражает логические связи между различными сущностями. На основе данной модели построен единый дата-сет.

Формат решения:

Web-интерактивная визуальная модель дата-сета.

Критерии оценки:

Наглядность данных:

  1. Представлен алгоритм формирования единого дата-сета, который использует максимально возможное количество данных из представленных дата-сетов (алгоритм должен учитывать сценарий сопоставления объектов и сценарий выявления/устранения дублей). При этом дата-сет отвечает требованиям логической связанности и достаточности данных.
  2. Сформирован единый универсальный дата-сет, учитывающий максимально возможное использование данных из представленных дата-сетов.
  3. Определены ключевые атрибуты, по которым можно установить однозначное соответствие объектов в разных дата-сетах.
  4. Представлены сценарии, по которым можно установить соответствие с определенной долей вероятности.
  5. Представлены перечни сопоставленных объектов и не сопоставленных объектов между различными дата-сетами.
  6. Представлен алгоритм выявления дублирования записей (определены сценарии выявления дублирования данных, приведены результаты выявления дублей).
  7. Алгоритм единого дата-сета должен также содержать схему связанности данных различных дата-сетов, из которых используются данные.
  8. Итоги оформлены в виде Web-интерактивной страницы со схемами алгоритмов/сценариев, а также набором результирующих дата-сетов (файлы – таблицы в формате xlsx).

Ресурсы, позволяющие решить задачу:

  1. Федеральное агенство организует выгрузку дата-сетов в формате csv.
  2. Бесплатные библиотеки визуализации данных.

ЗАДАЧА 19 — Корреляционный дашборд качества воды

Краткое описание проблематики:

Общественный мониторинг качества воды на основе открытых данных в настоящий момент отсутствует. Качество воды зависит от многих параметров, и в текущем виде данные не всегда поддаются системному анализу. Разработанное на хакатоне решение позволит создать сервис на основе открытых данных для мониторинга качества воды и анализа параметров, которые влияют на качество воды в России.

В текущем виде есть 4 дата-сета, которые характеризуются дублированием данных и отсутствием связанности данных. Задача минимум состоит в том, чтобы провести анализ совокупности дата-сетов на предмет корреляций. Задача максимум — построить предиктивные модели (структурирование данных для этого не обязательно). Главное, чтобы получился красивый, информативный дашборд. Дашборд должен представлять собой набор инструментов визуализации зависимости (корреляции) качества воды от иных параметров (водопользование, качество дна, подземные воды, сооружения и другие). На основе этих инструментов всем желающим должно быть удобно проводить открытый мониторинг качества воды.

Ожидаемый результат:

Набор инструментов визуализации зависимости (корреляции) качества воды от иных параметров (водопользование, качество дна, подземные воды, сооружения и другие).

Формат решения:

Web-интерактивный дашборд.

Критерии оценки:

Наглядность данных:

  1. Определены ключевые атрибуты, по которым можно установить однозначное соответствие объектов в разных дата-сетах.
  2. Представлены сценарии, по которым можно установить соответствие с определенной долей вероятности.
  3. Представлены перечни сопоставленных объектов и не сопоставленных объектов между различными дата-сетами.
  4. Представлен алгоритм выявления дублирования записей (определены сценарии выявления дублирования данных, приведены результаты выявления дублей).
  5. Представлен алгоритм(ы) выявления зависимости (корреляции) качества воды от иных параметров (водопользование, качество дна, подземные воды, сооружения и другие).
  6. Представлено максимально возможное количество дашбордов (графиков/диаграмм/таблиц, в т.ч. визуализация на интерактивных гео-картах) отражающих принцип работы алгоритма(ов) выявления корреляции.
  7. Итоги оформлены в виде Web-интерактивной страницы со схемами алгоритмов/сценариев, а также набор результирующих дата-сетов (файлы – таблицы в формате xlsx).

Ресурсы, позволяющие решить задачу:

  1. Федеральное агенство организует выгрузку дата-сетов в формате csv.
  2. Бесплатные библиотеки визуализации данных.

Росводоресурсы принимают участие в хакатоне

Росводресурсы предложат командам разработать визуальную схему данных о воде в виде единого дата-сета на основе анализа 4-х различных систем. Кроме того, предстоит создать корреляционный дашборд качества воды. Такой набор инструментов покажет зависимость качества воды от водопользования, состояния дна водного объекта, подземных вод или других показателей, с которыми участники найдут зависимости.

Результаты работы будут оценивать руководитель проектов цифровой трансформации Росводресурсов Андрей Варнавский и начальник отдела информационного обеспечения и цифровой трансформации Росводресурсов Анастасия Бурякова, которые вошли в состав жюри.

«Мы впервые даём молодому научному сообществу возможность протестировать то, что есть у нас. Наша цель – не только придумать задания, интересные для участников, но и посмотреть, насколько наш набор данных применим в том или ином формате», — отметил Андрей Варнавский. 

Итоги хакатона Счетной палаты «Audithon 2021» будут подводить по номинациям «Визуализация данных», «Аналитика данных», «Программное решение» и «Нестандартное решение» (специальная номинация).

Заполняя поля комментариев и других форм обратной связи, Вы соглашаетесь с «ПОЛИТИКОЙ КОНФИДЕНЦИАЛЬНОСТИ»

Оставьте первый комментарий

Оставить комментарий

Ваш электронный адрес не будет опубликован.


*


Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.