Что означает для страны открытие государством баз данных
Во понедельник, 18 апреля, Министерство юстиции выложило в свободный доступ данные Единого государственного реестра юридических и физических лиц, которые каждый может загрузить в полном объеме и без регистрации.
Об этом сообщил заместитель гендиректора по техническим вопросам госпредприятия Информационно-ресурсный центр (входит в Минюст) Алексей Зеливянский. "1,2 Гб текстовых данных в формате CSV, около 5,5 млн записей. В выборку попадают абсолютно все предприятия и ФОП, в том числе уже закрытые", - написал он в Facebook.
Что такое "большие данные"
Украина сделала первый шаг к формированию рынка открытых данных в марте 2015 года, когда парламент принял законопроект, предусматривавший создание единого государственного веб-портала открытых данных. Речь идет о сайте, где будет собрана статистическая информация от всех ведомств в едином формате. Такие данные можно будет легко обрабатывать, анализировать и систематизировать.
В ноябре 2015 г. Кабмин принял соответствующее постановление, в котором прописал порядок открытия перечня, состоящего из более 300 первоочередных наборов данных, многие из которых являются полноценными реестрами. Этот перечень будет регулярно дополняться новыми наборами данных, исходя из общественного спроса и инициативы государственных органов.
В открытый доступ решили передать всю нормативно-правовую базу Украины, реестр юрлиц и ФЛП, реестр административно-территориального устройства, реестр патентов Украины, реестр медицинских средств и цен на медицинские средства, финансовые планы госпредприятий, единый реестр спортивных сооружений, кадастр месторождений и проявлений полезных ископаемых Украины и т. д.
Все эти данные загружаются на Национальный портал открытых данных data.gov.ua. Он был создан еще в 2014 году по инициативе сооснователя общественной организации SocialBoost Дениса Гурского, советника тогдашнего премьер-министра Арсения Яценюка по вопросам открытых данных, на деньги USAID. Но, по сути, портал был пустым и с момента запуска не обновлялся.
Звездный час портала наступил весной 2016 года, когда подошел шестимесячный дедлайн выполнения госорганами постановления Кабмина - 21 апреля. На data.gov.ua начали загружать огромные массивы информации. Процесс идет динамично. По состоянию на вторник, 19 апреля, на портале было 888 наборов данных. Спустя сутки, 20 апреля - уже 946. Хотя, очевидно, многие уже не успеют сделать это вовремя.
Зачем это нужно
На портале не всегда появляются абсолютно новые данные, к которым граждане ранее никогда не имели свободного доступа. Как правило, они уже есть на сайтах госорганов-распорядителей. Например, на сайте Нацбанка есть данные о владельцев банков. А Единый госреестр юрлиц с 2013 года открыт на базе сайта Минюста. Однако все они имеют определенные ограничения в пользовании. Владельцы украинских банков указаны в PDF-документах. А данные о юрлицах требуют введения защитного кода для просмотра одной конкретной записи.
Открытые данные в машиночитаемом формате, по мнению чиновников, является шагом к прозрачной деятельности государственных органов и помощью в борьбе с коррупцией. Это также огромный рынок инновационных сервисов и платных услуг, которые могут быть созданы на базе этих данных. Бизнес сможет получать оперативные данные в виде электронных таблиц, станет проще общаться с инвесторами и партнерами. СМИ будет легче анализировать работу государства - на основе выложенной информации несложно построить интерактивную графику с помощью онлайн-инструментов вроде Google Charts.
Вот свежий пример анализа открытых данных из Единого реестра юрлиц и физлиц-предпринимателей - нашелся адрес массовой регистрации по ул. Мельникова 12 (г. Киев). "А, также - Мельникова 36, 81 и 2/10 и др. И все они учитываются при оценке качества победителя гостендера в нашей системе", - приводит пример соучредитель Бюро кредитных историй "Украинское кредитное бюро" Дмитрий Остапчук.
Единый реестр юрлиц - лишь один из примеров. В апреле Министерство Внутренних дела выложило в открытый доступ информацию о всех угнанных и находящихся в розыске транспортных средств. Сотни тысяч записей позволяют проанализировать не только на уровне областей, но и на уровне районов марки машин, угнанных там, цвет автомобилей, годам.
По сути, это первый шаг для создания в будущем на основе этой информации сервисов, которые дадут совершенно фантастические, на первый взгляд возможности. Например, идея превентивного выезда полиции - как в фильме "Особое мнение" Стивена Спилберга. В США эта идея перестала быть фантастикой еще в 2013 году, когда полиция Лос-Анджелесе приступила к тестированию в отдельных районах города, технологии, которая, по уверениям разработчиков, угадывает, где произойдет ограбление или угон автомобиля, в два раза лучше по сравнению с человеком.
Основываясь на статистических данных (ранее совершенных преступлениях, времени, месте), ПО, разработанное компанией PredPol, показывает на карте в мобильных устройствах патрульных "горячие точки", где с большей долей вероятности может произойти правонарушение. В команду разработчиков полицейского ПО входят математики, антропологи и криминологи.
Такие сервисы само государство, в данном случае МВД, создать просто не в состоянии. В конце 2015 года организация SocialBoost при поддержке Western NIS Enterprise Fund, компании "Майкрософт Украина" и правительства Украины объявила о запуске "1991 Open Data Incubator" - первого в Украине некоммерческого инкубатора IT-проектов на основе открытых данных. Проект призван "оцифровать" такие секторы экономики как агробизнес, энергетику, инфраструктурные проекты, государственные услуги для граждан и внутренние аналитические системы в государстве, наладив взаимодействие ИТ-разработчиков, общественных организаций и аналитических центров с органами государственной власти.
Пока не все гладко
Однако качество данных еще далеко от совершенства. Есть вопросы по достоверности и детализации. Сейчас во многих госструктурах эксперты оценивают уровень погрешности в базах данных - 40% и выше. Кроме того, многие массивы информации не содержат важные данные - в данных того же ЕГР, к примеру, нет информации о конечных собственниках компаний. По данным "ДС", это связано с отсутствием согласования со стороны Кабмина.
Также не все открываемые данные одинаково полезны. Многие госорганы пошли через чур формально к требованию открывать данные на портале data.gov.ua, начав откровенно "спамить", например, подборкой контактов региональных управлений, которые итак есть на их сайтах и никакой дополнительной ценности не представляют. Из-за этого банк данных уже немного перегружен "мусором".