Машинопечатный формат что это
В Соединенных Штатах Закон об открытых правительственных данных от 14 января 2019 года определяет машиночитаемые данные как «данные в формате, который может легко обрабатываться компьютером без вмешательства человека, при этом не теряется семантическое значение». Закон предписывает федеральным агентствам США публиковать общедоступные данные таким образом, чтобы «любые общедоступные данные агентства были машиночитаемыми».
Расширяемый язык разметки (XML) предназначен для чтения как человеком, так и машиной, а преобразование расширяемого языка таблиц стилей (XSLT) используется для улучшения представления данных для удобства чтения человеком. Например, XSLT можно использовать для автоматической визуализации XML в формате переносимого документа (PDF). Машиночитаемые данные могут быть автоматически преобразованы для удобства чтения человеком, но, вообще говоря, обратное неверно.
В целях реализации Закона о модернизации Закона о деятельности и результатах правительства (GPRA) Управление управления и бюджета (OMB) определяет «машиночитаемый формат» следующим образом: «Формат на стандартном компьютерном языке (не английский текст), который может быть автоматически читаются веб-браузером или компьютерной системой (например, xml). Традиционные документы текстовых редакторов и файлы в формате переносимых документов (PDF) легко читаются людьми, но обычно их трудно интерпретировать машинами. Другие форматы, такие как расширяемый язык разметки ( XML), (JSON) или электронные таблицы со столбцами заголовков, которые можно экспортировать как значения, разделенные запятыми (CSV), являются машиночитаемыми форматами. Поскольку HTML является структурным языком разметки, незаметно маркируя части документа, компьютеры могут собирать компоненты документа. для составления оглавлений, схем, библиографий для поиска по литературе и т. д. Можно сделать традиционные текстовые документы и другие форматы машиночитаемыми, но документы должны включать улучшенные структурные элементы «.
Смотрите также
использованная литература
Определение
Машиночитаемость имеет как минимум четыре аспекта:
Еще в 1983 году Счетная палата правительства США (GAO) начала подчеркивать преимущества машиночитаемой информации. Еще раньше, в 1981 году, GAO начало сообщать о проблеме неадекватной практики ведения документации в федеральном правительстве США. Такие недостатки присущи не только правительству, а достижения в области информационных технологий означают, что большая часть информации теперь «рождается в цифровом виде» и, следовательно, потенциально гораздо легче управлять с помощью автоматизированных средств. Однако в показаниях Конгрессу в 2010 году GAO подчеркнуло проблемы с управлением электронными записями, и совсем недавно, в 2015 году, GAO продолжало сообщать о несоответствиях в деятельности агентств исполнительной ветви в соблюдении требований к управлению записями. Более того, более чем через два десятилетия после того, как крупная и ранее весьма уважаемая аудиторская компания Arthur Andersen прекратила свое существование из-за скандала с уничтожением документации, практика ведения документации стала центральным вопросом на президентских выборах 2016 года.
4 января 2011 года президент Обама подписал HR 2142, Закон о модернизации деятельности и результатах правительства (GPRA) от 2010 года (GPRAMA), в качестве закона PL 111-352. Раздел 10 GPRAMA требует, чтобы федеральные агентства США публиковали свои стратегические и производственные планы и отчеты в машиночитаемом формате с возможностью поиска. Кроме того, в 2013 году, он издал правительственное распоряжение 13642, Изготовление Открыть и машиносчитываемой Новое По умолчанию для правительственной информации в целом. 28 июля 2016 г. Управление по управлению и бюджету (OMB) включило в пересмотренный выпуск Циркуляра A-130 указание агентствам использовать открытые машиночитаемые форматы и публиковать «общедоступную информацию в Интернете способом». который способствует анализу и повторному использованию для максимально широкого круга целей «, что означает, что информация является общедоступной и машиночитаемой. 14 января 2019 года президент Трамп подписал закон HR 4174, Закон об открытых государственных данных (OGDA), который закрепляет в законе требование к агентствам предоставлять свои общедоступные информационные активы в машиночитаемом формате. 28 июня 2019 г. в Циркуляре A-11 OMB выразило намерение начать соблюдать раздел 10 GPRAMA.
Визуализация данных и машиночитаемый формат
В соответствии со Стратегией Генерального секретаря в отношении повсеместного использования данных для всех Департамент по делам Генеральной Ассамблеи и конференционному управлению (ДГАКУ) попытался выявить конкретные области в сфере конференционного управления, в которых углубленная интеграция данных позволила бы оказывать новые, более совершенные и инновационные услуги и добиться повышения эффективности работы, дав Департаменту возможность выйти за рамки «философии бумажного документооборота».
Благодаря инновационному применению методов обработки текстов с использованием искусственного интеллекта и естественного языка Департамент разработал в рамках проекта gText приложение, которое автоматически конвертирует резолюции Генеральной Ассамблеи в формат XML с использованием схемы «Акома Нтосо для Организации Объединенных Наций» (AKN4UN).
Это приложение также позволяет извлекать из внешних систем и добавлять в файлы в формате XML дополнительные метаданные, такие как сведения об авторах проекта, информация о результатах голосования и указание на соответствующие цели, задачи и показатели целей в области устойчивого развития при помощи уникальных идентификаторов UN SDG Taxonomy («Классификатор ЦУР ООН»), а также соответствующие категории из тезаурусов ЮНБИС и Европейского союза (EuroVoc).
Департамент рассчитывает на то, что использование в его приложениях наилучших источников данных в соответствии с новой моделью управления данными позволит справиться с разрозненностью этих данных и перейти от их «сбора» к «объединению», сведя к минимуму риск ошибок и расхождений на разных этапах производственной цепочки.
Документы в машиночитаемом формате с дополнительными метаданными используются Департаментом для автоматического генерирования официальных сборников резолюций Генеральной Ассамблеи, что позволяет многократно уменьшить затраты труда на их подготовку, поскольку до сих пор составление этих сборников требовало скрупулезного копирования вручную данных, разбросанных по целому ряду различных источников.
Кроме того, для облегчения проведения исследовательской работы и разработки новых приложений в сфере обработки естественного языка Департамент решил предоставить другим структурам и исследователям возможность загружать эти документы в формате XML для их использования в качестве исходных материалов в процессе экспериментальной разработки новых услуг и приложений, которые могут помочь выявить взаимосвязи между документами Организации Объединенных Наций и наглядно отобразить их в виде графиков и диаграмм, сделав их тем самым ясными и понятными.
В качестве апробации концепции и для иллюстрации возможностей, открывающихся при использовании документов в машиночитаемом формате, Департамент разработал ряд интерактивных панелей, отображающих данные, содержащиеся в файлах в формате XML. Хочется надеяться, что это вдохновит коллег и других исследователей на активное применение данной технологии и максимально широкое использование документов Организации Объединенных Наций.
Резолюции Генеральной Ассамблеи
Чтобы воспользоваться интерактивной панелью или загрузить файлы в формате XML из открытой базы данных, щелкните на изображение.
Резолюции Совета Безопасности
Чтобы воспользоваться интерактивной панелью или загрузить файлы в формате XML из открытой базы данных, щелкните на изображение.
Наш адрес
Дополнительную информацию можно получить, просмотрев видеоматериал о машиночитаемых документах или связавшись с Департаментом по адресу untranslation@un.org.
Отказ от ответственности и условия пользования
Машиночитаемое право: возможно ли его применение в ближайшем будущем?
AnSim / Depositphotos.com |
В рамках дискуссии эксперты высказали свое мнение по вопросу актуальности машиночитаемого права, а также высказали свои предположения о том, как такой формат повлияет на повседневную деятельность. Анна Серебряникова, президент Ассоциации участников рынка больших данных, управляющий партнер Nlogic, отметила, что переход к машиночитаемому праву неизбежен и процесс уже начат. Эксперт обратил внимание на то, что в повседневной жизни юристы уже пользуются автоматизацией, например, при использовании справочно-правовых систем, таких как, например, ГАРАНТ. Использования таких средств положительно влияет на производительность труда.
Первый заместитель председателя Банка России Сергей Швецов считает, что машиночитаемое регулирование, машиночитаемое право и машиночитаемое правосудие займут место в системе в ближайшее время, причем процесс произойдет быстрее, чем этого ожидают. Среди положительных факторов применения машиночитаемого права эксперт называет: рост производительности труда, единство правоприменения (подразумевает централизованное развитие нейронной сети и использование алгоритмов вместо команды юристов), экономия издержек на развитие законодательства. Сергей Синицын видит в применении машиночитаемого права экономию трудовых и временных ресурсов. Праву следует учитывать технологический прогресс, а в будущем возможно изменение юридического мышления – однако, это процесс последовательный, подчеркнул эксперт. При этом он считает, что на данный момент есть все основания вести дискуссию о том, что «в праве сложились достаточные условия, чтобы обсудить перспективу развития и локализацию машиночитаемого права».
Наряду с положительными сторонами Сергей Швецов обращает внимание и на сложности: для использования машиночитаемого права следует создавать целую экосистему – так, например, модификацию претерпит юридическая профессия – часть юристов, задействованных в работе сейчас, будут не востребованы впоследствии. Однако, положительный опыт внедрения автоматизации есть: так, внедрение в финансовой сфере смарт-контрактов и роботизированного кредитования и замена клерков на компьютеры прошла успешно, считает эксперт. Еще одним острым вопросом выступает психологический фактор – уровень доверия общества компьютерным системам, в особенности когда дело касается жизненно важных вопросов. И третьей сложностью Сергей Швецов выделил проблему управления информационными системами.
О трансформации юридической профессии в технический уклон высказала свое мнение Анна Серебряникова. Она напомнила, что в данный момент все больше юристов изучают программирование, а некоторые вузы включают программирование в юридическую учебную программу. Все это связано с трансформацией профессии юриста, но не полном ее исчезновении – творчество и умение принимать решения отличает человек от информационных систем, считает эксперт.
Одним из ключевых вопросов развития машиночитаемого права является вопрос предела автономности процесса, а также уровня контроля (или в целом присутствия) человека в таком процессе, считает Сергей Синицын. Эксперт считает, что процесс применения машиночитаемого права будет постепенным и многоэтапным, а развиваться он будет в соответствии с развитием технологических отношений – о единовременном переходе к машиночитаемому праву говорить не приходится. Уровень развития искусственного интеллекта и машиночитаемость на данный момент не находятся на той стадии, когда можно говорить о полной автономности систем, заметила Анна Серебрянникова. Сложность алгоритма прямо пропорциональна знанию о том, как он работает, замечает эксперт – именно поэтому может быть трудно доверить функции алгоритму, когда о его работе известно достаточно немного.
При этом полный переход от человекочитаемого права к машиночитаемому невозможен, считает Анна Серебряникова. Это связано с наличием широкого круга людей, которые применяют право и должны его понимать. Эксперт считает, что эти две системы будут сосуществовать и функционировать вместе.
Первоочередной задачей выступает поиск ответа на вопрос о том, для чего в целом требуется машиночитаемое право, заметил заместитель генерального директора, директор по цифровой трансформации АО ОХК «Уралхим» Савва Шипов. Без понимания целей и способов использования машиночитаемого права на практике будет затруднительно развивать вектор направления развития нового института. Так, например, для финансового рынка одним из первичных задач является роботизация комплаенс-процессов и процесса контроля за соблюдением того регулирования, которое выпускает регулятор, – например, расчет обязательных нормативов, контроль за функционированием искусственного интеллекта в сфере финансового консультирования, отметил Сергей Синицын. Эксперт также приводит в пример тот факт, что при внедрении роботизации на кредитном конвейере была исключена коррупция при выдаче кредита, а сами роботы показали эффективность лучше офисных работников, принимающих решения о выдаче кредита.
1 Ознакомиться с концепцией развития технологий машиночитаемого права можно на сайте Сколково.
Кабмин утвердил концепцию развития машиночитаемого права
Правительственная комиссия по цифровому развитию под руководством вице-премьера Дмитрия Чернышенко утвердила концепцию развития технологий машиночитаемого права, то есть понятного для компьютерных алгоритмов, которая была разработана в Минэкономразвития. Об этом сообщили в пресс-службе министерства.
Концепция — первый в России официальный документ в сфере машиночитаемого права. Она систематизирует представления о данных технологиях и определяет основные направления их развития.
Отмечается, что машиночитаемое право включает в себя нормы права, которые изложены на формальном языке — на языках программирования и разметки текста, применимых для ЭВМ. Кроме того, в машиночитаемое право входят инструменты применения таких норм: информационные системы и ПО. Благодаря этим технологиям, нормативно-правовые акты переводятся в компьютерный код.
В правительстве считают, что машиночитаемое право будет востребовано в законотворчестве, судопроизводстве, при заключении сделок, стандартизации и сертификации. Так, искусственный интеллект сможет сопоставлять тексты разных правовых актов и автоматически выдавать юристам применяемые нормы. Бизнес, благодаря платформам на этой технологии, сможет автоматически проверять, правильно ли составлены юридические документы, в частности контракты и договоры. Сейчас, например, технологии машиночитаемого права отчасти применяются при работе видеорегистраторов на дорогах.
Ранее вице-президент по развитию и планированию фонда «Сколково» Сергей Израйлит рассказал РБК, что есть несколько направлений, на которые такие технологии могут повлиять. Так, с их помощью у граждан появится возможность разбираться с разными правовыми документами: договорами, согласиями на обработку персональных данных и др. По его мнению, выполнение требований различных административных процедур для гражданина может упроститься за счет того, что программное обеспечение сможет воспринимать и обрабатывать правовую информацию, а в дальнейшем — повысить качество защиты интересов россиян при возникновении споров или судебных разбирательств.
Технологиями машиночитаемого права, по его словам, уже заинтересовался Центробанк. Минюсту, Минпромторгу и Росстандарту они позволят разработать машиночитаемые стандарты, Минэкономразвития — машиночитаемые требования, которые будут использоваться в контрольно-надзорной деятельности. Федеральная налоговая служба при развитии электронного документооборота тоже, скорее всего, будет использовать информацию о правоотношениях, заключил Израйлит.