Мегаобучалка Главная | О нас | Обратная связь


Возникновение языка XML и его задачи



2019-12-29 192 Обсуждений (0)
Возникновение языка XML и его задачи 0.00 из 5.00 0 оценок




Язык XML. Язык запросов X - Query .

 

 

Выполнили:

студентки 1 курса

отделения "Менеджмент"

Герасимова Серафима Валерьевна

Бизунова Вера Владимировна

 

 

Научный руководитель

Кожич П.П.

 

 

Минск 2007

Содержание

Содержание. 2

Введение. 5

Возникновение языка XML и его задачи. 7

Версии XML. 8

Достоинства. 8

Недостатки. 10

Язык SGML. 11

XML-генераторы. 12

DTD-определения. 13

Объектная модель документа (DOM) 14

Создание XML-документа. 17

Правила создания. 18

Структура документа. 19

Конструкции языка. 20

Элементы данных. 20

Комментарии. 22

Атрибуты. 23

Специальные символы. 23

Директивы анализатора. 24

CDATA.. 24

Определение типа документа(DTD) 25

Определение элемента. 26

Пример корректного XML- документа: 27

Определение атрибутов. 28

Типизация данных. 29

Схемы данных. 32

Внешний вид схем данных. 32

Область схемы данных. 33

Описание элементов. 34

Атрибуты элемента. 34

Модель содержимого элемента. 35

Иерархия классов. 38

Ограничения на значения. 38

Использование правил из внешних схем. 38

Типы данных. 39

Язык запросов XQuery. 42

Модель данных. 43

Иллюстрация запросной модели. 45

Выражения XQuery. 47

Основы. 47

Выражения пути. 48

Предикаты. 50

Конструкторы элементов. 53

Итерация и сортировка. 55

Арифметические операции. 58

Операции над последовательностями. 60

Условные выражения. 62

Кванторные выражения. 62

Функции. 63

Типы. 66

Проверка корректности. 67

Структура запроса. 67

Итоги. 68

XPath. 69

Основные элементы путей адресации. 69

Анализ выражения. 71

Оси. 72

Системные функции. 73

Функции с множествами. 74

Строковые функции. 75

Логические функции. 75

Числовые функции. 76

Способы просмотра XML-документов. 77

Отображение XML во Всемирной паутине. 78

Стилевые таблицы XSL. 79

Словари XML. 80

Приложение. 82

Пример XML-документа. 82

DTD-определение для XML-документа. 84

Заключение. 86

Список литературы. 88

Предметный указатель. 90

Для заметок. 92

 

Введение

 

XML (Extensible Markup Language) - это новый SGML-производный язык разметки документов, позволяющий структурировать информацию разного типа, используя для этого произвольный набор инструкций.

XML предназначен для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML), иногда называемых словарями. XML является упрощённым подмножеством языка SGML.

XML - это язык разметки, описывающий целый класс объектов данных, называемых XML- документами. Этот язык используется в качестве средства для описания грамматики других языков и контроля за правильностью составления документов.

Спецификация XML была предложена консорциумом W3C (организацией по стандартизации новых Web-технологий) в качестве рекомендации, утверждена в 1998 году.

Сегодня XML может использоваться в любых приложениях, которым нужна структурированная информация - от сложных геоинформационных систем, с гигантскими объемами передаваемой информации до обычных "однокомпьютерных" программ, использующих этот язык для описания служебной информации. Можно выделить множество задач, связанных с созданием и обработкой структурированной информации, для решения которых может использоваться XML:

• В первую очередь, эта технология может оказаться полезной для разработчиков сложных информационных систем, с большим количеством приложений, связанных потоками информации самой различной структурой. В этом случае XML - документы выполняют роль универсального формата для обмена информацией между отдельными компонентами большой программы.

• XML является базовым стандартом для нового языка описания ресурсов, RDF, позволяющего упростить многие проблемы в Web, связанные с поиском нужной информации, обеспечением контроля за содержимым сетевых ресурсов, создания электронных библиотек и т.д.

• Язык XML позволяет описывать данные произвольного типа и используется для представления специализированной информации, например химических, математических, физических формул, медицинских рецептов, нотных записей, и т.д. Это означает, что XML может служить мощным дополнением к HTML для распространения в Web "нестандартной" информации. Возможно, в самом ближайшем будущем XML полностью заменит собой HTML, по крайней мере, первые попытки интеграции этих двух языков уже делаются (спецификация XHTML).

• XML-документы могут использоваться в качестве промежуточного формата данных в трехзвенных системах. Обычно схема взаимодействия между серверами приложений и баз данных зависит от конкретной СУБД и диалекта SQL, используемого для доступа к данным. Если же результаты запроса будут представлены в некотором универсальном текстовом формате, то звено СУБД, как таковое, станет "прозрачным" для приложения. Кроме того, сегодня на рассмотрение W3C предложена спецификация нового языка запросов к базам данных XQL, который в будущем может стать альтернативой SQL.

• Информация, содержащаяся в XML-документах, может изменяться, передаваться на машину клиента и обновляться по частям. Разрабатываемые спецификации XLink и Xpointer позволят ссылаться на отдельные элементы документа c учетом их вложенности и значений атрибутов.

• Использование стилевых таблиц (XSL) позволяет обеспечить независимое от конкретного устройства вывода отображение XML- документов.

• XML может использоваться в обычных приложениях для хранения и обработки структурированных данных в едином формате.

XML-документ представляет собой обычный текстовый файл, в котором при помощи специальных маркеров создаются элементы данных, последовательность и вложенность которых определяет структуру документа и его содержание. Основным достоинством XML документов является то, что при относительно простом способе создания и обработки (обычный текст может редактироваться любым тестовым процессором и обрабатываться стандартными XML анализаторами), они позволяют создавать структурированную информацию, которую хорошо "понимают" компьютеры.

XML позволяет описывать и передавать такие структурированные данные, как:

• отдельные документы;

• метаданные, описывающие содержимое какого-либо узла Internet ;

• объекты, содержащие данные и методы работы с ними (например, элементы управления ActiveX или объекты Java);

• отдельные записи (например, результаты выполнения запросов к базам данных);

• всевозможные Web-ссылки на информационные и людские ресурсы Internet (адреса электронной почты, гипертекстовые ссылки и пр.).

Возникновение языка XML и его задачи

Язык XML был разработан группой XML Working Group (первоначально называемой SGML Editorial Review Board), сформированной в 1996 году под патронажем World Wide Web Consortium (W3C). Председательствовал в группе Jon Bosak из Sun Microsystems, принимавший также активное участие в работе группы XML Special Interest Group (ранее известной как SGML Working Group), которая тоже была сформирована W3C. Связь группы с W3C обеспечивает Dan Connolly.

При разработке языка XML ставились следующие задачи:

1. XML должен быть пригоден для непосредственного использования в Интернет.

2. XML должен иметь широкий круг применения.

3. XML должен быть совместим с SGML.

4. Обработчики документов XML должны быть просты в написании.

5. Количество факультативных свойств в XML должно быть сведено к абсолютному минимуму, в идеале число их вообще должно быть нулевым.

6. XML документы должны быть удобны для чтения и достаточно понятны.

7. Подготовка XML документа должна осуществляться быстро.

8. Процедура построения XML документа должна быть формальной и точной.

9. Процедура создания XML документов должна быть проста.

10. Краткость при разметке XML документа имеет минимальное значение.

Данная спецификация в сочетании с остальными связанными с нею стандартами (Unicode и ISO/IEC 10646 для символов, Internet RFC 1766 для тэгов идентификации языка, ISO 639 для кодов с названием языка и ISO 3166 для кодов с названием страны) дает всю необходимую информацию для понимания языка XML (версия 1.0) и создания компьютерных программ для его обработки.

Версии XML

• XML 1.0

• XML 1.1

Достоинства

• XML (человеко-ориентированный) — это формат, одновременно понятный и человеку и компьютеру.

• XML поддерживает Юникод.

• В формате XML могут быть описаны основные структуры данных — такие как записи, списки и деревья.

• XML — это самодокументируемый формат, который описывает структуру и имена полей также как и значения полей.

• XML имеет строго определённый синтаксис и требования к парсингу, что позволяет ему оставаться простым, эффективным и непротиворечивым.

• XML также широко используется для хранения и обработки документов как он-лайн, так и офф-лайн.

• XML — формат, основанный на международных стандартах.

• Иерархическая структура XML подходит для описания практически любых типов документов.

• XML представляет собой простой текст, свободный от лицензирования и каких-либо ограничений.

•   XML не зависит от платформы.

• XML является подмножеством SGML (который используется с 1986 года). Уже накоплен большой опыт работы с языком и созданы специализированные приложения.

• XML не накладывает требований на расположение символов на строке.

Одним из очевидных достоинств XML является возможность использования его в качестве универсального языка запросов к хранилищам информации. Сегодня в глубинах W3C находится на рассмотрении рабочий вариант стандарта XML-QL(или XQL), который, возможно, в будущем составит серьезную конкуренцию SQL. Кроме того, XML-документы могут выступать в качестве уникального способа хранения данных, который включает в себя одновременно средства для разбора информации и представления ее на стороне клиента. В этой области одним из перспективных направлений является интеграция Java и XML - технологий, позволяющая использовать мощь обеих технологий при построении машинно-независимых приложений, использующих, кроме того, универсальный формат данных при обмене информации.

XML позволяет также осуществлять контроль за корректностью данных, хранящихся в документах, производить проверки иерархических соотношений внутри документа и устанавливать единый стандарт на структуру документов, содержимым которых могут быть самые различные данные. Это означает, что его можно использовать при построении сложных информационных систем, в которых очень важным является вопрос обмена информацией между различными приложениями, работающими в одной системе. Создавая структуру механизма обмена информации в самом начале работы над проектом, менеджер может избавить себя в будущем от многих проблем, связанных с несовместимостью используемых различными компонентами системы форматов данных.

Недостатки

· Синтаксис XML избыточен.

o Размер XML документа существенно больше бинарного представления тех же данных. В грубых оценках величину этого фактора принимают за 1 порядок (в 10 раз).

o Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON) и особенно в форматах данных оптимизированных для конкретного случая использования.

o Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.

o Для большого количества задач не нужна вся мощь синтаксиса XML и можно использовать значительно более простые и производительные решения.

· XML не содержит встроенной в язык поддержки типов данных. В нём нет понятий «целых чисел», «строк», «дат», «булевых значений» и т.д.

· Иерархическая модель данных, предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами.

· Пространства имён XML сложно использовать и их сложно реализовывать в XML парсерах.

· Существуют другие, обладающие сходными с XML возможностями, текстовые форматы данных, которые обладают более высоким удобством чтения человеком (YAML , JSON, SweetXML).

 

 

Язык SGML

Standard Generalized Markup Language (SGML) - это некий метаязык, на котором можно определять язык разметки для документов. SGML — наследник разработанного в 1960 году в IBM языка GML (Generalized Markup Language).

Изначально SGML был разработан для возможности совместного использования машинно-читаемых документов в больших правительственных и аэрокосмических проектах. Также он широко использовался в печатной и издательской сфере, но его сложность затруднила его широкое распространения для повседневного использования.

Три основные части SGML документа, это

1. SGML декларация;

2. Document Type Definition;

3. Содержимое SGML-документа, по крайней мере, должен быть корневой элемент.

SGML предоставляет множество вариантов синтаксической разметки для использования различными приложениями. Изменяя SGML Declaration можно даже отказаться от использования угловых скобок, хотя, этот синтаксис считается стандартным, так называемым concrete reference syntax.

Пример SGML синтаксиса:

<QUOTE TYPE="example">

typically something like <ITALICS>this</ITALICS>

</QUOTE>

И HTML и XML произошли от SGML. HTML это некоторое приложение SGML, а XML это подмножество SGML, разработанное для упрощения процесса машинного разбора документа. Другими приложениями SGML является SGML Docbook (документирование), и «Z Format» (типографика и документирование).

XML-генераторы

XML-документы могут служить промежуточным форматом для передачи информации от одного приложения к другому (например, как результат запроса к базе данных), поэтому их содержимое иногда генерируется и обрабатывается программами автоматически. Далеко не всегда XML документ нужно создавать вручную.

Пусть, например, нашей задачей является создание формата хранения данных регистрации каких-то происходящих в системе событий (log-файла). В простейшем случае можно ограничиться фиксированием успешных и ошибочных запросов к нашим ресурсам - в таком документе должна присутствовать информация о времени произошедшего события, его результате (удача/ошибка), IP адресе источника запроса, URI ресурса и коде результата.

Наш XML документ может выглядеть следующим образом:

<?xml version="1.0" encoding="koi-8"?>

 <log>

 <event date=" 27/May/1999:02:32:46 " result="success">

 <ip-from> 195.151.62.18 </ip-from>

 <method>GET</method>

 <url-to> /misc/</url-to>

 <response>200</response>

 </event>

 <event date=" 27/May/1999:02:41:47 "

result="success">

 <ip-from> 195.209.248.12 </ip-from>

 <method>GET</method>

 <url-to> /soft.htm</url-to>

 <response>200</response>

 </event>

 </log>

Структура документа довольно проста - корневым в данном случае является элемент log, каждое произошедшее событие фиксируется в элементе event и описывается при помощи его атрибутов (date - время и result - тип события) и внутренних элементов (method - метод доступа, ip-from - адрес источника, url-to - запрашиваемый ресурс, response - код ответа). Генерацией этого документа может заниматься, например, модуль аутентификации запросов в систему, а использованием - программа обработки регистрационных данных (log viewer).

DTD-определения

Итак, мы создали XML документ и убедились, что набор используемых при этом тэгов позволяет осуществлять любые манипуляции с нашей информацией. В таком случае, для того, чтобы утвердить правила нашего нового языка, т.е. список допустимых элементов, их возможное содержимое и атрибуты, мы должны создать DTD - определения (на момент написания статьи спецификация схем данных для XML- документов еще не утверждена и пока DTD являются единственным стандартным способом описания грамматики).

Вот небольшой пример для нашего XML-документа:

<?xml encoding="koi8-r"?>

 <!ELEMENT log (event)+>

<!ELEMENT event (ip-from,method,uri-to,result)>

<!ELEMENT method (#PCDATA)>

<!ELEMENT ip-from (#PCDATA)>

<!ELEMENT url-to (#PCDATA)>

<!ELEMENT response (#PCDATA)>

<!ATTLIST event

result CDATA #IMPLIED

date CDATA #IMPLIED>

Сохранить этот файл под именем log.dtd и включить в XML-документ новую строчку:

<!--DOCTYPE log SYSTEM "log.dtd"-->

Теперь верифицирующий XML-анализатор при обработке документа будет сверять порядок определения элементов и их атрибутов с тем, как это указано у нас в DTD-нотациях и в случае нарушения внутренней структуры выдавать сообщение об ошибке.



2019-12-29 192 Обсуждений (0)
Возникновение языка XML и его задачи 0.00 из 5.00 0 оценок









Обсуждение в статье: Возникновение языка XML и его задачи

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (192)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.008 сек.)