XML-технология создания на Web-сервере персонализованных Word-документов на основе XSL-трансформации
В ходе поиска путей решения этой проблемы было предложено реализовать технологию персонализации электронных документов на платформе XML. Ключевым моментом такого подхода является представление пользовательских данных (реквизитов) в формате XML и выполнение персонализации на основе XSL-трансформации с использованием XSL-спецификаций. В результате такой подход позволит отделить данные… Читать ещё >
Содержание
- СПИСОК СОКРАЩЕНИЙ
- ГЛАВА 1. АНАЛИЗ ИЗВЕСТНЫХ ПОДХОДОВ К ПЕРСОНАЛИЗА ЦИИ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
- 1. 1. Общие положения
- 1. 2. Исследования в области электронных документов
- 1. 3. Анализ задачи персонализации электронных документов
- 1. 4. Обзор существующих технологий персонализации документов
- 1. 5. Постановка задачи исследования
- ВЫВОДЫ ПО ПЕРВОЙ ГЛАВЕ
- ГЛАВА 2. РАЗРАБОТКА КОНЦЕПЦИИ И МОДЕЛЕЙ ДЛЯ ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ ПЕРСОНАЛИЗАЦИИ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
- 2. 1. Общие положения
- 2. 2. Разработка основ построения и применения персонализованных документов
- 2. 3. Анализ задачи получения клиентских данных на основе автономных интерфейсных документов
- 2. 4. Анализ задачи формирования персонализованных документов на сервере
- 2. 5. Разработка концептуальной модели класса персонализованных документов
- 2. 6. Разработка алгоритма преобразования модели персонализовапного документа
- ВЫВОДЫ ПО ВТОРОЙ ГЛАВЕ
- ГЛАВА 3. РАЗРАБОТКА МЕТОДА XSL-ИНЪЕКЦИЙ ДЛЯ СОЗДАНИЯ СТИЛЕЙ XSL-ТРАНСФОРМАЦИИ XML-РЕКВИЗИТОВ
- 3. 1. Общие положения
- 3. 2. Разработка метода генерации персонализованных документов Word на основе XML
- 3. 3. Разработка стилевой спецификации персонализации документов на основе XSL
- 3. 4. Пример использования метода XSL-инъекций для программирования спецификаций персонализации
- ВЫВОДЫ ПО ТРЕТЬЕЙ ГЛАВЕ
XML-технология создания на Web-сервере персонализованных Word-документов на основе XSL-трансформации (реферат, курсовая, диплом, контрольная)
Актуальность темы
Современный уровень развития информационных технологий характеризуется тенденцией доминирования электронных документов над традиционными бумажными носителями информации. Стремительно растет число задач, в которых электронные документы играют далеко не последнюю роль, — от простого представления информации в определенном виде (например, электронные отчеты) до организации интеллектуальных систем со сложной программной и функциональной логикой («интеллектуальные» документы).
В этих условиях особый интерес представляют документы, которые носят название персонализоеанных. В основе таких документов лежит идея персона-лизации, которая применительно к теории электронных документов заключается в настройке документов под определенного пользователя, иными словами, подстановке персональных данных (реквизитов) пользователя в заданный макет.
В настоящее время задача персонализации электронных документов решается несколькими способами. В простейшем случае пользователь вносит данные непосредственно в макет документа и формирует в результате персона-лизованный документ. Такой подход сопровождается существенной трудоемкостью и значительным числом возникающих при этом ошибок, связанных с необходимостью монотонного выполнения рутинных операций по вводу одних и тех же данных. Более эффективен подход, связанный с использованием программных средств, которые позволяют генерировать документы в автоматизированном режиме (серверные генераторы отчетов, СОМ-технологии на основе объектных моделей соответствующих форматов, системы электронного документооборота). Такие средства, как правило, платны, сложны в настройке и сопровождении, требовательны к системным ресурсам. Персонализация документов — одна из многих (но не главная) функция, для которых они предназначены. Все это снижает целесообразность применения таких программных средств для решения задачи персонализации.
В рамках исследований, проводимых на кафедре АСУ УГАТУ1, была предложена технология персонализации ЭД, основанная на использовании макрокоманд (макросов) для генерации документов формата Microsoft Word. Такой подход обеспечивает эффективную подстановку в документы повторяющихся значений реквизитов пользователя. Однако эта технология не пригодна для использования на сервере, поскольку использование макросов ориентировано на локализованный текстовый процессор Microsoft Word.
Выявленные проблемы требуют разработки научно обоснованных технологий персонализации электронных документов, не требующих выполнения монотонного ввода данных «вручную», позволяющих формировать модифицируемые документы пользователя в автоматизированном режиме и доступных для использования на сервере.
В ходе поиска путей решения этой проблемы было предложено реализовать технологию персонализации электронных документов на платформе XML. Ключевым моментом такого подхода является представление пользовательских данных (реквизитов) в формате XML и выполнение персонализации на основе XSL-трансформации с использованием XSL-спецификаций. В результате такой подход позволит отделить данные (пользовательские реквизиты) от их представления (макетов документа), что существенно упростит создание, ведение и обработку персонализованных документов.
Вместе с тем технология персонализации электронных документов на основе XML не является очевидной. Необходимо строго формализовать структуру персонализованного документа в контексте его XML-представления. Неясно, как построить шаблон персонализации на основе XML, как определить в нем правила подстановки пользовательских данных, как выполнить собственно саму персонализацию, т. е. как сопоставить шаблон персонализации с пользовательскими данными. Все это требует проведения соответствующих исследований.
1 Обеспечение целостности комплекса электронных документов на основе встраиваемых динамических моделей: дис.. канд. техн. наук / Т. А. Гарифуллиннауч. рук. проф. В. В. Миронов. Уфа: УГАТУ, 2006. 149 с.
Целью работы является разработка научно обоснованной технологии автоматизированного создания на Web-сервере модифицируемых персопализо-ванных электронных документов на основе XML.
Задачи, решаемые в работе для достижения цели:
1) Разработка концепции серверной информационной технологии персо-нализации электронных документов на основе XML,.
2) Разработка модели класса персонализованных документов,.
3) Разработка метода создания стилей XSL-трансформации пользовательских XML-реквизитов,.
4) Реализация программного обеспечения для создания спецификаций XSL-трансформации XML-реквизитов.
Методика исследования. В работе используются принципы и методы построения электронных документов, системного анализа, объектно-ориентированного программирования, теории информации, теории множеств, моделирования сложных объектов, принципы и методы построения алгоритмов.
Результаты, выносимые на защиту:
1) Концепция информационной технологии персонализации электронных документов, основанная на использовании серверных макетов электронных документов и базы персональных реквизитов.
2) Модель класса персонализованных документов, основанная на представлении документа в виде иерархии вложенных фрагментов.
3) Метод XSL-инъекций для создания стилей XSL-трансформации XML-реквизитов в экземпляр персонализованного документа по модели класса персонализованных документов.
4) Программное обеспечение для создания спецификаций XSL-трансформации XML-реквизитов, основанное на технологиях обработки XML-данных, принципах XSLT-программирования и XML-организации документов Word.
Научная новизна результатов в целом обусловлена новой идеей использования XSL-трансформации для построения персонализованных Word-документов и может быть квалифицирована как решение известной задачи (создания персонализованных электронных документов) новым более эффективным способом (на основе программирования макетов документов в визуальном режиме с использованием XSL-инъекций). При этом: новизна концепции информационной технологии персонализации электронных документов состоит в том, что с целью создания документов, допускающих дальнейшую модификацию и доработку, впервые макеты документов строятся в форме XSL-спецификаций, база реквизитов — в формате XML, а документы генерируются в формате Word путем XSL-трансформацииновизна модели класса персонализованных документов заключается в том, что с целью персонализации на основе XML-базы реквизитов в соответствии с концепцией информационной технологии персонализации электронных документов, впервые узлы иерархии включают: форматированные целевые фрагменты документа, внутри которых предусмотрены точки подстановки значений реквизитов, ссылающиеся на базу реквизитов, и XSL-инструкции, обеспечивающие установку контекста обработки фрагментов, выбор одного из нескольких фрагментов и циклическое копирование фрагментов в зависимости от состояния базы реквизитовновизна метода XSL-инъекций для создания стилей XSL-трансформации XML-реквизитов состоит в том, что с целью снижения трудоемкости впервые программирование таблиц стилей ведется в визуальной среде текстового процессора Microsoft Word, причем: создается макет целевого документа с XSL-ипструкциями вставки значений реквизитов, выбора фрагментов и циклической обработки, далее макет, сохраненный в форме XML-документа, преобразуется в XSL-таблицу стилейновизна разработанного программного обеспечения для создания спецификаций XSL-трансформации XML-реквизитов заключается в том, что с целью реализации предложенных концепции, модели и метода, впервые разработан комплекс шаблонов трансформации, содержащих правила обработки XML-макета конечного документа и корректного преобразования XSL-инъекций в XSL-инструкции соответствующего формата.
Значение результатов для теории электронных документов заключается в том, что они дают новый подход к персонализации документов, состоящий в применении XSL-трансформации пользовательских XML-реквизитов, что позволяет расширить теорию в новой области.
Значение результатов для практики разработки электронных документов связано с тем, что они позволяют сократить затраты времени (в рассмотренных примерах — до 30 раз) и снизить трудоемкость (в рассмотренных примерах — до 25 раз) при создании персонализованных документов, допускающих дальнейшую модификацию.
Внедрение результатов. Практическая значимость результатов подтверждается их использованием в УГАТУ и научно-производственной фирме «РД Технология».
Связь с плановыми исследованиями. Работа выполнена в рамках плановых исследований кафедры АСУ УГАТУ по разработке информационных технологий веб-поргала, реализующих создание и ведение персонализованных электронных документов.
Структура диссертации. Диссертация состоит из введения, четырех глав, заключения, приложения, библиографического списка из 97 наименований, всего на 187 листах.
ВЫВОДЫ ПО ЧЕТВЕРТОЙ ГЛАВЕ.
1. Работоспособность и эффективность предложенных в диссертационной работе концепции, модели, метода и программного обеспечения были исследованы на основе реальных электронных документов — пакета документов диссертационного дела, который оформляет соискатель ученой степени. Разработан Web-интерфейс, реализующий функции получения персональных пользовательских данных на основе интерфейсных документов и генерации персонализованных документов на основе сформированной XML-базы пользовательских реквизитов.
2. Экспериментальные исследования показали, что применение разработанных технологии XSL-инъекций и XSL-спецификации трансформации Word2XSL позволит снизить трудоемкость программирования XSL-спецификаций персонализации по количеству выполняемых процедур в среднем в 60 разпо затрачиваемому времени в среднем в 35 разпо сложности выполняемых процедур в среднем в 25 раз. Кроме того, разработанные технология и XSL-спецификация трансформации позволяют существенно сократить количество ошибок, связанных с необходимостью выполнения механических операций при программировании XSL-спецификаций персонализации.
Список литературы
- Беллиньясо, М. Разработка Web-приложений в среде ASP.NET 2.0: задача проект — решение / М. Беллиньясо. М.: Вильяме, 2007. 640 с.
- Блэйн, М. Разработка бизнес-решений на основе Microsoft InfoPath: справочник профессионала / М. Блэйн. М.: Эком, 2008. 680 с.
- Богомолов, М. В. Понятие компьютерной информации / М. В. Богомолов Электронный ресурс. (http://pu.boom.ru/book/glava22.html).
- Валиков, А. Н. Технология XSLT / А. Н. Валиков. СПб.: БХВ-Петербург, 2002. 544 с.
- Гарнаев, А.Ю. Visual Basic. NET: разработка приложений / А. Ю. Гарнаев. — СПб.: БХВ-Петербург, 2002. 624 с.
- Горелишвили, Д. Электронный документ в электронном государстве / Д. Горелишвили Электронный ресурс. http://www.polit.ru/science/2006/ 03/09/document.html).
- Грэй, Дж. XML для разработчиков-профессионалов-NET / Дж. Грэй, Д. Дальви, Б. Джоши и др. Лори, 2003. 642 с.
- Джаиус, Ф. InfoPath 2007 для профессионалов / Ф. Джанус. М.: Вильяме, 2009. 847 с.
- Домашняя страница InfoPath Электронный ресурс. (http://office.microsoft.com/ru-ru/infopath/FXl 487 661 049. aspx).
- Дубова, Н. Документация в информационном обществе: электронное делопроизводство / Н. Дубова Электронный ресурс. (http://www.osp.ni/cw/l 999/48/39 108/).
- Дейтел, X. М. Как программировать на XML: Учеб. пособие / X. М. Дейтел, П. Дж. Дейтел, Т. Р. Нието и др.- М.: БИНОМ, 2001. 944 с.
- Елманова, Н. Microsoft Office System 2003: некоторые новшества для разработчиков / Н. Елманова // КомпьютерПресс. 2003. № Ю. С. 172−175.
- Жучков, К. Microsoft .NET видение корпорации / К. Жучков // Byte. 2002. № 1. Электронный ресурс.
- Закон Российской Федерации «Об электронном документе».
- Использование XML в .NET Framework // Руководство для разработчиков .NET Framework // MSDN Library http://msdn.microsoft.eom/library/rus/default.asp7urWlibrary/RUS/cpguide/html/c pconemployingxmlinnetframework. asp Электронный ресурс.
- Капацинский, М. «Милый дедушка, Константин Макарыч!» или персонализация в России / М. Капацинский Электронный ресурс. (http://www.print-formula.ru/part/person.html).
- Клименко, С. В. и др. Электронные документы в корпоративных сетях. М: «Анкей», 1999.
- Колесов, А. Платформа управления документами от Adobe /
- A. Колесов Электронный ресурс. (http://www.bytemag.ru/articles/detail.php? ID=9007).
- Лабор, В. В. Си Шарп. Создание приложений для Windows /
- B. В. Лабор. Мн.: Харвест, 2003. 384 с.
- Литвинович, В. Персонализация коммерческого сайта / В. Литвино-вич Электронный ресурс. (http://pop-up-marketing.ru/personalsalesletter/).
- Мак-Дональд, М. Microsoft ASP.NET 3.5 с примерами на С# 2008 для профессионалов / М. Мак-Дональд. М.: Вильяме, 2008. 1424 с.
- Макамис, Д. Microsoft InfoPath 2003 / Д. Макамис. М.: ACT, 2006 Разработка бизнес-решений с помощью Microsoft InfoPath: Справочник профессионала. 387 с.
- Маликова, К. Э. XSL-трансформация для преобразования XML-базы реквизитов в документ Word: Свидетельство об официальной регистрации программы для ЭВМ № 2 007 613 608. Зарегистрировано 24 августа 2007 года // К. Э. Маликова, В. Э. Яфаев.
- Малкольм, Г. Программирование для Microsoft SQL Server 2000 с использованием XML / Г. Малкольм. М.: Издательско-торговый дом «Русская Редакция», 2002. 320 с.
- Мангано, С. XSLT. Сборник рецептов. СПб.: БХВ-Петербург, 2008.864 с.
- Мартин, Д. XML для профессионалов / Д. Мартин. Лори, 2001. 1056с.
- Миронов, В. В. XML-технологии в базах данных / В. В. Миронов, Н. И. Юсупова. Уфа: УГАТУ, 2004. 182с.
- Миронов, В. В. XML-технологии в информационной системе для управления учебным процессом на уровне деканата / В. В. Миронов, Т. А. Гарифуллин, А. Ю. Иванов, А. А. Куклина, Г. Р. Шакирова //
- Актуальные проблемы управления в социальных и экономических системах Межвуз. науч. сб. Уфа: УГАТУ, 2005. С. 39−44.
- Миронов, В. В. Иерархическая модель персонализованных документов и её XML-реализация / В. В. Миронов, Г. Р. Шакирова, В. Э. Яфаев // Вестник УГАТУ. Управление, вычислительная техника и информатика. 2008 Т11 № 1(28).
- Моррисон, М. HTML и XML. Быстро и эффективно / М. Моррисон. СПб.: Питер, 2005. 303 с.
- Оберг, Р. Архитектура .NET и программирование с помощью Visual С++ / Р. Оберг, П. Торстейнсон. М.: Изд. дом «Вильяме», 2002. 656 с.
- Организация работы с документами В. А. Кудряев, И. К. Корнеев, Г. Н. Ксандопуло и др. М.: ИНФРА-М, 1999.-С74 с.
- Персонализация Электронный ресурс. (http://www.omni-media.ru/content/view/20/48/).40. «Персонализация» автора Электронный ресурс. (http://old.sellme.ru/2006/06/21/personalizatsiyaavtora).
- Персонализация контента вступает в новую стадию Электронный ресурс. (http://www.conmarkmail.ru/news/2008/! 1/10/news3.html).
- Персонализация полиграфической продукции Электронный ресурс. (http://www.project73.ru/perso.html).
- Печать и персонализация Электронный ресурс. (http://www.pochta-service.ru/features/index.html).
- Печать переменных данных. Персонализация Электронный ресурс. (http://www.print-fonnula.ru/part/person.html).
- Персонализация. New Age Branding Электронный ресурс. (http://www.adeator.com/?tag=personalizaciya).
- Персонализация (Personalization) Электронный ресурс. (http://rglab.ru/technologies/thesaurus/366/).
- Петцолъд Ч. Программирование для Microsoft Windows на С#. В 2-х томах. / Ч. Петцольд. М.: Изд.-торг. дом «Русская Редакция», 2002. 576 с.
- Платт Д. С. Знакомство с Microsoft .NET / Д. Платт. М.: Изд.-торг. дом «Русская Редакция», 2001. 240 с.
- Печенкин, И. А. Информационные технологии на службе разведки / И. А. Печенкин Электронный ресурс. (http://www.rscip.ru/base/A4288431−5 660 961.html).
- Понятие и структура электронного документа Электронный ресурс. (http://www.lpspb.ru/ru/content/ponyatie-i-struktura-elektronnogo-dokumenta).
- Расширение платформы IBM WebSphere при помощи Adobe Intelligent Documents Электронный ресурс. (http://javagu.ru/portal/dt?last=false &provider=javaguru&ArticleId=GURUARTICLE80840&SecID=GURUSECT ION80705).
- Робисон, У. С# без лишних слов / У. Робисон. М.: ДМК Пресс, 2002. 352 с.
- Создание XML-документа на основе пользовательской схемы Электронный ресурс. (http://office.microsofl.com/ru-ru/word/ НА101 022 491 049. aspx).
- Спенсер, П. XML. Проектирование и реализация / П. Спенсер. М.: Лори, 2001. 510 с.
- Спецификация языка XML. http://www.w3.org/TR/REC-xml. Электронный ресурс.
- Спецификация Namespaces in XML 1.0 http://www.w3.org/TR/REC-xml-names/. Электронный ресурс.
- Спецификация языка XML Path (XPath) версия 1.0 http://www.w3.org/TR/1999/REC-xpath-19 991 116. Электронный ресурс.
- Спецификация XML Schema http://www.w3.org/TR/2001/REC-xmlschema-0−20 010 502/. Электронный ресурс.
- Спецификация Microsoft Office 2003 Edition XML Schema Электронный ресурс.
- Троелсен. Э. С# и платформа .NET. Библиотека программиста / Э. Троелсен. СПб.: Питер, 2004. 796 с.
- Храмцов, П. XML через призму программирования / П. Храмцов // Журнал «Открытые Системы». 1999. № 09−10. Электронный ресурс.
- Федеральный Закон «Об информации, информатизации и защите информации».
- Шкилев, В. Д. О некоторых особенностях восприятия электронного документа / В. Д. Шкилев Электронный ресурс. (rcdl2008.jinr.ru/pdf/5 5059paper4.pdf).
- Эдди, С. Э. XML. Наиболее полное руководство / С. Э. Эдди. СПб.: Питер, 2000. 480 с.
- Электронные документы Электронный ресурс. (http://edocs.phpclub.net/).
- Эспозито, Д. Знакомство с Microsoft ASP.Net 2.0 / Д. Эспозито. СПб.: Русская редакция, 2005. 512 с.
- Эспозито, Д. Программирование с использованием Microsoft ASP.NET 3.5. Мастер-класс / Д. Эспозито. СПб.: Питер, 2009. 1008 с.
- Эспозито, Д. XML на практике. Управление XML-данными через интегрированные классы чтения и записи в .NET Framework. / Д. Эспозито. www.realcoding.net/article/view/2745 Электронный ресурс.
- Adobe Intelligent Document Platform: круговорот документов Электронный ресурс. (http://www.itc.ua/node/21 130).
- Beres, J. Teach Yourself Visual Studio® .NET 2003 in 21 Days / J. Beres. Sams Publishing, 2003. 696 p.
- Binstock, A. Beyond Post: Adobe Forms vs. In-. foPath? / A. Binstock Электронный ресурс. (assets.devx.com/adobe/14 199.pdf).
- Erik, Т. R. Learning XML / T. R. Erik. O’Relly, 2003. 416 p.
- Fong, J. The XML Tree Model toward an XML conceptual schema reversed from XML Schema Definition / J. Fong, S. K. Cheung, H. Shiu // Data & Knowledge Engineering, In Press, Corrected Proof, Available online 27 October 2007 Электронный ресурс.
- Freire, J. Managing XML data: an abridged overview / J. Freire, M. Benedikt // Computing in Science & Engineering. 2004. Vol. 06, Issue 4. P.12−19.
- Harold, E. R. XML in a Nutshell / E. R. Harold, W. S. Means. O’Reilly, 2002. 634p.
- Hornick, M. F. XML Schema / M. F. Hornick, E. Marcade, S. Venkayala // Java Data Mining. 2007. P. 259−271.
- Gabriel, V. Осваиваем Open XML WordprocessingML / V. Gabriel. Электронный ресурс. (http://blogs.gotdotnet.ru/personaI/vgabriel/Perma-Link.aspx?guid=2884ce4a-d287−4034−83e4−46f0b4344724).
- Generating WordML Reports Using Templates and XPath Электронный ресурс. (http://www.beansoftware.com/ASP.NET-Tutorials/WordML-XPath. aspx).
- InfoPath 2007. Hard’n’Soft Электронный ресурс. (http://www.hardnsoft.ru/?trID= 157&artID=429).
- Jones, B. WordprocessingML Document Model / B. Jones Электронный ресурс. (http://blogs.msdn.eom/brianjones/archive/2007/07/l 1/ wordprocessingml-document-model.aspx).
- Lee, M.-H. Logical structure analysis: From HTML to XML / M.-H. Lee, Y.-S. Kim, K.-H. Lee // Computer Standards & Interfaces. 2007. Vol. 29, Issue 1. P. 109−124.
- Livingston, D. Essential XML for Web Professionals / D. Livingston http://authors.phptr.com/essential/xml Электронный ресурс.
- Lovett, С. XML Notepad 2007 / C. Lovett Design. http://msdn2.microsoft.com/en-us/library/aa905339.aspx Электронный ресурс.
- Mc Rae, M. Office 2003 XML / M. Mc Rae. O’Reilly, 1999.
- Microsoft Office 2003. Обзор технологий для разработчиков http://www.microsoft.com/office/ Электронный ресурс.
- MSXML 4.0 Software Development Kit (SDK) Электронный ресурс.
- Roy, J. XML schema language: taking XML to the next level / J. Roy, A. Ramanujan // IT Professional. 2001. Vol. 3, Issue 2. P. 37−40.
- OpenXML Developer — WordprocessingML Электронный ресурс. (https://openxmldeveloper.com/forums/13/ShowForum.aspx).
- OpenXML — Main Features Электронный ресурс. (http://www.google.ru/search?hl=ru&newwindow=l&q=wordprocessingml&btnG =%D0%9F%D0%BE%D0%B8%D 1%81%DO%BA&lr=langru&aq=f&oq=).
- Overview of WordprocessingML http://rep.oio.dk/Microsoflt.com/ of-ficeschemas/wordprocessingmlarticle.htm#wordprocessingmlarticleintroduc-tion Электронный ресурс.
- Tkachenko, О. Generating Word documents using XSLT / O. Tkachenko Электронный ресурс. (http://www.tkachenko.com/blog/archives/24.html).
- WordML The XML Behind the Word Document Электронный ресурс. (http://www.simonstl.com/articles/officeXML/wordML.html).
- WordprocessingML Reference Material Электронный ресурс. (www.xmlopen.org/ooxml-wiki/index.php/2.WordprocessingMLReference Material).
- XML Editors / http://www.xml.com/pub/rg/XMLEditors Электронный ресурс.