Basic Search / Detailed Display

Author: 吳俊融
Jyun-rong Wu
Thesis Title: XML文件再利用軟體工具
Software Tool for Reuse of XML Documents
Advisor: 林彥君
Yen-Chun Lin
Committee: 鄧惟中
Wei-Chung Teng
吳怡樂
Yi-Leh Wu
莊庭瑞
Tyng-Ruey Chuang
葉耀明
Yao-Ming Yeh
Degree: 碩士
Master
Department: 電資學院 - 資訊工程系
Department of Computer Science and Information Engineering
Thesis Publication Year: 2007
Graduation Academic Year: 95
Language: 中文
Pages: 73
Keywords (in Chinese): 文件再利用XMLXSLTJSP原生型XML資料庫
Keywords (in other languages): document reuse, XML, XSLT, JSP, native XML database
Reference times: Clicks: 233Downloads: 2
Share:
School Collection Retrieve National Library Collection Retrieve Error Report

在數位時代來臨後,每天都有大量的電子文件被人使用,也讓人花費許多的時間製作及管理電子文件,因此減少這些花費有其必要。一般的電子文件儲存格式如Word,大都將文件的內容、結構與樣式混合在一起,不方便只取出一部份來再利用,且用全文搜尋的方式查詢特定的內容,耗力費時。
Extensible Markup Language (XML)是目前網路上資料交換的主流格式,其具有結構的特性有助於文件的查詢和結構的再利用。我們使用XML與其相關技術,開發一個可供多人在網際網路使用的XML文件再利用軟體工具。此工具能再利用文件的內容、結構與樣式,並透過Extensible Stylesheet Language Transformations (XSLT)將XML文件轉換成HTML文件,讓不懂XML語法的使用者也能閱讀與編輯XML文件。
我們的工具也提供所見即所得(what you see is what you get)的編輯環境,讓使用者能立即看到新增或更改文件樣式的結果。以原生型(native) XML資料庫儲存XML文件,可快速地檢索與存取特定的內容。使用者可透過此工具儲存、管理、查詢與分享彼此的文件,能重複使用舊文件指定的結構或內容於新文件,減少製作文件的時間與成本。


Since the digital age has come, people use a great number of electronic documents every day and spend a lot of time in producing and managing them. It is necessary to reduce the cost of processing documents. Formats of electronic documents, such as Word, store the content, structure, and style of a document in one file. It is hard to take out only one part to reuse. In addition, using full text searching to find a specific content in a file is time-consuming.
Extensible Markup Language (XML) is the most popular format for data exchange on the Internet. It is useful for finding contents and reusing the document structure. We use XML and associated technology to develop an XML document reuse tool for concurrent accesses over the Internet. This tool can reuse documents’ contents, structures, and styles. Furthermore, it can transform an XML document into the HTML format by using Extensible Stylesheet Language Transformations (XSLT) to help users who have no ideas about XML to read and edit XML documents.
The tool provides a “what you see is what you get” editing platform, and lets users see the addition or modification of styles immediately. We choose a native XML database as a repository to store XML documents. With this tool, users can store, manage, search, and share their documents. Thus, we can reduce the time and cost of producing new documents.

摘要 I Abstract II 誌謝 III 目次 IV 圖表索引 VI 1. 緒論 1 1.1. 問題與研究動機 1 1.2. 可擴展標記語言介紹 2 1.2.1. 發展XML的背景 2 1.2.2. XML的優點 2 1.3. 文件再利用的種類 4 1.4. 文件再利用的文獻回顧 5 1.5. 論文組織 6 2. 以XML技術進行文件再利用 7 2.1. 文件儲存的方法及優缺點 7 2.2. 以XML標記描述文件 10 2.3. 使用XML儲存文件的問題與解決方法 13 2.3.1. XSLT介紹 14 2.3.2. 文件樣式再利用之方法 19 2.3.2.1. 以XML技術儲存文件樣式之方法及優缺點 19 2.3.2.2. 存取文件樣式之方法 21 3. XML文件儲藏庫之選擇與開發技術簡介 29 3.1. 使用關聯式資料庫儲存XML文件 29 3.2. 使用原生型XML資料庫儲存XML文件 30 3.3. 選擇原生型XML資料庫的原因 31 3.4. 開發軟體與技術 31 3.4.1. JSP介紹 31 3.4.2. XQuery介紹 32 3.4.3. eXist介紹 35 4. 文件再利用軟體工具 37 4.1. 文件再利用軟體工具的系統架構 37 4.2. 文件再利用軟體工具的系統功能 38 4.2.1. 系統操作介面 39 4.2.2. 建立新文件 40 4.2.3. 編輯文件 42 4.2.4. 檔案儲存與管理 45 4.2.5. 查詢 47 4.2.6. 權限管理 54 4.3. 與其他系統比較 54 5. 結論與未來的研究方向 56 參考資料 58

[1] 中央研究院資訊科學研究所, 台灣大學昆蟲標本館典藏數位化計畫軟體設計規格書, 2002.
[2] 中央研究院資訊科學研究所, 台灣大學昆蟲標本館典藏數位化計畫軟體需求規格書, 2002.
[3] 中央研究院資訊科學研究所, 考古發掘遺物、照片、記錄與檔案數位典藏計畫遺物典藏管理系統軟體設計規格書 version 0.9, 2002.
[4] 中央研究院資訊科學研究所, 考古發掘遺物、照片、記錄與檔案數位典藏計畫遺物典藏管理系統軟體需求規格書 version 0.9, 2002.
[5] 中央研究院資訊科學研究所, 拓片與古文書數位典藏計畫漢代簡牘數位典藏系統軟體需求規格書 version 1.3, 2003.
[6] 中央研究院資訊科學研究所, 拓片與古文書數位典藏書畫漢代簡牘數位典藏系統軟體設計規格書 version 1.3, 2003.
[7] 中央研究院資訊科學研究所, 故宮先秦銅器紋飾資料庫軟體設計規格書 version 1.1, 2003.
[8] 中央研究院資訊科學研究所, 故宮先秦銅器紋飾資料庫軟體需求規格書version 1.1, 2003.
[9] 中央研究院資訊科學研究所, 故宮書畫處數位典藏計畫軟體需求規格書version 0.9.3, 2003.
[10] 中央研究院資訊科學研究所, 傅斯年圖書館藏印記資料庫軟體設計規格書 version 1.0, 2003.
[11] 中央研究院資訊科學研究所, 傅斯年圖書館藏圖籍印記資料庫軟體需求規格書 version 1.2, 2003.
[12] 呂文達, JSP動態網頁新技術, 2nd ed., 博碩文化, 台北, 台灣, 2004.
[13] 林彥君, 吳俊融, 王祥安, 數位典藏軟體設計規格書之建議標準:五份軟體設計規格書之剖析, 第一屆台灣軟體工程研討會, 台北, 台灣, pp. 336-340, June 2005.
[14] 林彥君, 黃建中, 王祥安, 以XML為基礎之後設資料規格儲存庫, 第二屆台灣軟體工程研討會, 台北, 台灣, pp. 181-186, June 2006.
[15] 林彥君, 黃建中, 王祥安, 數位典藏軟體需求規格書之初期建議:六份軟體需求規格書之剖析, 第一屆台灣軟體工程研討會, 台北, 台灣, pp. 330-335, June 2005.
[16] 陳昭珍, 陳雪華, 陳光華, 數位圖書館與博物館metadata管理系統 -- Metalogy之設計, TANET 2000:台灣區網際網路研討會論文集, 台灣, 台南, pp. 492-502, Oct. 2000.
[17] 陳會安, XML網頁製作徹底研究, 3rd ed., 旗標出版社, 台北, 台灣, 2005.
[18] 蔡佩君, 在電子商務環境下建構以XML為基礎的顧客回應文件管理之研究, 私立天主教輔仁大學資訊管理學系, 碩士論文, 台北, 台灣, 2001.
[19] D. Barta and J. Gil, A system for document reuse, Proc. of the 7th Israeli Conf. on Computer Systems and Software Engineering, Herzliya, Israeli, pp. 83-94, June 1996.
[20] R. Bourret, XML and Databases, 2004,
http://www.rpbourret.com/xml/XMLAndDatabases.htm
[21] K. Craine, Designing a Document Management Strategy, 2005,
http://www.dpsmagazine.com/content/ContentCT.asp?P=207.
[22] H. Deitel, et al., XML How to Program, Prentice Hall, Upper Saddle River, NJ, 2001.
[23] eXist, eXist:open source native XML database, http://exist.sourceforge.net/
[24] E. Guerrieri, Software document reuse with XML, Proc. 5th Int. Conf. on Software Reuse, Victoria, Canada, pp. 246-254, June 1998.
[25] N. Harrion, The darwin information typing architecture(DITA): application for globalization, IEEE International Professional Communication Conference Proc., Limerick, Ireland, pp. 115-121, July 2005.
[26] InfoTrends, InfoTrends/CAP Ventures Studies Document Costs for Major Organizations Worldwide: Perception 3% vs. Reality 6%, 2005,
http://www.capv.com/home/Press/2005/9.28.05.html.
[27] JAXP, Java API for XML Processing (JAXP),
http://java.sun.com/xml/jaxp/index.jsp
[28] H. Katz, et al., XQuery from the Experts: A Guide to the W3C XML Query Language, Addison-Wesley, Boston, MA, 2003.
[29] C. Kochmer and E. Frandsen, JSP and XML: Integrating XML and Web Services in Your JSP Application, Addison-Wesley, Boston, MA, 2002.
[30] R. Lander, XML: The New Markup Wave, 1997,
http://xml.coverpages.org/landerXML.html.
[31] Microsoft, Activating the MSHTML Editor,
http://msdn.microsoft.com/library/default.asp?url=/workshop/browser/editing/activateeditor.asp.
[32] Microsoft, Creating Editable Web Pages in Internet Explorer 5.5,
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnmshtml/html/createwp.asp.
[33] Microsoft, How to Create an HTML Editor Application,
http://msdn.microsoft.com/library/default.asp?url=/workshop/author/editing/tutorials/html_editor.asp.
[34] S. Natu and J. Mendonca, Digital asset management using a native XML database implementation, Proc. 4th Conf. on Information Technology Curriculum Indiana, pp. 237-241, Oct. 2003.
[35] F. Paradis, A.-M. Vercoustre, B. Hills, A virtual document interpreter for reuse of information, 7th Int. Conf. on Electronic Publishing, Artistic Imaging, and Digital Typography, Saint-Malo, France, pp. 487-498, Apr. 1998.
[36] D. Sadoski and S. Comella-Dorda, Three Tier Software Architectures, 1997, http://www.sei.cmu.edu/str/descriptions/threetier.html.
[37] A. Silberschatz, H. F. Korth, S. Sudarshan, Database System Concepts, 4th ed., McGraw-Hill, New York, 2002.
[38] J. E. Simpson, From Word to XML,
http://www.xml.com/pub/a/2003/12/31/qa.html.
[39] K. Staken, Introduction to Native XML Database, 2001,
http://www.xml.com/pub/a/2001/10/31/nativexmldb.html.
[40] J. Sturm, Developing XML Solutions, Microsoft Press, Redmond, Washington, USA, 2000.
[41] Sun, Java Servlet Technology Overview,
http://java.sun.com/products/servlet/overview.html
[42] Sun, Javadoc Tool, http://java.sun.com/j2se/javadoc/.
[43] Sun, JavaServer Pages Overview,
http://java.sun.com/products/jsp/overview.html. .
[44] Sun, JavaServer Pages[tm] Technology - JavaServer Pages White Paper,
http://java.sun.com/products/jsp/jspguide-wp.html.
[45] A.-M. Vercoustre and F. Paradis, Reuse of linked documents through virtual document prescriptions, 7th Int. Conf. on Electronic Publishing, Artistic Imaging, and Digital Typography, Saint-Malo, France, pp. 499-512, Apr. 1998.
[46] W3C, Cascading Style Sheets, level 1, http://www.w3.org/TR/CSS1.
[47] W3C, Cascading Style Sheets, level 2 revision 1,
http://www.w3.org/TR/CSS21/.
[48] W3C, Extensible Stylesheet Language (XSL) Version 1.0,
http://www.w3.org/TR/xsl/.
[49] W3C, The Extensible Stylesheet Language Family (XSL),
http://www.w3.org/Style/XSL/.
[50] W3C, HTML 4.01 Specification, 1999, http://www.w3.org/TR/REC-html40/.
[51] W3C, XML Core Working Group Public Page,
http://www.w3.org/XML/Core/.
[52] W3C, XML Linking Language (XLink) Version 1.0,
http://www.w3.org/TR/xlink/.
[53] W3C, XML path language (XPath) version 1.0, http://www.w3.org/TR/xpath
[54] W3C, XQuery 1.0: An XML Query Language, http://www.w3.org/TR/xquery/
[55] W3C, XSL Transformations (XSLT) Version 1.0, http://www.w3.org/TR/xslt
[56] XML:DB, Application Programming Interface for XML Databases,
http://xmldb-org.sourceforge.net/xapi/.

QR CODE