綠色資(zī)源網(wǎng):您身邊最放心的安全下載站! 最新軟件|熱門排行(háng)|軟件分類|軟件專題|廠商大(dà)全

綠色資源網

技術教程(chéng)
您的位置:首頁(yè)網絡編程Xml編程(chéng) → XML入門精解之結構與語法

XML入門精解(jiě)之結構與語法

我要評論 2010/02/16 18:59:35 來源:綠色資源網 編輯:綠色資源站 [ ] 評論:0 點擊:489次

  我(wǒ)們暫且使用“記事本”來創建我(wǒ)們的XML文件(jiàn)吧。先看一個XML文(wén)件:

  例1

  〈?xml version="1.0" encoding="gb2312" ?〉
  〈參考資料〉
   〈書籍〉
   〈名稱〉XML入門精解〈/名稱〉
   〈作者〉張三〈/作者〉
   〈價格 貨幣單位="人民(mín)幣"〉20.00〈/價格〉
   〈/書籍〉
   〈書籍〉
   〈名稱〉XML語法〈/名稱(chēng)〉
   〈!--此書即將出版--〉
   〈作者〉李(lǐ)四〈/作者〉
   〈價格 貨幣單(dān)位="人民幣"〉18.00〈/價格〉
   〈/書籍〉
  〈/參(cān)考資料〉

  這是一個典(diǎn)型的XML文件,編輯好後保存為一個(gè)以.xml為後綴的(de)文件。我(wǒ)們(men)可以將此文件分為文件序言(Prolog)和文件主體兩(liǎng)個大的部分。在此文件中的第一行即是文(wén)件序言(yán)。該行是一個(gè)XML文件必須要聲明的東西,而且也必須位於XML文件的第一行,它(tā)主要是告(gào)訴XML解析器如何工作。其中,version是標明此XML文件所用的標準(zhǔn)的版本號,必須要有;encoding指明了此XML文件(jiàn)中所使用的字符類型,可(kě)以省略,在你省略(luè)此聲明的時候,後麵的字符碼必須是Unicode字符碼(建議不要省略(luè))。因為我們在這個例子中(zhōng)使用的是GB2312字符碼,所以encoding這個聲明(míng)也不能省略。在文件序言部分還有一些聲明語句,我們在後麵給予介紹。

  文件的其餘部分都是屬於文件(jiàn)主體,XML文件的內容信息(xī)存放在此。我們可以看到,文件主體(tǐ)是由開始的〈參考資料(liào)〉和結束的〈/參考資料(liào)〉控製標記組成,這個稱為XML文件的“根元素”;〈書籍〉是作為直屬於根元素下的“子元素”;在〈書籍〉下又有〈名稱〉、〈作者〉、〈價(jià)格〉這些子元素。貨幣單位是〈價格(gé)〉元素中的一個“屬性”,“人(rén)民幣”則是“屬性值”。

  〈!--此書即將出版--〉這一句同HTML一樣,是注釋,在XML文件裏,注釋部分是放在“〈!--”與“--〉”標記之間的部分。

  大(dà)家可以看到,XML文(wén)件是相當簡單的。同HTML一樣,XML文件也是(shì)由一係(xì)列的標記組成,不過,XML文件中的標記是我(wǒ)們自(zì)定義的標記,具有明確的含義,我們可以對(duì)標記(jì)中的內容的含義作出說明。對XML文件有了初步的印象之後,我們就來詳細地(dì)談一談(tán)XML文件的語(yǔ)法。在講語(yǔ)法(fǎ)之前,我們必須要了解一個重(chóng)要的概念,就是XML解析器(qì)(XML Parse)。

  1.XML解析器

  解析器的主要功能就是檢查XML文件是(shì)否有結構上的錯誤,剝離XML文件中(zhōng)的標記,讀出正確的內容,以交給下一步的應用程序處理。XML是一種用來結構(gòu)化文件信息的標記語(yǔ)言,XML規範中(zhōng)對於如何標(biāo)記文件的結構性有一個詳細的法則,解析器就是根(gēn)據這些法則寫出來的軟(ruǎn)件(jiàn)(多用Java寫成)。同HTML一樣,在瀏覽器中,必須(xū)有HTML的解析器(qì),這(zhè)樣瀏覽器才(cái)能夠“讀懂”各種用HTML標記所組(zǔ)成的網頁,將(jiāng)它們顯示在(zài)我們(men)麵前。如果有瀏覽器的HTML解析器讀不懂的標記,將會返回給我們錯(cuò)誤信息。

  由於現在的(de)HTML標記實際(jì)上(shàng)相(xiàng)當混亂,存在大量不規(guī)範的標記(有的(de)網頁(yè)用IE能正常顯示,而用Netscape Navigator則不行(háng)),所以從一開始(shǐ),XML的設(shè)計者就嚴格規定了XML的(de)語法和結(jié)構,我們編(biān)寫的XML文件必須遵循這些規定,否則XML解(jiě)析器將毫不留情(qíng)地給你顯示錯誤信息。

  有兩種XML文件,一種是Well-Formed XML文件,一種是Validating XML文件。

  如果一個XML文件滿足XML規範中的某些相關(guān)法則,且沒有使用DTD(文件格式定義——後詳述)時,可稱這份文件是Well-Formed。而如果一個XML文(wén)件是Well-Formed,且正確(què)地使用了DTD,DTD中的(de)語法又是正確的,那麽這個文件就是Validating。對應兩種XML文件,有兩種XML解析器(qì),一種是Well-Formed 解析器,一種是(shì)Validating解析器。IE 5中就內含(hán)Validating解析器,Validating解析器也可用來解析Well-Formed XML文(wén)件。

  檢查它是否滿足了Well-Formed的條件。我們可以將剛才編輯的第一個XML 文(wén)件用IE 5以上版本的瀏覽器(qì)打開(kāi)。

  大家可能要問為什麽在瀏覽器中的顯示(shì)和我(wǒ)的源文件一樣?沒錯,因為(wéi)對(duì)於XML文件,我們黿齬匭乃 的(de)內容,而它的顯示形式是交給CSS或XSL來完成(chéng)的。這裏,我們並沒有給這個XML文件定義它的CSS或XSL文件,所以它按照原來的形式來顯示。實際上,對於電子(zǐ)數據交換,僅僅需要一個XML文件即(jí)可,如(rú)果要將它以某(mǒu)種形(xíng)式顯示出來(lái),我們就(jiù)必須(xū)編輯CSS或XSL文件(這個問(wèn)題會在以後討論)。

  2.Well-Formed的XML文件

 我們(men)知道(dào),XML必須是Well-Formed的,才能夠(gòu)被解(jiě)析器正確地(dì)解析出(chū)來,顯示在瀏覽器中。那(nà)麽什麽是Well-Formed的XML文件呢?主要(yào)有下麵幾(jǐ)個準則,我們在創建XML文件的時候,必須滿足(zú)它們。

 首先,XML文(wén)件的第(dì)一行必(bì)須是聲明(míng)該文件是XML文件以及它所使用的XML規範版本(běn)。在文件(jiàn)的前麵不能夠有其它元素或者注釋。

 第二,在XML文件中有且隻能夠有一個根(gēn)元素。我們的第一個例子中,〈參考資料〉... 〈/參考資料〉就是此XML文件的根元素。

 第(dì)三,在(zài)XML文件(jiàn)中的標記必須正確地關閉(bì),也就是說,在XML文件中,控製標記(jì)必 須有與之(zhī)對應的結束標記。如:〈名(míng)稱〉標記必須有對應(yīng)的(de)〈/名稱〉結束標記,不像HTML,某些標記的結束標記(jì)可(kě)有(yǒu)可無。如(rú)果在XML文件中遇到自成一(yī)個(gè)單元的標記,就是類似於HTML 中的〈img src=.....〉的(de)這些沒有結(jié)束標(biāo)記的時候,XML把它稱為“空元素”,必須用這(zhè)樣的寫法(fǎ):〈空元(yuán)素名(míng)/〉,如果元素(sù)中含有屬(shǔ)性時寫法(fǎ)則為:〈空元素名 屬性名=“屬性值”/〉。

 第四,標記之間不得交叉。在以前的HTML文件中,可以這樣寫:

 〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉和〈H〉

  標記之間有相互重疊的區域(yù),而在XML中,是嚴格禁止這樣標記交錯的寫法,標記必須以規(guī)則性的次序來出現。

  第五,屬性(xìng)值(zhí)必須要用“ ”號括起來。如第一個例子中的(de)“1.0”、“gb2312”、“人民幣”。都是用“ ”號括起來了的,不能漏掉(diào)。

  第六(liù),控製標記、指令和屬性名稱等英文要區分大小寫。與HTML不同的是,在HTML中, 類似〈B〉和〈b〉的標記含義是一樣的,而在XML中,類似〈name〉、〈NAME〉或〈Name〉這樣(yàng)的標記是不同的。

  第七,我們知(zhī)道,在(zài)HTML文件中,如果我們要瀏覽器原封不動地將我們所輸入的東西顯示出來,可以將這些東(dōng)西放到〈pre〉〈/pre〉或者〈xmp〉〈/xmp〉標(biāo)記中間。這對於我們創建HTML教學的網頁是必不可少的,因為網頁中要顯示HTML的源代碼。而在XML中,要實現這樣的功能,就必須使用CDATA標記。在CDATA標記中的信息被解析器原封不動地傳給應用程序(xù),並且不解析該(gāi)段信息中(zhōng)的任何控製標記。CDATA區(qū)域是由:“〈![CDATA[”為開始標記(jì),以“>〉”為結束標記。例如:例2中的源碼,除(chú)了“〈![CDATA[”和“>〉”符號,其餘的內容解析器將原(yuán)封不(bú)動地交給下(xià)遊的應用程序,即使CDATA區域中(zhōng)的開始和結尾的空白以及換行字符等,都同樣會被轉交(注意CDATA是大寫的字符)。

  例2

  〈![CDATA[飛翔的xml〉〉〉〉〉,:-)
  oooo〈〈〈〈〈〈〈
  >〉

  第八(bā),XML處理空白(bái)字符和HTML不一樣。HTML標準規定,不管有多少(shǎo)個(gè)空白,都當作一個空白來處理;而在XML中規定,所有標記以外的空白,解析(xī)器都要忠實地交給下遊的應用(yòng)程序處理。這樣,我們有時必須摒棄編寫(xiě)HTML文件時的縮排(pái)習慣,因為(wéi)縮排的空(kōng)格,解析器也要處理。如(rú):

   〈作者〉張三〈/作者〉
  和
   〈作者〉
   張三
   〈/作者〉

  上述內容對於解析器來(lái)說是不同的(後者在〈作者〉〈/作者〉標記之內除了張三這個(gè)字符以外,還包括兩(liǎng)個換行記號以及“張三”前的文字縮排(pái)符號)。所以解析器在去掉標記後將信息傳給應用程序將有不同的處理結果。

  如果(guǒ)我們想明確地告訴XML程序,標(biāo)記中(zhōng)的空白(bái)有明確的含義,不要隨便(biàn)去掉(如在一(yī)些詩中,空格有它(tā)具體的意義(yì)),則可在標記中加入一(yī)個(gè)XML內置(zhì)的屬性——xml:space 。如(注意屬性名稱和(hé)值的(de)大小寫):   

  〈詩歌 xml:space="preserver"〉
   祖國啊! 祖國!
   我的祖(zǔ)國!
   〈/詩(shī)歌〉

 另外,在(zài)XML文件中,如果要用到表1的特殊字符,必須用(yòng)相應符號代替。

 表1

  特殊(shū)字符 替代符號
  && &
  < &it;
  > >
  " "
  ' &apos;

  在此做個小結:符合上述規定的XML文件就是Well-Formed的XML文件。這是編(biān)寫XML文件(jiàn)的最基本要求。可以看到XML文件的(de)語法規定(dìng)比HTML要嚴格多了。由於有這樣的嚴格規定,軟件工程師編寫XML的解析器就容易多了,不像編寫HTML語言(yán)的解析器,必須費盡心(xīn)思去適應不同的網頁寫法(fǎ),提高自己瀏覽器的適應能力。實際上,這對於我們初學者來說,也是一件好事。該怎樣就(jiù)怎樣,不必像原來那樣去疑惑各種(zhǒng)HTML的寫法。

  我們看到,在XML文件中,用(yòng)的大多都(dōu)是自定義的標記。但是大家考慮一下(xià),如果兩個同行業(yè)的公司(sī)A和B要用XML文件(jiàn)相互交換數據(jù),A公司用〈價格〉標記來表(biǎo)示(shì)他們產品的價格信息,而B公司可能用〈售價(jià)〉來表示價格信(xìn)息(xī)。如果一個XML應用程序來讀取他們各(gè)自的XML文件中的信息時,如果它隻(zhī)知道〈價格〉標記裏表示的是價格信息,那麽B

關鍵詞:XML

閱讀本文後您有什麽感想? 已有 人給出評價!

  • 1 歡迎喜歡
  • 1 白癡
  • 1 拜托
  • 1 哇
  • 1 加油
  • 1 鄙視
免费人欧美成又黄又爽的视频丨一本色道久久88综合日韩精品丨国产专区日韩精品欧美色丨午夜无遮挡男女啪啪视频丨国产欧美日韩综合精品一区二区丨亚洲精品无码不卡在线播HE丨亚洲精品国产精品国自产观看丨日韩国产高清av不卡