मूलभूत XML रचना - XML ​​घटक, टॅग, विशेषता, प्रक्रिया सूचना, CDATA विभाग, टिप्पण्या. चांगले तयार केलेले XML दस्तऐवज तयार करा. XML दस्तऐवज रचना. प्रोलॉग, रूट घटक

व्हायबर डाउनलोड करा 16.06.2019

XML (एक्सटेंसिबल मार्कअप लँग्वेज) ही SGML ची एक सरलीकृत बोली आहे जी वर्ल्ड वाइड वेबवरील श्रेणीबद्ध डेटा संरचनांचे वर्णन करण्यासाठी डिझाइन केलेली आहे. हे 1996 पासून W3C कार्यरत गटाने विकसित केले आहे; सध्या स्वीकारलेली शिफारस ही XML 1.0 भाषेची दुसरी आवृत्ती आहे (ऑक्टोबर 2000), जी पुढील सादरीकरणासाठी आधार आहे.

XML हे निःसंशयपणे सर्वात आश्वासक WWW तंत्रज्ञानांपैकी एक आहे, जे विकसक कॉर्पोरेशन्स आणि सामान्य लोक या दोघांकडून मिळालेल्या व्याजाचे स्पष्टीकरण देते. त्याच्या वर्णनाकडे जाण्यापूर्वी, त्याचे स्वरूप आणि त्यानंतरच्या वेगवान विकासाच्या कारणांवर चर्चा करणे योग्य वाटते. हे करण्यासाठी, WWW च्या समस्या पाहण्याचा प्रयत्न करूया ज्या वेब तंत्रज्ञानाच्या नवीन पिढीद्वारे सोडवल्या पाहिजेत.

HTML दस्तऐवजांचा अर्थ व्यक्त करत नाही.वर्णन करण्यासाठी HTML तयार केले गेले संरचनादस्तऐवज (शीर्षक, शीर्षके, याद्या, परिच्छेद इ.) आणि काही प्रमाणात त्यांचे नियम प्रदर्शन(ठळक, तिर्यक, इ.). हे कोणत्याही प्रकारे वर्णन करण्याचा हेतू नाही अर्थत्यावर लिहिलेले दस्तऐवज, आणि बर्याच बाबतीत तो डेटा आहे जो दस्तऐवजाचा सार बनवतो, मग तो स्टॉक एक्सचेंज अहवाल असो किंवा वैज्ञानिक प्रकाशन. म्हणून, डेटाचे वर्णन करण्यासाठी भाषेची आणि श्रेणीबद्ध संरचनांमध्ये आयोजित केलेल्या डेटाची आवश्यकता होती. एचटीएमएल अवजड आणि नम्र आहे.अलिकडच्या वर्षांत, एचटीएमएल टॅगच्या गोंधळात बदलले आहे जे सहसा एकमेकांना डुप्लिकेट करतात आणि दस्तऐवजाच्या मजकुरात स्पष्टता आणत नाहीत. जर आम्ही येथे नॉन-स्टँडर्ड एचटीएमएल विस्तार जोडले, ज्यासाठी सर्व ब्राउझर डेव्हलपर दोषी आहेत, तर अधिक किंवा कमी क्लिष्ट HTML दस्तऐवज तयार करणे एक गंभीर कार्य बनते. दुसरीकडे, टॅग्जचा एकदा आणि सर्वांसाठी निश्चित केलेला संच अनेकदा आम्हाला आवश्यक असलेली सामग्री व्यक्त करण्यासाठी पुरेसा लवचिक नसतो. वेब ब्राउझर संकल्पना खूप मर्यादित आहे.जावा ऍपलेट्स, स्क्रिप्टिंग भाषा आणि ActiveX कंट्रोल्सच्या आगमनाने, वेब ब्राउझर आता फक्त HTML दस्तऐवजांचे "रेंडरर" राहिले नाहीत; आज ते विशिष्ट अनुप्रयोग चालवणाऱ्या प्रोग्रामसारखे दिसतात. तथापि, ब्राउझरची संकल्पना वापरकर्त्यावर अनावश्यक निर्बंध लादते; बर्याच बाबतीत आम्हाला आवश्यक आहे वेब-आधारित अनुप्रयोग, म्हणजे प्रोग्राम जे वेब साइट्सवरील विशेष माहिती वाचू शकतात आणि ती आम्हाला परिचित स्वरूपात प्रदान करतात, उदाहरणार्थ, स्प्रेडशीटच्या स्वरूपात. दस्तऐवज शोध खूप दुवे परत करतो.आम्ही सर्व वेळ शोध इंजिन वापरतो आणि त्यांच्या गैरसोयीबद्दल त्यांना सतत दोष देतो. चला असे म्हणूया की मला इंटरनेटवर उपलब्ध सर्गेई डोव्हलाटोव्हच्या पुस्तकांचे सर्व मजकूर हवे आहेत. लेखकाच्या नावाने शोधण्याचा प्रयत्न केल्याने मला त्या नावाच्या सर्व लिंक्सची यादी मिळेल, त्यात डोव्हलाटोव्हच्या आठवणी, त्यांच्या पुस्तकांची समीक्षा इत्यादींचा समावेश आहे. विशेष टॅग वापरणे अधिक सोयीचे होईल. मी नक्की काय शोधत आहे हे दर्शविण्यासाठी.संबंधित संसाधने शोधण्यात अक्षम. आता आपण असे गृहीत धरू की मला डोव्हलाटोव्हच्या अनेक कथा सापडल्या आहेत, ज्या स्पष्टपणे एकच संग्रह बनवतात. जर त्यांनी सामग्री सारणीचा दुवा समाविष्ट केला असेल तर ते छान आहे, परंतु बर्याचदा ते करत नाहीत. म्हणून, दिलेल्या पृष्ठांचा समूह एकच संसाधन बनवतो आणि तो तसा मानला जावा हे सूचित करण्यासाठी मार्ग आवश्यक आहे. यासाठी प्रमाणित आणि विकसित प्रणाली आवश्यक आहेमेटाडेस्क्रिप्टर्स

वेब पृष्ठे. XML ही एक सोपी मार्कअप भाषा तयार करून या समस्या सोडवण्याचा प्रयत्न आहे जी अनियंत्रित संरचित डेटाचे वर्णन करते. अधिक स्पष्टपणे, ही एक धातूभाषा आहे ज्यामध्ये विशिष्ट भाषा लिहिल्या जातात ज्या विशिष्ट संरचनेच्या डेटाचे वर्णन करतात. अशा भाषा म्हणतात XML शब्दकोश

  • . एचटीएमएलच्या विपरीत, XML दस्तऐवजात वर्णन केलेला डेटा कसा प्रदर्शित करावा याबद्दल XML मध्ये कोणतीही सूचना नाही. वेगवेगळ्या उपकरणांसाठी डेटा प्रदर्शित करण्याचा मार्ग XSL स्टाईलशीटद्वारे निर्दिष्ट केला जातो, जो XML साठी अंदाजे समान भूमिका बजावते जी CSS HTML साठी करते. HTML मधील आणखी एक मूलभूत फरक म्हणजे XML मध्ये कोणतेही टॅग असू शकतात जे XML शब्दकोशाच्या निर्मात्यांना वापरणे आवश्यक आहे. येथे फक्त काही विशेष XML-आधारित भाषांची सूची आहे जी सध्या W3C कार्यरत गटांद्वारे विकासाच्या विविध टप्प्यात आहेत:
  • गणितीय सूत्रांची MathML भाषा;
  • SMIL मल्टीमीडिया इंटिग्रेशन आणि सिंक्रोनाइझेशन भाषा;
  • SVG द्विमितीय वेक्टर ग्राफिक्स भाषा;
  • RDF संसाधन मेटा वर्णन भाषा;

एक्सएमएल अटींमध्ये एचटीएमएलचे एक्सएचटीएमएल रिफॉर्म्युलेशन. XML दस्तऐवजावर प्रक्रिया करण्याची प्रक्रिया खालीलप्रमाणे आहे. त्याच्या मजकुराचे विश्लेषण एका विशेष कार्यक्रमाद्वारे केले जाते XML प्रोसेसर . XML प्रोसेसरला दस्तऐवजातील डेटाच्या शब्दार्थाविषयी काहीही माहिती नसते; ते फक्त दस्तऐवजाचा मजकूर पार्स करते आणि XML नियमांच्या संदर्भात त्याची शुद्धता तपासते. दस्तऐवज असल्यास(सुसंगत), नंतर मजकूर पार्सिंगचे परिणाम XML प्रोसेसरद्वारे ऍप्लिकेशन प्रोग्राममध्ये हस्तांतरित केले जातात, जे त्यांची अर्थपूर्ण प्रक्रिया करते; जर दस्तऐवज चुकीचे स्वरूपित केले असेल, म्हणजे, त्यात वाक्यरचना त्रुटी असतील, तर XML प्रोसेसरने वापरकर्त्यास त्यांचा अहवाल देणे आवश्यक आहे.

८.१.२. XML चे अनुप्रयोग

प्रश्न उद्भवतो: "रिक्त भाषा" वापरण्यात काय अर्थ आहे, स्वतःची सामग्री नसलेली? वस्तुस्थिती अशी आहे की, स्पष्ट साधेपणा असूनही, XML मध्ये डेटाच्या शुद्धतेवर लक्ष ठेवण्यासाठी बरीच अत्याधुनिक यंत्रणा आहे, दस्तऐवजातील श्रेणीबद्ध संबंध तपासण्याची परवानगी देते आणि सर्वात महत्त्वाचे म्हणजे, या डेटाचे स्वरूप काहीही असो, डेटा संचयित करण्यासाठी दस्तऐवजांसाठी एकच मानक स्थापित करते. . एक्सएमएल भाषेच्या वापराच्या काही क्षेत्रांवर बारकाईने नजर टाकूया.

पारंपारिक डेटा प्रक्रियावर सूचीबद्ध केलेल्या क्षमता आम्हाला माहिती संग्रहित करण्यासाठी आणि सादर करण्यासाठी प्लॅटफॉर्म-स्वतंत्र मानक म्हणून XML विचारात घेण्यास अनुमती देतात, जे इतर आधुनिक तंत्रज्ञान (विशेषतः जावा तंत्रज्ञान) च्या संयोगाने कोणतेही मशीन-स्वतंत्र अनुप्रयोग तयार करण्यासाठी आधार बनू शकतात, ज्यात सर्व्हर आणि क्लायंट दरम्यान डेटा एक्सचेंज. याव्यतिरिक्त, XML-आधारित क्वेरी भाषा ज्या आज सक्रियपणे विकसित केल्या जात आहेत त्या SQL भाषेशी गंभीरपणे स्पर्धा करू शकतात. दस्तऐवज चालित प्रोग्रामिंग XML दस्तऐवज विद्यमान इंटरफेस आणि घटकांमधून अनुप्रयोग तयार करण्यासाठी कंटेनर म्हणून काम करू शकतात. या प्रकरणात, दस्तऐवजात वापरकर्ता इंटरफेस घटक आणि डेटा प्रोसेसिंग मॉड्यूल्सचे संदर्भ असतात जे पृष्ठ स्क्रीनवर प्रदर्शित होताना जोडलेले असतात. घटक संग्रहणआधुनिक प्रोग्रामिंग घटकांच्या वापरावर आधारित आहे, जे आदर्शपणे साध्या अतिरिक्त कोडिंगचा वापर करून एका संपूर्णमध्ये सहजपणे एकत्र केले जावे. याचा आधार घटकांचे संग्रहण आहे, ज्यासाठी, त्यांच्या स्टोरेजसाठी आणि त्यानंतरच्या वापरासाठी एकसमान दृष्टीकोन आवश्यक आहे. नजीकच्या भविष्यात, XML दस्तऐवज बायनरी मॉड्यूल्स म्हणून घटक संचयित करण्यासाठी पर्याय प्रदान करतील यावर विश्वास ठेवण्याचे सर्व कारण आहे, जे आज सामान्य आहे. डेटा एम्बेडिंगएकदा आम्ही XML डेटाची रचना परिभाषित केल्यानंतर, या डेटावर प्रक्रिया करणारा कोड जनरेटर लिहिणे मूलभूतपणे सोपे आहे. असे सॉफ्टवेअर विकसित होत असताना, सर्व नियमित डेटा प्रक्रिया (त्याची अचूकता तपासणे, आवश्यक स्वरूपातील सादरीकरण इ.) स्वयंचलित केली जाऊ शकते, ज्यामुळे विकसकांना तयार होत असलेल्या उत्पादनाच्या गैर-मानक भागांवर लक्ष केंद्रित करता येते.

८.१.३. XML दस्तऐवज संरचना

XML दस्तऐवजात घोषणा, घटक, टिप्पण्या, विशेष वर्ण आणि निर्देश असतात.

दस्तऐवजाच्या या सर्व घटकांचे या प्रकरणात वर्णन केले आहे.

8.1.3.1. घटक आणि गुणधर्म हे XMLटॅग केलेली भाषा दस्तऐवज चिन्हांकित करणे. दुसऱ्या शब्दांत, कोणताही XML दस्तऐवज एक संग्रह आहेघटक , आणि प्रत्येक घटकाची सुरुवात आणि शेवट नावाच्या विशेष चिन्हांनी दर्शविला जातो.

टॅग<" и ">घटकामध्ये तीन भाग असतात: प्रारंभ टॅग, सामग्री आणि समाप्ती टॅग. टॅग हा कोन कंसात बंद केलेला मजकूर आहे "

". एंड टॅगचे नाव स्टार्ट टॅगसारखेच आहे, परंतु फॉरवर्ड स्लॅश "/" ने सुरू होते. उदाहरण XML घटक:

सेर्गेई डोव्हलाटोव्ह , घटकांची नावे केस संवेदनशील असतात, उदा. आणि ही विविध घटकांची नावे आहेत. क्लोजिंग टॅग नेहमी आवश्यक असतो. टॅग असेल तररिक्त

<элемент/>

, म्हणजे सामग्री आणि क्लोजिंग टॅग नाही, नंतर त्याचे एक विशेष फॉर्म आहे: कोणताही घटक असू शकतोविशेषता

, घटकाबद्दल अतिरिक्त माहिती असलेले.

गुणधर्म नेहमी घटकाच्या प्रारंभ टॅगमध्ये समाविष्ट केले जातात आणि यासारखे दिसतात:

". एंड टॅगचे नाव स्टार्ट टॅगसारखेच आहे, परंतु फॉरवर्ड स्लॅश "/" ने सुरू होते. उदाहरण XML घटक:

विशेषता_नाव="विशेषता_मूल्य"

विशेषतामध्ये मूल्य असणे आवश्यक आहे, जे नेहमी एकल किंवा दुहेरी अवतरणांमध्ये संलग्न केले जाणे आवश्यक आहे. विशेषता नावे केस संवेदनशील देखील आहेत. गुणधर्म असलेल्या घटकाचे उदाहरण: घटकांनी एकतर एकमेकांचे अनुसरण केले पाहिजे किंवा एकमेकांच्या आत नेस्टेड केले पाहिजे: भाषणाचा भाग ब्रॉडस्की, जोसेफ

मार्च ऑफ द लोनली

वरील वर्णनावरून हे स्पष्ट होते की XML वाक्यरचना HTML वाक्यरचनेशी साम्य आहे (जे नैसर्गिक आहे, कारण ते दोन्ही समान भाषेच्या SGML च्या बोली आहेत), परंतु योग्य XML दस्तऐवजांच्या डिझाइनसाठी आवश्यकता जास्त आहे. XML आणि HTML मधील आणखी एक महत्त्वाचा फरक म्हणजे घटकांची सामग्री, म्हणजेच प्रारंभ आणि शेवटच्या टॅगमधील प्रत्येक गोष्ट डेटा मानली जाते.

याचा अर्थ XML HTML प्रमाणे जागा आणि लाइन ब्रेककडे दुर्लक्ष करत नाही.

८.१.३.२. प्रस्तावना आणि निर्देश कोणताही XML दस्तऐवज यात असतोप्रस्तावना आणिमूळ घटक

भाषणाचा भाग ब्रॉडस्की, जोसेफ

, उदाहरणार्थ: या उदाहरणात, प्रस्तावना एकल केली आहे निर्देश(दस्तऐवजाची पहिली ओळ) XML आवृत्ती दर्शवते. त्याच्या पाठोपाठ एक अद्वितीय नाव असलेला XML घटक येतो, ज्यामध्ये इतर सर्व घटक असतात आणि त्याला रूट म्हणतात. डायरेक्टिव्ह (प्रोसेसिंग इंस्ट्रक्शन) हे विशेष टॅगमध्ये बंद केलेले अभिव्यक्ती आहे "

", ज्यात XML दस्तऐवजावर प्रक्रिया करणाऱ्या प्रोग्रामच्या सूचना आहेत. XML मानक फक्त एक निर्देश राखून ठेवते

, या दस्तऐवजाशी संबंधित असलेल्या XML भाषेची आवृत्ती दर्शविते (अद्याप XML ची दुसरी आवृत्ती नाही). खरं तर, हा निर्देश काहीसा समृद्ध आहे आणि त्याच्या सर्वात सामान्य स्वरूपात असे दिसते:

येथे एन्कोडिंग विशेषता दस्तऐवजाचे वर्ण एन्कोडिंग निर्दिष्ट करते. डीफॉल्टनुसार, XML दस्तऐवज UTF-8 किंवा UTF-16 फॉरमॅटमध्ये तयार केले जावेत.

इतर कोणतेही वर्ण एन्कोडिंग वापरले असल्यास, उदाहरणामध्ये दाखवल्याप्रमाणे, टेबल A7.1 नुसार त्याचे नाव या विशेषतामध्ये सूचित केले जावे. स्टँडअलोन विशेषता दस्तऐवजात आहे की नाही हे सूचित करते. होय मूल्याचा अर्थ असा आहे की असे कोणतेही विभाग नाहीत, मूल्य नाही म्हणजे ते अस्तित्वात आहेत. ८.१.३.३. टिप्पण्या XML दस्तऐवज असू शकतात

  • टिप्पण्या",
  • , जे दस्तऐवजावर प्रक्रिया करणाऱ्या अर्जाद्वारे दुर्लक्षित केले जातात. टिप्पण्या HTML प्रमाणेच नियमांचे पालन करतात:

तुमची टिप्पणी सुरू करा "

टिप्पण्यांमध्ये "--" वर्ण वापरू नका.

उदाहरण टिप्पण्या: ८.१.३.४. नावे आणि तपशीलघटक, विशेषता आणि विभाग युनिकोड अक्षराने सुरू झाले पाहिजेत आणि त्यात अक्षरे, संख्या, पूर्णविराम (.), अंडरस्कोअर (_), आणि हायफन (-) यांचा समावेश असावा. एकमात्र निर्बंध असा आहे की त्यांनी कोणत्याही परिस्थितीत xml अक्षरांच्या संयोगाने सुरुवात करू नये; अशी नावे भविष्यातील भाषा विस्तारासाठी राखीव आहेत. हे महत्त्वाचे आहे की मानक केवळ नावांमध्ये इंग्रजी अक्षरेच नव्हे तर इतर कोणत्याही अक्षरांचा वापर करण्यास परवानगी देते, जरी विद्यमान XML प्रोसेसर अनेकदा त्यांच्या निर्मात्यांच्या मनात असलेल्या एन्कोडिंग सिस्टमद्वारे मर्यादित असतात. म्हणूनच आम्ही आमच्या उदाहरणांमध्ये इंग्रजीमध्ये नावे लिहितो.

डेटा, म्हणजे, घटक सामग्री आणि विशेषता मूल्ये, पुढील विभागात सूचीबद्ध केलेल्या वर्णांव्यतिरिक्त इतर कोणत्याही वर्णांचा समावेश असू शकतो.

८.१.३.५. विशेष वर्ण

XML मधील अनेक वर्ण राखीव आहेत आणि ते एका विशिष्ट प्रकारे दर्शविले जाणे आवश्यक आहे:

इच्छित असल्यास, आपण युनिकोड मानकांमध्ये अंकीय वर्ण एन्कोडिंग वापरू शकता. या प्रकरणात, चिन्ह त्याच्या दशांश कोडद्वारे निर्दिष्ट केले जाऊ शकते ( कोड; ) किंवा हेक्साडेसिमल कोड ( कोड; ). उदाहरणार्थ © कॉपीराइट चिन्हाचे प्रतिनिधित्व करते © , ए - रशियन पत्र .

जसे आपण नंतर पाहणार आहोत, अशा बांधकामांच्या वापरामध्ये XML हे HTML पेक्षा खूप समृद्ध आहे, कारण ते दस्तऐवजांच्या मजकुरात कोणत्याही प्रतिकात्मक अभिव्यक्ती बदलण्याची परवानगी देते.

८.१.३.६. CDATA विभाग XML घटकांच्या सामग्रीमध्ये अवैध वर्ण समाविष्ट करण्याचा दुसरा मार्ग म्हणजे तथाकथित वापरणे. CDATA विभाग

(कॅरेक्टर डेटावरून संक्षिप्त, म्हणजे वर्ण डेटा). आपण लेआउट घटकाची सामग्री HTML मजकूराचा एक तुकडा बनवू इच्छितो, उदाहरणार्थ:

शीर्षक

हे बांधकाम चुकीचे आहे, कारण या प्रकरणात HTML H1 टॅग XML टॅग म्हणून समजला जाईल. लेआउट घटकाची संपूर्ण सामग्री डेटा म्हणून मानली जावी यासाठी, आम्ही त्यास CDATA विभागात संलग्न करणे आवश्यक आहे:जसे की आपण या उदाहरणावरून पाहू शकतो, CDATA विभाग परिसीमकांमध्ये संलग्न आहे

.

या विभागातील प्रत्येक गोष्ट वर्ण डेटा मानली जाते; विशेषतः, CDATA विभाग नेस्ट केले जाऊ शकत नाहीत.

८.१.४. विभाग आणि त्यांच्या घोषणा 8.1.4.1. XML दस्तऐवज विभागभौतिकदृष्ट्या, XML दस्तऐवजात अनेक असू शकतात विभाग(संस्था). या प्रकरणात, दस्तऐवजाचा मूळ घटक देखील एक विभाग आहे, ज्याला म्हणतात

दस्तऐवजाचा विभाग , जरी ते कोणत्याही प्रकारे विशेषतः डिझाइन केलेले नाही. सर्व विभागांमध्ये सामग्री आहे; दस्तऐवज विभाग आणि बाह्य डीटीडी वगळता त्या सर्वांचे नाव आहे.(विश्लेषण न केलेले अस्तित्व) एक संसाधन आहे ज्याची सामग्री XML प्रोसेसरद्वारे पार्स न करता बाह्य डेटा म्हणून हाताळली जाते (उदाहरणार्थ, XML दस्तऐवज नसलेला मजकूर). विश्लेषण न केलेले विभाग नेहमी असतात नोटेशन, त्यांचे स्वरूप दर्शवित आहे. विश्लेषण केलेले विभाग(विश्लेषित संस्था) मजकूर प्रतिस्थापनासाठी डिझाइन केलेले आहेत: जेव्हा जेव्हा XML प्रोसेसरला दस्तऐवजातील अशा विभागाचे नाव आढळते तेव्हा ते त्या विभागातील सामग्रीसह बदलते.

८.१.४.२. अंतर्गत विभाग

विभाग घोषणा अंतर्गत आणि बाह्य विभागल्या आहेत. अंतर्गत विभाग घोषणाअसे दिसते:

यात ऑब्जेक्टची सामग्री (मूल्य पॅरामीटर) समाविष्ट आहे आणि विभागाच्या नावासाठी हे मूल्य बदलण्यासाठी वापरले जाते. उदाहरणार्थ, आम्ही पुस्तकांसह उदाहरणामध्ये विशेषता सादर करू शकतो शैलीआणि शैली सेट करण्यासाठी अंतर्गत विभाग वापरा:

]> विशेषतामध्ये मूल्य असणे आवश्यक आहे, जे नेहमी एकल किंवा दुहेरी अवतरणांमध्ये संलग्न केले जाणे आवश्यक आहे. विशेषता नावे केस संवेदनशील देखील आहेत. गुणधर्म असलेल्या घटकाचे उदाहरण: घटकांनी एकतर एकमेकांचे अनुसरण केले पाहिजे किंवा एकमेकांच्या आत नेस्टेड केले पाहिजे: भाषणाचा भाग ब्रॉडस्की, जोसेफ

या उदाहरणावरून हे स्पष्ट होते विभागाचा दुवा (अस्तित्व संदर्भ) हे विशिष्ट वर्ण संदर्भासारखेच दिसते, म्हणजे त्याचे स्वरूप &नाव आहे; . खरं तर, विशेष वर्ण संदर्भांप्रमाणेच आहेत, परंतु संबंधित विभाग XML भाषेच्या अंतर्गत घोषणामध्ये स्पष्टपणे निर्दिष्ट केले आहेत. दस्तऐवजाचा आकार कमी करण्यासाठी संक्षेप निर्दिष्ट करण्यासाठी आणि वारंवार बदललेल्या दस्तऐवज फील्डसाठी नोटेशन्स सादर करण्यासाठी असे मजकूर पर्याय उपयुक्त आहेत. म्हणून, उदाहरणार्थ, आम्ही अंतर्गत विभागात प्रकाशनाच्या पुढील पुनरावृत्तीची तारीख ठेवू शकतो आणि नंतर केवळ या विभागाचे मूल्य बदलू शकतो.

८.१.४.३. बाह्य विभाजने

दोन पर्याय आहेत बाह्य विभाग घोषणा:

पहिला पर्याय म्हणतात सिस्टम विभाजन, दुसरा सार्वजनिक विभाग. ते दोन्ही विभागाचे नाव त्याच्या URI द्वारे निर्दिष्ट केलेल्या बाह्य संसाधनाशी संबद्ध करतात, जे एन्कोड केलेल्या स्वरूपात असले पाहिजे आणि त्यात नसावे.बाह्य संसाधनाचा URI म्हणतात

  • विभाजनाचा सिस्टम आयडी
  • . बाह्य संसाधनाचा वापर अनेक घटकांवर अवलंबून असतो:
  • घोषणेमध्ये विभाग नोटेशन निर्दिष्ट करणारे NDATA पॅरामीटर असल्यास, विभाग अनपार्स केला जातो. जर NDATA पॅरामीटर निर्दिष्ट केले नसेल, तर विभाग पार्स केला जाईल आणि संबंधित संसाधन XML दस्तऐवज असणे आवश्यक आहे. याचा अर्थ असा की विभागाच्या दुव्याऐवजी, दस्तऐवजाच्या मजकुरात संबंधित संसाधनाचा मजकूर समाविष्ट असेल.सार्वजनिक विभागात निर्दिष्ट करणारी एक ओळ असू शकते

सार्वजनिक विभाग आयडी

विश्लेषित केले जाणारे बाह्य विभाग निर्देशाने सुरू होणे आवश्यक आहे, ज्यामध्ये आवृत्ती क्रमांक असू शकत नाही, परंतु त्यात एक वर्ण एन्कोडिंग असणे आवश्यक आहे. हा निर्देश इनलाइन मजकूराचा भाग नाही.

८.१.५. दस्तऐवज प्रकार घोषणा

XML दस्तऐवज प्रकार घोषणा(दस्तऐवज प्रकार घोषणा) समाविष्टीत आहे दस्तऐवज प्रकार व्याख्या(दस्तऐवज प्रकार व्याख्या, DTD) किंवा एकाकडे निर्देश करतात. डीटीडी हे एक विशेष व्याकरण आहे जे विशिष्ट वर्गाच्या दस्तऐवजांच्या वाक्यरचनाचे वर्णन करते; डीटीडी तयार करण्याच्या नियमांची चर्चा प्रकरणामध्ये केली आहे. ८.२. येथे आम्ही फक्त त्या घोषणांचे वर्णन करतो जे DTD ला प्रवेश प्रदान करतात. दस्तऐवज प्रकार घोषणा, जसे की विभाग घोषणा, अंतर्गत किंवा बाह्य असू शकते. अंतर्गत घोषणा असे दिसते:

आणि बाह्य विभाजनांप्रमाणेच बाह्य समान दोन पर्याय:

अशा प्रकारे, दस्तऐवज प्रकार घोषणा आणि विभाग घोषणा यातील फरक फक्त एवढा आहे:

  • हे कीवर्डने सुरू होते!DOCTYPE, नाही!ENTITY;
  • त्याचे शरीर चौकोनी कंसात बंद केलेले असू शकते.

अशा घोषणेचे नाव ते वर्णन केलेल्या मूळ घटकाच्या नावाशी जुळले पाहिजे आणि शरीराने DTD बांधकामाच्या नियमांचे पालन केले पाहिजे आणि अध्यायात वर्णन केले जाईल. ८.२.

आत्तासाठी, लक्षात घ्या की त्यात विभाग घोषणा असू शकतात. मध्ये अंतर्गत घोषणेचे उदाहरण दिले होते. बाह्य घोषणांची उदाहरणे: लक्षात घ्या की बाह्य दस्तऐवज प्रकार घोषणेमध्ये डीटीडीचा संदर्भ देखील असू शकतो, ज्याला म्हणतातबाह्य उपसंच DTD, आणि बाह्य DTD (याला म्हणतातअंतर्गत उपसंच

डीटीडी).

८.१.६. उदाहरण XML दस्तऐवज

]> वर वर्णन केलेल्या सर्व संकल्पना एका संपूर्ण मध्ये ठेवण्यासाठी, येथे एका संपूर्ण XML दस्तऐवजाचे उदाहरण आहे ज्यामध्ये बुकस्टोअर किंमत सूची आहे. नशिबात मार्च सर्जी 60.00 विशेषतामध्ये मूल्य असणे आवश्यक आहे, जे नेहमी एकल किंवा दुहेरी अवतरणांमध्ये संलग्न केले जाणे आवश्यक आहे. विशेषता नावे केस संवेदनशील देखील आहेत. गुणधर्म असलेल्या घटकाचे उदाहरण: डोव्हलाटोव्ह जोसेफ 55.00 ब्रॉडस्की अँटिगोन 103.50

सोफोकल्स

20. XML स्कीमाचे वर्णन करण्यासाठी भाषा

DTD योजना. DTD योजनांचे तोटे. XDR सर्किट्स. XDR योजनांचे घटक आणि विशेषता.

    विशेष अर्थ असलेले आणि दस्तऐवजाच्या सामग्रीचे वर्णन करण्यास मदत करणारे आपले स्वतःचे टॅग तयार करण्याची कल्पना स्वतःच आश्चर्यकारक आहे. परंतु प्रत्येक वापरकर्त्याने स्वतःचे वर्णन तयार केले तर ते कसे ओळखता येईल? यासाठी, XML तपशील अशा "होममेड" टॅगचे वर्णन करण्यासाठी स्कीमा वापरते. ते यासाठी आवश्यक आहेत:

    मार्कअप नेमके काय आहे याचे वर्णन करा;

मार्कअप म्हणजे नेमके काय ते वर्णन करा.

    DTD (दस्तऐवज प्रकार व्याख्या) ही एक दस्तऐवज प्रकार परिभाषा भाषा आहे जी मूळत: SGML दस्तऐवजाच्या संरचनेचे वर्णन करण्यासाठी भाषा म्हणून वापरली जाते.

    XDR (XML Data Reduced) ही Microsoft द्वारे विकसित केलेली XML स्कीमा बोली आहे जी इंटरनेट एक्सप्लोरर आवृत्ती 4 आणि 5 मध्ये समर्थित होती.

    XML स्कीमा किंवा फक्त XSD (XML स्कीमा डेफिनिशन लँग्वेज) ही 2001 पासून W3C शिफारस आहे.

त्यापैकी पहिले दोन जवळून पाहूया. लॅब 11 मध्ये तिसरी सर्किट वर्णन भाषा समाविष्ट आहे.

DTD योजना

DTD स्कीमा एक दस्तऐवज मार्कअप टेम्पलेट प्रदान करते जे XML दस्तऐवजातील घटकांची उपस्थिती, क्रम आणि व्यवस्था आणि त्यांचे गुणधर्म निर्दिष्ट करते.

DTD च्या दृष्टीने, XML दस्तऐवजाच्या सामग्री मॉडेलचे वर्णन खालीलप्रमाणे केले जाऊ शकते:

प्रत्येक दस्तऐवज घटकात खालीलपैकी एक प्रकार असू शकतो:

वाक्यरचना

टिप्पणी द्या

फक्त मजकूर डेटा समाविष्टीत आहे

इतर घटक

फक्त मूल घटक असतात

मिश्र

मजकूर डेटा आणि मूल घटकांचे संयोजन आहे

काहीही समाविष्ट नाही

दस्तऐवज टॅगमध्ये आढळलेल्या गुणधर्मांचे वाक्यरचना वापरून स्वतंत्रपणे वर्णन केले आहे:

घटक_नाव विशेषता_नाव1 (प्रकार) डीफॉल्ट_मूल्य

…………………………………………………………………………………...

element_name attribute_nameN (type) default_value >

या प्रकरणात, DTD मधील विशेषता तीन प्रकारांपैकी एक असू शकते:

  • लेबल केलेली विशेषता

    गणनेसह विशेषता

विशेषता प्रकाराव्यतिरिक्त, आपण त्याचे स्वरूप देखील सेट करू शकता:

उदाहरण म्हणून, संदेशाचे वर्णन करणाऱ्या घटकासाठी स्ट्रिंग प्रकाराच्या विशेषतांचे वर्णन विचारात घ्या:

क्रमांक CDATA #आवश्यक

तारीख CDATA #आवश्यक

CDATA #FIXED कडून

स्थिती CDATA #IMPLIED>

जर या घटकामध्ये गणना केलेल्या विशेषता असतील, तर त्यांचे वर्णन यासारखे दिसू शकते, उदाहरणार्थ:

क्रमांक आयडी #आवश्यक

CDATA #REQUIRED कडून

इशारा (कमी | सामान्य | तातडीने) "सामान्य">

लेबल केलेले घटक गुणधर्म चार प्रकारचे असू शकतात:

शेवटी, DTD मध्ये खालील अनुक्रम घटना निर्देशक वापरले जाऊ शकतात:

प्रतीक

उदाहरण

वर्णन

सूची घटकांचा सलग वापर

यादीतील एक सदस्य वापरला जातो

एक आणि फक्त एक घटक वापरला जातो

पर्यायी वापर (0 किंवा 1 वेळ)

एक किंवा अधिक वेळा वापरले

शून्य किंवा अधिक वेळा वापरले

उदाहरण म्हणून, इलेक्ट्रॉनिक मेलबॉक्सच्या संरचनेचे वर्णन करणारा DTD आकृती येथे आहे:

या स्कीमाचे समाधान करणारा स्त्रोत XML दस्तऐवज, उदाहरणार्थ, असे दिसू शकतो:

[ईमेल संरक्षित]

[ईमेल संरक्षित]

पुन:

[ईमेल संरक्षित]

[ईमेल संरक्षित]

आठवण करून द्या

[ईमेल संरक्षित]

मला भेटण्याची आठवण करून द्या.

दस्तऐवजाच्या 2 रा ओळीकडे लक्ष द्या, जे डीटीडी स्कीमा असलेल्या फाईलची बाह्य लिंक दर्शवते.

मूलभूतपणे, डीटीडी XML दस्तऐवजात वापरण्याचे दोन मार्ग अनुमती देते.

अंतर्गत स्कीमा घोषणा:

बाह्य स्कीमा घोषित करणे:

शेवटी, आम्ही DTD योजनांचे खालील तोटे दाखवतो:

    ते XML उदाहरणे नाहीत. त्यासाठी पूर्णपणे वेगळी भाषा शिकणे आवश्यक आहे.

    अगदी साध्या मजकूर डेटाशिवाय ते डेटा प्रकारांवर नियंत्रण प्रदान करत नाहीत.

    ते XML उदाहरणे नाहीत, म्हणून ते HTML किंवा DHTML सारख्या इतर मार्कअप भाषांमध्ये सहज विस्तारित किंवा रूपांतरित केले जाऊ शकत नाहीत.

    XML नेमस्पेससाठी समर्थन पुरवत नाही.

XDR सर्किट

XML-Data हे Microsoft च्या स्कीमा भाषेचे पूर्ण नाव आहे आणि XML-DataReduced संपूर्ण शिफारसीचा "भाग" आहे. XDR स्कीमा XML चे एक उदाहरण आहे, उदा. सर्व वाक्यरचना नियम आणि XML मानकांचे पालन करते.

स्कीमा वापरून दस्तऐवज-स्तरीय डेटा तपासणी लागू करून, व्यवहार व्युत्पन्न आणि स्वीकारणारे अनुप्रयोग जास्तीत जास्त कामगिरीसाठी ऑप्टिमाइझ केले जाऊ शकतात. फील्ड जुळणी आणि रेकॉर्ड वैधता XML उदाहरण स्तरावर तपासली जाते.

XDR स्कीमामधील मूळ घटक नेहमी स्कीमा घटक असतो:

name="schema_name" xmlns="urn:schemas-microsoft-com:xml-data"

xmlns:dt="urn:schemas-microsoft-com:datatypes">

<-- Объявления других элементов -->

ElementType घटकामध्ये वाक्यरचना आहे:

content="(रिक्त | texOnly | eltOnly | मिश्रित)">

dt: "datatype" टाइप करा

मॉडेल="(खुले | बंद)"

ऑर्डर="(एक | seq | अनेक)"

ElementType घटकामध्ये खालील गुणधर्म असू शकतात:

विशेषता नाव

वर्णन

घटकाचे नाव

आयटम डेटा प्रकार

मूल्ये घेऊ शकतात:

उघडा - परवानगी वापरस्कीमामध्ये परिभाषित केलेले घटक नाहीत

बंद - स्कीमामध्ये परिभाषित न केलेले घटक वापरण्यास मनाई आहे

XML मधील मूल घटकांचा क्रम. वैध मूल्ये:

एक - एक दस्तऐवज अस्तित्वात आहे असे गृहीत धरले जाते

अनेक - कोणत्याही क्रमाने कितीही घटक

seq - घटक कठोरपणे निर्दिष्ट क्रमाने निर्दिष्ट केले आहेत.

ElementType साठी खालील गोष्टी चाइल्ड एलिमेंट्स म्हणून वापरल्या जाऊ शकतात:

घटकाचे नाव

वर्णन

मूल घटक घोषित करते

ElementType चे वर्णन देते

घटकाचा डेटा प्रकार ElementType प्रदान करते

घटकांचा क्रम परिभाषित करते

विशेषता परिभाषित करते

चाइल्ड एलिमेंटच्या AttributeType बद्दल माहिती परिभाषित करते

विशेषता घोषित करण्यासाठी वापरलेला वाक्यरचना आहे:

डीफॉल्ट="डिफॉल्ट-मूल्य"

dt:type="आदिम-प्रकार"

dt:values="गणित-मूल्ये"

आवश्यक="(होय|नाही)"

या बदल्यात, AttributeType घटकामध्ये खालील गुणधर्म असू शकतात:

अर्थ

वर्णन

डीफॉल्ट मूल्य

खालीलपैकी एक प्रकार:

अस्तित्व, संस्था, गणन, आयडी, आयड्रेफ, एनएमटोकन, एनएमटोकन्स, नोटेशन, स्ट्रिंग

वैध मूल्ये

विशेषता नाव

वर्णनात विशेषता उपस्थित असणे आवश्यक आहे असे सूचित करते

विशेषता घटकाचे वर्णन करण्यासाठी वाक्यरचना खालीलप्रमाणे आहे:

डीफॉल्ट="डिफॉल्ट-मूल्य"

type="विशेषता-प्रकार"

आणि त्याची संभाव्य मूल्ये असू शकतात:

अर्थ

मानक XML दस्तऐवजासाठी शुद्धतेचे दोन स्तर परिभाषित करते:

  • व्यवस्थित बांधले(चांगली रचना). सु-निर्मित दस्तऐवज XML सिंटॅक्सच्या सर्व सामान्य नियमांचे पालन करतो जे कोणत्याही XML दस्तऐवजावर लागू होतात. आणि जर, उदाहरणार्थ, स्टार्ट टॅगमध्ये संबंधित एंड टॅग नसेल, तर हे चुकीच्या पद्धतीने बांधले XML दस्तऐवज. योग्यरित्या तयार न केलेला दस्तऐवज XML दस्तऐवज मानला जाऊ शकत नाही; XML प्रोसेसरने (पार्सर) त्यावर सामान्यपणे प्रक्रिया करू नये आणि परिस्थितीला घातक त्रुटी म्हणून वर्गीकृत केले पाहिजे.
  • वैध(वैध). वैध दस्तऐवज काही अर्थविषयक नियमांचे देखील पालन करतो. त्रुटींची संख्या कमी करण्यासाठी, उदाहरणार्थ, दिलेल्या, विशिष्ट दस्तऐवज किंवा दस्तऐवजांच्या कुटुंबाची रचना आणि रचना कमी करण्यासाठी, पूर्वनिर्धारित, परंतु आधीच बाह्य नियमांचे पालन करण्यासाठी दस्तऐवजाच्या शुद्धतेची ही अधिक कठोर अतिरिक्त तपासणी आहे. हे नियम एकतर वापरकर्त्याद्वारे किंवा तृतीय-पक्ष विकसकांद्वारे विकसित केले जाऊ शकतात, उदाहरणार्थ, शब्दकोश किंवा डेटा एक्सचेंज मानकांचे विकसक. सामान्यतः, असे नियम विशेष फायलींमध्ये संग्रहित केले जातात - आकृत्या, जेथे दस्तऐवजाची रचना, घटकांची सर्व वैध नावे, विशेषता आणि बरेच काही तपशीलवार वर्णन केले आहे. आणि जर एखाद्या दस्तऐवजात, उदाहरणार्थ, घटकाचे नाव असेल जे पूर्वी स्कीमामध्ये परिभाषित केलेले नाही, तर XML दस्तऐवज मानला जातो. शून्य; नियम आणि स्कीमांचे अनुपालन तपासताना, तपासणारा XML प्रोसेसर (वापरकर्त्याच्या आवडीनुसार) त्रुटीची तक्रार करण्यास बांधील आहे.

या दोन संकल्पनांचे रशियन भाषेत, विशेषत: संकल्पनेचे सुस्थापित प्रमाणित भाषांतर नाही वैध, ज्याचे भाषांतर म्हणून देखील केले जाऊ शकते वैध, कायदेशीर, विश्वसनीय, फिट, किंवा अगदी नियम, मानके, कायद्यांचे पालन करण्यासाठी चाचणी केली. काही प्रोग्रामर दैनंदिन जीवनात स्थापित ट्रेसिंग पेपर वापरतात " वैध».

XML वाक्यरचना

हा विभाग फक्त चर्चा करतो योग्य बांधकाम XML दस्तऐवज, म्हणजेच त्यांची वाक्यरचना.

XML ही एक श्रेणीबद्ध रचना आहे जी कोणताही डेटा संग्रहित करण्यासाठी डिझाइन केलेली आहे; सर्वात महत्वाची अनिवार्य सिंटॅक्टिक आवश्यकता म्हणजे दस्तऐवजात फक्त एक आहे मूळ घटक(मूळ घटक) (वैकल्पिकपणे म्हणतात दस्तऐवज घटक). याचा अर्थ संपूर्ण दस्तऐवजाचा मजकूर किंवा इतर डेटा दरम्यान स्थित असणे आवश्यक आहे एकमेव स्टार्ट रूट टॅग आणि त्याच्याशी संबंधित एंड टॅग.

खालील सर्वात सोपं उदाहरण एक सु-निर्मित XML दस्तऐवज आहे: हे पुस्तक आहे: "छोटे पुस्तक" XML दस्तऐवजाची पहिली ओळ म्हणतात XML घोषणा(XML घोषणा) XML मानक (सामान्यतः 1.0) ची आवृत्ती दर्शविणारी एक पर्यायी स्ट्रिंग आहे आणि त्यात वर्ण एन्कोडिंग आणि बाह्य अवलंबन देखील समाविष्ट असू शकते. युनिकोड एन्कोडिंग UTF-8 आणि UTF-16 (UTF-32 ऐच्छिक आहे) चे समर्थन करण्यासाठी तपशीलासाठी XML प्रोसेसरची आवश्यकता आहे. ISO/IEC 8859 मानकांवर आधारित इतर एन्कोडिंग स्वीकार्य, समर्थित आणि मोठ्या प्रमाणावर वापरले जातात (परंतु इतर एन्कोडिंग देखील स्वीकार्य आहेत, उदाहरणार्थ, रशियन Windows-1251, KOI-8);

टिप्पणी द्याझाडात कुठेही ठेवता येते. XML टिप्पण्या टॅगच्या जोडीमध्ये ठेवल्या जातात . टिप्पणीमध्ये दोन हायफन (--) कुठेही वापरले जाऊ शकत नाहीत.

खाली XML वापरून चिन्हांकित केलेल्या साध्या स्वयंपाकाच्या रेसिपीचे उदाहरण आहे:

साधी भाकरी पीठ यीस्ट कोमट पाणी मीठ

रचना

या XML दस्तऐवजातील उर्वरित नेस्टेडचा समावेश आहे दस्तऐवज चिन्हांकित करणे. दुसऱ्या शब्दांत, कोणताही XML दस्तऐवज एक संग्रह आहे, त्यापैकी काही आहेत कोणताही घटक असू शकतोप्रस्तावना सामग्री. घटकसहसा ओपनिंग आणि क्लोजिंग टॅग असतात जे मजकूर आणि इतर घटकांना संलग्न करतात. टॅग उघडत आहेकोन कंसात घटकाचे नाव असते, उदाहरणार्थ, " »; बंद टॅगकोन कंसात समान नाव असते, परंतु नावापूर्वी फॉरवर्ड स्लॅश जोडला जातो, उदाहरणार्थ, “ ». घटक सामग्री(सामग्री) मजकूर आणि इतर (नेस्टेड) ​​घटकांसह, ओपनिंग आणि क्लोजिंग टॅग दरम्यान स्थित असलेली प्रत्येक गोष्ट आहे. खाली XML घटकाचे उदाहरण दिले आहे ज्यात एक ओपनिंग टॅग, एंड टॅग आणि घटकाची सामग्री आहे:

पुन्हा मळून घ्या, बेकिंग शीटवर ठेवा आणि ओव्हनमध्ये ठेवा.

पीठ

वरील उदाहरणामध्ये, घटक घटकामध्ये दोन गुणधर्म आहेत: रक्कम, ज्याचे मूल्य 3 आहे आणि युनिट, ज्याचे मूल्य ग्लास आहे. XML मार्कअपच्या दृष्टिकोनातून, वरील गुणधर्मांना काही अर्थ नाही, परंतु ते फक्त वर्णांचा संच आहेत.

मजकुराव्यतिरिक्त, घटकामध्ये इतर घटक असू शकतात:

सर्व साहित्य मिसळा आणि नीट मळून घ्या. कापडाने झाकून ठेवा आणि उबदार खोलीत एक तास सोडा. पुन्हा मळून घ्या, बेकिंग शीटवर ठेवा आणि ओव्हनमध्ये ठेवा.

या प्रकरणात, सूचना घटकामध्ये तीन चरण घटक असतात. XML आच्छादित घटकांना अनुमती देत ​​नाही. उदाहरणार्थ, खालील स्निपेट चुकीचे आहे कारण "em" आणि "मजबूत" घटक ओव्हरलॅप होतात.

सामान्य उच्चारण हायलाइट आणि उच्चारणसमर्पित

प्रत्येक XML दस्तऐवजात अगदी एक असणे आवश्यक आहे मूळ घटक(मूळ घटक किंवा दस्तऐवज घटक), त्यामुळे खालील तुकडा वैध XML दस्तऐवज मानला जाऊ शकत नाही.

अस्तित्व #1 अस्तित्व #2

सामग्रीशिवाय घटक दर्शविण्यासाठी, म्हणतात रिक्त घटक, आवश्यकएकल टॅग असलेले रेकॉर्डिंगचे एक विशेष प्रकार वापरा ज्यामध्ये घटकाच्या नावानंतर स्लॅश ठेवला जातो. DTD मध्ये एखादा घटक रिकामा घोषित केला नसल्यास, परंतु त्याच्यासाठी दस्तऐवजात कोणतीही सामग्री नसल्यास परवानगीरेकॉर्डिंगचा हा प्रकार वापरा. उदाहरणार्थ:

XML विशेष वर्ण लिहिण्याच्या दोन पद्धती परिभाषित करते: अस्तित्व संदर्भ आणि वर्ण संदर्भ. सार(एंटिटी) XML मधील नामांकित डेटाचा संदर्भ देते, सामान्यतः मजकूर, विशिष्ट विशेष वर्णांमध्ये. घटक संदर्भ(संस्थेचे संदर्भ) जिथे अस्तित्व असावे आणि त्यात अँपरसँड (“&”), अस्तित्वाचे नाव आणि अर्धविराम (“;”) असावे त्या ठिकाणी निर्दिष्ट केले आहे. XML मध्ये अनेक पूर्वनिर्धारित संस्था आहेत, जसे की “lt” (आपण “लिहिून त्याचा संदर्भ घेऊ शकता.< ») для левой угловой скобки и « amp » (ссылка - « & ») для амперсанда, возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков. Ниже приведён пример использования предопределённой сущности для избежания использования знака амперсанда в названии:

AT&T

पूर्वनिर्धारित घटकांच्या संपूर्ण यादीमध्ये & (“&”),< («<»), >(">"), " (""), आणि "("") - शेवटचे दोन विशेषता मूल्यांमध्ये सीमांकक लिहिण्यासाठी उपयुक्त आहेत. तुम्ही तुमची संस्था डीटीडी दस्तऐवजात परिभाषित करू शकता.

काहीवेळा नॉन-ब्रेकिंग स्पेस परिभाषित करणे आवश्यक असते, जी एचटीएमएलमध्ये बऱ्याचदा वापरली जाते आणि XML मध्ये अशी कोणतीही पूर्वनिर्धारित अस्तित्व नसते म्हणून सूचित केली जाते, ती लिहून ठेवली जाते आणि त्याचा वापर त्रुटी निर्माण करतो. या अतिशय सामान्य घटकाची अनुपस्थिती बऱ्याच प्रोग्रामरना आश्चर्यचकित करते आणि यामुळे त्यांच्या एचटीएमएल विकास XML वर स्थलांतरित करताना काही अडचणी निर्माण होतात.

चिन्ह क्रमांकाद्वारे दुवा(संख्यात्मक वर्ण संदर्भ) एखाद्या घटकाच्या संदर्भासारखे दिसते, परंतु अस्तित्वाच्या नावाऐवजी, # वर्ण आणि संख्या (दशांश किंवा हेक्साडेसिमल नोटेशनमध्ये) निर्दिष्ट केली आहे, जी युनिकोड वर्ण सारणीमधील वर्ण संख्या आहे. हे सामान्यत: असे वर्ण आहेत जे थेट एन्कोड केले जाऊ शकत नाहीत, जसे की ASCII-एनकोड केलेल्या दस्तऐवजातील अरबी अक्षर. अँपरसँडचे प्रतिनिधित्व खालीलप्रमाणे केले जाऊ शकते:

AT&T

वैध XML दस्तऐवज लिहिण्यासंदर्भात बरेच नियम आहेत, परंतु या संक्षिप्त विहंगावलोकनचा उद्देश फक्त XML दस्तऐवजाची रचना समजून घेण्यासाठी आवश्यक असलेली मूलभूत गोष्टी दर्शविण्याचा होता.

कथा

XML च्या जन्माचे वर्ष 1996 मानले जाऊ शकते, ज्याच्या शेवटी भाषेच्या तपशीलाची मसुदा आवृत्ती दिसून आली किंवा जेव्हा हे तपशील मंजूर केले गेले. हे सर्व 1986 मध्ये एसजीएमएल भाषेच्या देखाव्यापासून सुरू झाले.

SGML (Standard Generalized Markup Language) ने मार्कअप भाषा तयार करण्यासाठी स्वतःला लवचिक, सर्वसमावेशक आणि सर्वसमावेशक मेटा-भाषा म्हणून घोषित केले आहे. हायपरटेक्स्टची संकल्पना 1965 मध्ये दिसली (आणि मूलभूत तत्त्वे 1945 मध्ये तयार करण्यात आली) असूनही, SGML कडे हायपरटेक्स्ट मॉडेल नाही. SGML च्या निर्मितीला आत्मविश्वासाने विशालतेचा स्वीकार करण्याचा प्रयत्न म्हटले जाऊ शकते, कारण ते अशा क्षमता एकत्र करते जे अत्यंत क्वचितच वापरले जातात. ही त्याची मुख्य कमतरता आहे - जटिलता आणि परिणामी, या भाषेची उच्च किंमत केवळ मोठ्या कंपन्यांसाठी त्याचा वापर मर्यादित करते ज्यांना योग्य सॉफ्टवेअर खरेदी करणे आणि उच्च पगाराच्या तज्ञांना नियुक्त करणे परवडते. याव्यतिरिक्त, छोट्या कंपन्यांना क्वचितच समस्या येतात ज्या सोडवण्यासाठी SGML चा समावेश करण्याइतपत जटिल असतात.

इतर मार्कअप भाषा तयार करण्यासाठी एसजीएमएलचा सर्वाधिक वापर केला जातो; त्याच्या मदतीने हायपरटेक्स्ट दस्तऐवज मार्कअप भाषा तयार केली गेली - एचटीएमएल, ज्याचे तपशील 1992 मध्ये मंजूर झाले. इंटरनेटवरील दस्तऐवजांची झपाट्याने वाढणारी ॲरे व्यवस्थापित करण्याच्या गरजेशी त्याचे स्वरूप संबंधित होते. इंटरनेटवरील कनेक्शनच्या संख्येत वेगवान वाढ आणि त्यानुसार, वेब सर्व्हरला इलेक्ट्रॉनिक दस्तऐवज एन्कोड करण्याची आवश्यकता निर्माण झाली जी विकासाच्या उच्च अडचणीमुळे एसजीएमएलला सामोरे जाऊ शकली नाही. एचटीएमएलच्या आगमनाने, एक अतिशय सोपी मार्कअप भाषा, या समस्येचे त्वरीत निराकरण केले: त्याची शिकण्याची सुलभता आणि दस्तऐवज डिझाइन साधनांच्या संपत्तीमुळे ती इंटरनेट वापरकर्त्यांसाठी सर्वात लोकप्रिय भाषा बनली. परंतु वेबवरील दस्तऐवजांची संख्या आणि गुणवत्ता जसजशी वाढत गेली, तसतसे त्यावरील आवश्यकता देखील वाढल्या आणि एचटीएमएलची साधेपणा ही त्याची मुख्य कमतरता बनली. टॅगची मर्यादित संख्या आणि दस्तऐवजाच्या संरचनेबद्दल पूर्ण उदासीनता यामुळे W3C कन्सोर्टियमने प्रतिनिधित्व केलेल्या विकसकांना मार्कअप भाषा तयार करण्यास प्रवृत्त केले जी SGML सारखी जटिल आणि HTML सारखी प्राचीन नाही. परिणामी, HTML च्या साधेपणाला SGML च्या मार्कअप लॉजिकसह एकत्र करून आणि इंटरनेटच्या मागणीची पूर्तता करून, XML चा जन्म झाला.

सामर्थ्य आणि कमकुवतपणा

फायदे

दोष

  • मॉडेलिंगची अस्पष्टता.
  • XML ला भाषेमध्ये तयार केलेला डेटा प्रकार समर्थन नाही. यात सशक्त टायपिंग नाही, म्हणजेच “पूर्णांक”, “स्ट्रिंग”, “तारीख”, “बूलियन” इत्यादी संकल्पना आहेत.
  • XML द्वारे ऑफर केलेले श्रेणीबद्ध डेटा मॉडेल रिलेशनल मॉडेल आणि ऑब्जेक्ट-ओरिएंटेड आलेख आणि नेटवर्क डेटा मॉडेलच्या तुलनेत मर्यादित आहे.

वर्ल्ड वाइड वेबवर XML प्रदर्शित करणे

XML दस्तऐवज वापरकर्ता-प्रदर्शन करण्यायोग्य फॉर्ममध्ये रूपांतरित करण्याचे तीन सर्वात सामान्य मार्ग आहेत:

  1. CSS शैली लागू करणे;
  2. XSLT परिवर्तन लागू करणे;
  3. कोणत्याही प्रोग्रामिंग भाषेत XML दस्तऐवज हँडलर लिहिणे.

CSS किंवा XSL च्या वापराशिवाय, XML दस्तऐवज बहुतेक वेब ब्राउझरमध्ये साधा मजकूर म्हणून दिसतो. काही ब्राउझर, जसे की इंटरनेट एक्सप्लोरर, मोझिला आणि मोझिला फायरफॉक्स, दस्तऐवजाची रचना ट्री व्ह्यूमध्ये प्रदर्शित करतात, ज्यामुळे तुम्हाला माउस क्लिकसह नोड्स कोलॅप्स आणि विस्तृत करता येतात.

CSS शैली लागू करणे

ही प्रक्रिया प्रदर्शनासाठी HTML दस्तऐवजावर CSS लागू करण्यासारखीच आहे.

ब्राउझरमध्ये प्रदर्शित झाल्यावर CSS लागू करण्यासाठी, XML दस्तऐवजात स्टाईल शीटची विशिष्ट लिंक असणे आवश्यक आहे. उदाहरणार्थ:

हे HTML पद्धतीपेक्षा वेगळे आहे, जे घटक वापरते .

XSLT परिवर्तन लागू करणे

XSL एक तंत्रज्ञान आहे जे XML दस्तऐवज डेटाचे स्वरूपन किंवा रूपांतर कसे करायचे याचे वर्णन करते. दस्तऐवज ब्राउझरमध्ये प्रदर्शित करण्यासाठी योग्य स्वरूपामध्ये रूपांतरित केला जातो. ब्राउझर हा XSL चा सर्वात सामान्य वापर आहे, परंतु XSL सह तुम्ही XML चे कोणत्याही स्वरूपात रूपांतर करू शकता हे विसरू नका, उदा.

आम्ही आमचा XML चा अभ्यास पुन्हा सुरू ठेवतो आणि या लेखात आम्ही अशा XML रचनांशी परिचित होऊ जसे की प्रक्रिया करण्याच्या सूचना, टिप्पण्या, विशेषता आणि इतर XML घटक. हे घटक मूलभूत आहेत आणि आपल्याला लवचिकपणे, मानकांनुसार काटेकोरपणे, कोणत्याही जटिलतेची कागदपत्रे चिन्हांकित करण्याची परवानगी देतात.

XML टॅग सारख्या काही मुद्द्यांवर आम्ही आधीच्या लेखात अर्धवट चर्चा केली आहे “”. आता आपण या विषयावर पुन्हा स्पर्श करू आणि त्याचे अधिक तपशीलवार परीक्षण करू. हे विशेषतः XML रचनांचे संपूर्ण चित्र समजून घेणे आपल्यासाठी सोपे करण्यासाठी केले जाते.

XML घटक. रिक्त आणि रिक्त नसलेले XML घटक

मागील लेखात नमूद केल्याप्रमाणे, XML मधील टॅग केवळ HTML प्रमाणेच मजकूर चिन्हांकित करत नाहीत, परंतु वैयक्तिक घटक (वस्तू) हायलाइट करतात. या बदल्यात, घटक पदानुक्रमाने दस्तऐवजात माहिती व्यवस्थित करतात, ज्यामुळे त्यांना XML भाषेची मुख्य संरचनात्मक एकक बनते.

XML मध्ये, घटक दोन प्रकारचे असू शकतात - रिक्त आणि नॉन-रिक्त. रिक्त घटकांमध्ये कोणताही डेटा नसतो, जसे की मजकूर किंवा इतर रचना. रिक्त घटकांच्या विपरीत, रिक्त नसलेल्या घटकांमध्ये कोणताही डेटा असू शकतो, जसे की मजकूर किंवा इतर XML घटक आणि रचना. वरील मुद्दा समजून घेण्यासाठी, रिक्त आणि रिक्त नसलेल्या XML घटकांची उदाहरणे पाहू.

रिक्त XML घटक

नॉन-रिक्त XML घटक

घटक सामग्री...

जसे आपण वरील उदाहरणावरून पाहू शकतो, रिक्त घटक आणि रिक्त नसलेल्या घटकांमधील मुख्य फरक हा आहे की त्यामध्ये फक्त एक टॅग असतो. याव्यतिरिक्त, हे देखील लक्षात घेण्यासारखे आहे की XML मध्ये सर्व नावे केस संवेदनशील आहेत. याचा अर्थ myElement, MyElement, MYELEMENT, इत्यादी नावे. एकमेकांपासून भिन्न आहेत, म्हणून भविष्यात चुका टाळण्यासाठी हा क्षण त्वरित लक्षात ठेवला पाहिजे.
तर, आम्ही घटक शोधून काढले. आता पुढील मुद्द्याकडे वळूया, जी XML दस्तऐवजांची तार्किक संस्था आहे.

XML दस्तऐवजांची तार्किक संघटना. XML डेटाची ट्री संरचना

तुम्हाला आठवत असेल, XML भाषेची मुख्य रचना घटक आहे, ज्यामध्ये इतर नेस्टेड रचना असू शकतात आणि त्याद्वारे झाडाच्या रूपात श्रेणीबद्ध रचना तयार केली जाऊ शकते. या प्रकरणात, मूळ घटक मूळ असेल आणि इतर सर्व मूल घटक XML झाडाच्या फांद्या आणि पाने असतील.

वरील सार समजून घेणे सोपे करण्यासाठी, उदाहरणासह खालील प्रतिमा पाहू.

जसे आपण पाहू शकतो, XML दस्तऐवज वृक्ष म्हणून आयोजित करणे ही प्रक्रिया करण्यासाठी अगदी सोपी रचना आहे. त्याच वेळी, झाडाची अभिव्यक्त जटिलता स्वतःच खूप छान आहे. XML मधील ऑब्जेक्ट्सचे वर्णन करण्याचा सर्वात इष्टतम मार्ग म्हणजे झाडाचे प्रतिनिधित्व.

XML विशेषता. XML मध्ये विशेषता लिहिण्याचे नियम

XML मध्ये, घटकांमध्ये त्यांना नियुक्त केलेल्या मूल्यांसह गुणधर्म देखील असू शकतात, जे एकल किंवा दुहेरी अवतरणांमध्ये ठेवलेले असतात. घटकाची विशेषता खालीलप्रमाणे सेट केली आहे:

या प्रकरणात, "विशेषता" नावाची विशेषता आणि मूल्य "मूल्य" वापरले गेले. हे लगेच लक्षात घेण्यासारखे आहे की XML विशेषतामध्ये काही मूल्य असणे आवश्यक आहे आणि ते रिक्त असू शकत नाही. अन्यथा, कोड XML दृष्टिकोनातून चुकीचा असेल.

अवतरण चिन्हांच्या वापराकडे लक्ष देणे देखील योग्य आहे. विशेषता मूल्ये एकतर किंवा दुहेरी अवतरणांमध्ये संलग्न केली जाऊ शकतात. याव्यतिरिक्त, इतरांच्या आत काही अवतरण वापरणे देखील शक्य आहे. दाखवण्यासाठी, खालील उदाहरणांचा विचार करा.

आम्ही इतर XML रचना पाहण्याआधी, हे देखील लक्षात घेण्यासारखे आहे की विशेषता तयार करताना, विशेष वर्ण जसे की अँपरसँड "&" किंवा अँगल ब्रॅकेट " व्हॅल्यू म्हणून वापरले जाऊ शकत नाहीत.<>" हे वर्ण नियंत्रण वर्ण म्हणून राखीव आहेत (“&” एक अस्तित्व आहे आणि “<» и «>» घटक टॅग उघडा आणि बंद करा) आणि त्याचा "शुद्ध स्वरूपात" वापर केला जाऊ शकत नाही. त्यांचा वापर करण्यासाठी, आपल्याला विशेष वर्ण पुनर्स्थित करणे आवश्यक आहे.

XML प्रक्रिया सूचना (प्रक्रिया सूचना). XML घोषणा

XML मध्ये दस्तऐवजात सूचना समाविष्ट करण्याची क्षमता आहे ज्यात विशिष्ट दस्तऐवजावर प्रक्रिया करणाऱ्या अनुप्रयोगांसाठी विशिष्ट माहिती असते. XML मध्ये प्रक्रिया करण्याच्या सूचना खालीलप्रमाणे तयार केल्या आहेत.

जसे तुम्ही वरील उदाहरणावरून पाहू शकता, XML मध्ये, प्रक्रिया करण्याच्या सूचना प्रश्नचिन्हासह कोपऱ्यातील अवतरणांमध्ये बंद केल्या आहेत. हे थोडेसे नेहमीप्रमाणे आहे जे आम्ही पहिल्या PHP धड्यांमध्ये पाहिले. प्रक्रिया सूचनेचा पहिला भाग अनुप्रयोग किंवा प्रणाली निर्दिष्ट करतो ज्यासाठी या निर्देशाचा दुसरा भाग किंवा त्यातील सामग्री अभिप्रेत आहे. तथापि, प्रक्रिया सूचना केवळ त्या अर्जांसाठी वैध आहेत ज्यांना ते संबोधित केले आहेत. प्रक्रिया निर्देशांचे उदाहरण खालील सूचना असू शकते.

हे लक्षात घेण्यासारखे आहे की XML मध्ये एक विशेष रचना आहे जी प्रक्रिया निर्देशांसारखीच आहे, परंतु ती स्वतः एक नाही. आम्ही XML घोषणेबद्दल बोलत आहोत जे प्रोसेसिंग सॉफ्टवेअरला XML दस्तऐवजाच्या गुणधर्मांबद्दल काही माहिती देते, जसे की एन्कोडिंग, दस्तऐवज ज्या भाषेत लिहिला आहे त्याची आवृत्ती इ.

जसे आपण वरील उदाहरणावरून पाहू शकता, XML घोषणेमध्ये तथाकथित स्यूडो-विशेषता आहेत, जे आम्ही वर बोललो त्या नियमित गुणधर्मांसारखेच आहेत. वस्तुस्थिती अशी आहे की, व्याख्येनुसार, XML घोषणा आणि प्रक्रिया निर्देशांमध्ये विशेषता असू शकत नाहीत, म्हणून या घोषणांना स्यूडो-विशेषता म्हणतात. विविध चुका टाळण्यासाठी हे भविष्यासाठी लक्षात ठेवण्यासारखे आहे.

आम्ही स्यूडो-विशेषता हाताळल्या असल्याने, त्यांचा अर्थ काय आहे ते पाहूया.

  • एन्कोडिंग - XML ​​दस्तऐवज एन्कोडिंगसाठी जबाबदार आहे. सहसा UTF8 एन्कोडिंग वापरले जाते.
  • आवृत्ती – XML भाषेची आवृत्ती ज्यामध्ये हा दस्तऐवज लिहिलेला आहे. सामान्यतः ही XML आवृत्ती 1.0 असते.

बरं, आता लेखाच्या शेवटच्या भागाकडे वळू आणि अशा XML रचनांना टिप्पण्या आणि CDATA विभाग म्हणून विचार करू.



आम्ही वाचण्याची शिफारस करतो

वर