free webpage counters
ETUSIVU materiaalit

1. Mikä ihmeen XML?


XML on lyhenne nimestä eXtensible Markup Language eli se on laajennettava merkintäkieli. Se on W3C:n (World Wide Web Consortium) suositus rakenteisten dokumenttien merkkaamiselle. Siitä odotetaan ratkaisua ongelmiin, jotka liittyvät elektroniseen julkaisemiseen ja tiedonsiirtoon. Innokkaimpien mielestä tulevaisuudessa on yhtä vaikea muistaa miten asiat tehtiin ennen XML:ää, kuten tällä hetkellä on muistaa miten asiat tehtiin ennen www:tä. (Nykänen 2001, 1; Tuikka & Kanala 2001, 1.) Itse asiassa XML on kieli, jolla voidaan määritellä uusia kieliä. Sen avulla on tehty kieliä mm. molekyylien ja matemaattisten yhtälöiden määrittelyyn. (Keränen 2002, 68.)

XML on webin tulevaisuuden kieli

XML eli eXtensible Markup Language ratkaisee webissä tiedostoyhteensopivuusongelmat. XML on vähän kuten HTML, mutta ei sinne päinkään. HTML sisältää sekä datan että muotoilutiedot, mutta XML sisältää ainoastaan datan. XML:ssä visuaalinen taitto tallennetaan toiseen paikkaan. (IT Plus 2001, 90.) HTML siis ainoastaan esittää informaatiota eli se on tapa muokata informaation ulkoasua. Käyttämällä XML:ää voidaan informaatiolle luoda rakenne ja lisäksi voidaan päättää kuinka informaatio esitetään.



HTML-tagit on määritelty standardissa esim. <B> tarkoittaa aina lihavoitua tekstiä. Kyseinen tägi ei tee muuta vaikka kuinka haluaisit sen tekevän. Et voi myöskään määritellä omia tägejä tai määritellä uudelleen vanhoja tägejä. XML puolestaan sallii sinun määritellä omia tägejä tai tarkemmin sanottuna elementtejä. (IT Plus 2001, 90.)

Jos haluat XML:n sisältämän datan muotoiltuun muotoon on sinun otettava avuksi XSL-dokumentit (Extensible Stylesheet Language). XSL on enemmän kuin pelkkä tapa määritellä tyylisivuja XML:lle. XSL osaa käsitellä dataa muutenkin kuin pelkän ulkoasun suhteen. Se osaa mm. aakkostaa, valikoida tietyt tiedot jne. Se on siksi paljon enemmän kuin pelkkä html tai css. (IT Plus 2001, 90.)

Miksi XML pystyy siihen mihin html ei pysty?

Ensinnäkin HTML:ssä ei ole syntaksin tarkistusta tai ainakaan sitä ei käytetä. Lisäksi selaimet hyväksyvät mitä tahansa html-koodia. Toiseksi HTML:stä puuttuu rakenteisuus. Kolmas html:n heikkous on, ettei siitä voi tunnistaa sisältöjä. Neljäs html:n heikkous on, ettei se sovellu datan vaihtoon. Viidenneksi on todettava, ettei html ole kansainvälistä. XML perustuu Unicodeen ja sen ansiosta XML selviytyy länsimaisten merkistöjen lisäksi myös aasialaisista kielistä. Kuudes huono puoli html:ssä on, ettei se ole oliopohjainen kuten monet nykyaikaiset ohjelmointikielet. Seitsemänneksi on huomattava, että html:stä puuttuu vankka linkitysmekanismi. Tämä ilmenee mm. siten, että kun yhden html:n tiedoston paikkaa vaihdetaan, joudutaan korjaamaan linkkejä moneen dokumenttiin. Kahdeksanneksi on todettava, ettei html:ää voi uusiokäyttää eli siis kierrättää. Yhdeksäs html:n heikkous suhteessa xml:ään on, ettei html ole laajennettavissa, sillä sitä ei koskaan edes suunniteltu sellaiseksi. (North & Hermans 2000, 9-11.)

Miten XML eroaa HTML:stä?

Suurin ero XML:n ja HTML:n välillä on siinä, että XML keskittyy sisältöön ja HTML keskittyy siihen miltä sisältö näyttää. XML ei tee muuta kuin strukturoi, säilyttää, kuvailee ja lähettää tietoa. XML:n erityispiirre on, että sinun pitää keksiä tagit itse. XML:ssä ei siis ole valmiita koodeja kuten HTML:ssä, mainittakoon esimerkkeinä tagit <b> ja <p>. XML ei korvaa html:ää vaan tulevaisuudessakin niitä käytetään rinnakkain. XML kuvailee sisältöä, HTML puolestaan muotoilee ja näyttää sisältöjä. (XML Introduction - What is XML 2004.)

Tehtävä 1:
Tutustu XML:ään lukemalla dokumentti
"XML 10 kohdan tiivistelmänä"