free webpage counters
ETUSIVU materiaalit

2. Historiaa ja taustaa


XML:n edeltäjiä olivat SGML ja HTML, jotka kumpikin ovat menestyneitä standardeja, kun kyseessä on dokumentin muotoilu. Sekä SGML:llä että HTML:llä on kuitenkin puutteita, sen vuoksi on kehitetty XML, joka siis yhdistää SGML:n ja HTML:n hyvät puolet. (Eriksson 1999.)

SGML

Standard Generalized Markup Language (SGML, ISO 8879) on kansainvälinen standardi sille kuinka dokumentteja merkataan. SGML on ollut olemassa jo vuodesta 1986, sekä HTML että XML ovat saanet vahvasti vaikutteita SGML:stä. SGML on suosittu mm. puolustusvoimissa ja muissa isoissa teollisuuden aloilla, joissa käsitellään suuria määriä tietoja. SGML:llä on kuitenkin kaksi heikkoutta, nimittäin monimutkaisuus ja hinta. (Eriksson 1999.)

HTML

Päästäkseen eroon SGML:n monimutkaisuudesta ja kalliista työkaluista kehitti Tim Berners-Lee vuonna 1990 HTML -kielen. HTML:stä (HyperText Markup Language) tuli heti hitti. Oikeastaan kaikki web-sivut on tehty käyttäen html-kieltä, siksi html:n hallitsemista pidetään yleisesti niin tärkeänä. Kyseessä ei kuitenkaan ole mikään varsinainen ohjelmointikieli vaan lähinnä HTML on sivunkuvauskieli. Kyse on siis järjestelmästä, jonka avulla kuvataan dokumenttien sisältöä ja ulkoasua. HTML on myös paljon helpompaa oppia kuin oikea ohjelmointikieli. Lisäksi web-sivuja voidaan myös tehdä editorin avulla, jolloin web-sivujen tekeminen on lähes yhtä helppoa kuin tekstinkäsittely. Editoreita on kahta eri tyyppiä, toiset perustuvat koodin kirjoittamisen helpottamiseen, kun taas toiset ovat wysiwyg tyyppisiä.

HTML:n heikkous on sen rajoittuminen tageihin kuten <BODY>, <P> ja <TITLE>. HTML-kielessä et siis voi luoda tagia <otsikko>, vaikka sattuisit sellaista tarvitsemaan. Sellaiset tagit kuten <I> ja <B> ovat yksi syy siihen, että html:stä on muotoutunut kuvaileva kieli. Se määrittelee siis ulkonäköä eikä rakennetta. Tagi <I> ei kerro mitään sisällöstä, sen sijaan se kertoo, että sisältö kursivoidaan (i=italicize). Tagien vähäisyys sekä rakenteen ja muotoilun sekoittuminen aiheuttavat ongelmia. Lisäksi HTML-kieli on täynnä lyhenteitä, jotka eivät kerro mitään (p, br, td, ol, li), siksi HTML-koodia on niin vaikea lukea ja tulkita. Netscape ja Microsoft, jotka valmistivat web-selaimia ovat yrittäneet poistaa HTML:n puutteita luomalla omia laajennuksiaan. Seurauksena on kuitenkin ollut yhteensopimattomuus eri selainten välillä. Websivulla oleva ilmoitus "Tämä sivu näkyy parhaiten Internet Explorerilla" on yhteensopimattomuudesta johtuva ikävä seuraus. (Eriksson1999.)

XML

HTML on kehitetty SGML:stä eli se on tehty noudattaen SGML:n sääntöjä. XML on sitä vastoin osa SGML:ää. Kyseessä on suuri ero sillä XML:n avulla voidaan määritellä uusia sovelluksia, sellaista ei voi tehdä HTML:n avulla. XML:llä tehtyjä sovelluksia ovat mm. Mathematical Markup Language (MathML) ja Channel Description Format (CDF). Tässä onkin XML:n suurin vahvuus eli se on laajennettavissa. Eri organisaatiot voivat kehitellä omia sovelluksiaan, omiin tarpeisiinsa. (Eriksson 1999.)

XML:n vahvuudet verrattuna HTML:ään


Laajennettavuus: Mahdollisuus luoda omia elementtejä ja attribuutteja.
Rakenne: XML mahdollistaa tiedon loogisen strukturoinnin.
Validointi: XML:n dokumentin oikeellisuus on helppo tarkistaa. (Eriksson 1999.)

Tehtävä 2

Suorita koneellasi haku *.xml
Tutki löydökset eli mitä xml-dokumentteja löytyi koneeltasi?