[ LUGOS-SLO ] DocBook

Tomaz Erjavec Tomaz.Erjavec at ijs.si
Wed Mar 28 18:27:48 CEST 2001


Primoz Peterlin writes:
 > On Sun, 25 Mar 2001, Andrej Vernekar wrote:
 > 
 > > Malo bom razlo¾il zadnjo toèko:
 > > -dokumentacija bo pre¹la iz formata SGML docbook v XML docbook
 > > -spremembe v zgradbi dokumentov niso zelo obse¾ne, formata sta
 > > si skoraj povsem enaka
 > 
 > Kaj ni to zato, ker Docbook DTD tako ali tako ostane, spremeni se samo
 > "podstat" (XML namesto SGML)? Ker je XML nekaj manj splo¹en od SGML, ne
 > delujejo veè oznake kot denimo <emphasis>poudarjeno</>, ampak je treba
 > pisati <emphasis>poudarjeno</emphasis>, pa vse oznake morajo biti pisane z
 > malimi èrkami, pa ¹e nekaj tega?

Mogoce ¹e jaz dodam:
XML je podmnozica SGML, kar deloma tudi zadeva tipe DTDjev, ki so
dovoljeni. Zato je SGML DTDje - vsaj bolj kompleksne - tipicno treba
popraviti, da bi bili XML. Tudi DocBook ima drug DTD za XML. 
Vendar so v njem spremenili samo, kar je bilo res nujno, zato je v
samih dokumentih potrebno popravljati zelo malo - oz. nic, ce
odmislimo stvari, ki so od DTDja (deloma) neodvisne, t.j. minimizacija
koncnih oznak in case-sensitivity imen oznak. Ti parametri so namrec
doloceni v deklaraciji SGML.

Precej na kratko pise o razlikah med SGML in XML v
http://nl.ijs.si/et/talks/esslli99/erjavec/node25.html
precej podrobno pa v 
http://www.w3.org/TR/NOTE-sgml-xml
Prav o vprasanju konverzije DTDjev med SGML in XML pa v 
http://www.xml.com/pub/a/98/07/dtd/

 > > -zato pa bo vsa dokumentacija pre¹la v UTF-8, tako kot pri sporoèilih
 > > (pogoj zaradi XML)
 > 
 > Verjetno morajo delovati tudi entitete &ccaron; ipd? Sam zaenkrat klepljem
 > ¹e naprej po starem v Latin-2, potem pa s skriptom v Sedu prekvaèkam nabor
 > Latin-2 v entitete SGML ali nazaj. Dokler mi Emacs ne bo lepo delal z
 > UTF-8, se la¾je znajdem z entitetami SGML kot s kodami UTF-8. 

To pa, moram priznati, muci tudi mene. Unicode je sicer uradni nabor
za XML, vendar ne vidim ovire, da se ne bi se naprej dalo uporabljati
entitet, ce so v dokumentu seveda definirane. Rahla razlika je v
definicijah samih; prej so bile entitete za znake tipa SDATA (system
dependent data), ki pa v XML ne obstaja vec. Zato so sedaj CDATA ali
pa kar brez kvalifikatorja; npr. <!ENTITY Ccaron "&#268;">, le-ta
pobrana iz http://czyborra.com/yudit/SGML.kmap

 > Sicer pa sem nekoliko nesreèen, ker ¹e vedno nisem na¹el nobenega paketa
 > RPM, ki bi podpiral sloven¹èino v SGML, kljub temu, da jo Norman Walsh
 > <http://nwalsh.com/docbook/dsssl/index.html> ¾e nekaj èasa ima med
 > podprtimi jeziki. Se je kdo kaj ukvarjal s tem?

No, ne vem, paket kar tako za podpiranje slovenscine v SGML po moje ne
more obstajati, oz. sploh ne vem kaj bi to lahko bilo. Kar ima Walsh
je izgleda poslovenjeni stil za DocBook, torej nekaj, kar je za vsak
DTD treba narediti posebej.

Pozdrav,
Tomaz




More information about the lugos-slo mailing list