[ LUGOS ] KDE in knjiznice + SGML

Primoz Peterlin peterlin na biofiz.mf.uni-lj.si
Sre Jan 7 14:44:22 CET 1998


On Wed, 7 Jan 1998, Marko Samastur wrote:

>      A je mogoce ze kdo ugotovil, kako se zapisuje sumnike v SGML?

Odvisno od tega, kako so definirani v DTD. ;-)

Linuxdoc DTD (mislim, da se nanj nanaša vprašanje) *ne* definira entitet
(prevod?) za naše znake.

Flikarija, ki jo uporabljam, je približno takšna:

1) sgml2txt s stikalom -l izpljune natančno tisto, kar želim -- v redu.

2) sgml2html s stikalom -l predela č v è š in ž pa pusti pri miru
(torej osembitna znaka). Pridelano solato spustim skozi naslednji filter:

------------------------------------8<-------------------------------------
#!/bin/sh
#
#  Transform the output from sgml2html into valid Latin-2 HTML.
#
#  $Header: /home/lugrep/www/arhiv/mailinglist/011998/37.html,v 1.1 2001/05/29 09:03:15 roman Exp $

#  Insert the MIME meta-header
awkscript='/<\/HEAD>/ { printf("%s\n%s\n",
  "<META HTTP-EQUIV=\"Content-Type\" CONTENT=\"text/html; charset=ISO-8859-2\">",
  "<META HTTP-EQUIV=\"Content-Language\" CONTENT=\"sl\">") }
{ print $0 }'

#  For some strange reason, sgml2html only (mis)interprets &ccaron; while
#  leaving &scaron; and &zcaron; intact (i.e. 8-bit).
sedpattern='s/&egrave;/č/
s/&Egrave;/Č/'

sed "$sedpattern" $1 | awk "$awkscript"
------------------------------------8<-------------------------------------

Podoben filter, ki bi \`e zamenjal z \v{c} itn., bi se dalo napisati tudi
za TeX. Prava rešitev pa bi seveda bila podpora za Latin-2 (morda stikalo
-l2?), ki bi bila del paketa.

Lep pozdrav, Primož

--
Primož Peterlin         email: primoz.peterlin na biofiz.mf.uni-lj.si
Inštitut za biofiziko MF, Lipičeva 2, SI-1000 Ljubljana, Slovenija
Fax: +386-61-1315127     WWW: http://sizif.mf.uni-lj.si/~peterlin/




Dodatne informacije o seznamu Starilist