[ LUGOS ] cp1250 > latin-2

Primoz Peterlin peterlin na biofiz.mf.uni-lj.si
Pet Jan 9 23:16:31 CET 1998


Lep pozdrav,

On Fri, 9 Jan 1998, Joze Fabcic wrote:

> Posiljam nekaj svojih pogledov na razpravo
> > Ampak to bi vodilo v anarhijo. Tako se tukaj lahko uporabljajo samo
> > standardne oznake. "windows-1250" pa ni noben standard, razen mogoce
> > kaksen interni microsoftov, kar pa seveda ne steje.
> Se ne strinjam. Zdi se mi, da je tukaj linux se nekoliko v zaostanku.
> http (rfc 2068, pogl. 3.4) pravi, naj se za charset uporablja
> vrednosti, ki jih doloca iana.

Drži. Za razliko od prejšnje izdaje (HTTP/1.0 a.k.a. RFC 1945) HTTP/1.1
dovoljuje vse kodirane nabore znakov, ki so registrirani pri IANA.
Odločitev je po svoje logična, ker pravzaprav W3C res nima nobene pravice
prepovedati ljudem v Vietnamu ali Nigeriji, da pišejo v kodnem naboru, ki
vsebuje njihove znake (noben od osembitnih naborov iz HTTP/1.0 ni vseboval
znakov za vietnamščino ali jorubo), po drugi strani pa legalizira kaos na
WWW. V IANA je ta hip registriranih 212 kodnih naborov, kar je preveč, da
bi pretvorne tabele vgradili v pregledovalnik, in seveda preveč, da bi
vsakdo imel pisave v vseh teh kodnih naborih pri sebi.

Formulacija, da ,,je Linux tukaj še nekoliko v zaostanku`` je netočna, ker
pravzaprav Linux s HTTP nima nobene neposredne zveze. Priznam pa, da je
recimo <URL:http://sizif.mf.uni-lj.si/linux/cee/app/httpd.html> v
zaostanku...

> > From:             Primoz Peterlin <peterlin na biofiz.mf.uni-lj.si>
> > Cel kup nemarnih spletnih administratorjev ime svoje strani
> > kodirane po CP1250, tega pa nikjer ne navedejo (kar implicira ISO
> > Latin 1). Tu nima Navigator nobene mo nosti, da bi avtomati no
> > ugotovil kodno stran.
> Ne gre samo za nemarnost. Pri nas (<http://www-s.ssp.po.edus.si>)
> je prva stran kodirana po cp1250, pa tega ne povemo v http glavi.
> Pac krsimo standard, da omogocimo prikaz te strani tudi v starih
> programih /okoljih, ki ne znajo nic drugega kot us-ascii, iso-8859-1
> ali podobno. 

Če primerjava z alternativno rešitvijo: naslovna stran je kodirana po
ISO-8859-2 in opremljena s pravilno glavo, kar je v skladu z zapisanim na
http://www.s-ssp.po.edus.si/iso2/inf/csz/:

	,, ... Ne strinjam se, da mora biti začetni dokument kodiran po
	iso latin 1.  Večina američanov ne razume slovenščine in jim nekaj
	čudnih znakov ne pomeni nič posebnega, saj tudi ostalega ne
	razumejo. ...``

Kateri programi oz. okolja tega ne znajo prikazati? Kot možen kandidat mi
pride na misel Windows 3.1* EE in Netscape Navigator 2.* -- je kdo
poskusil s to kombinacijo? In seveda zanesljivo ISO 8859-2 ne deluje z
Navigatorjem 1.* in Internet Explorerjem 2.*. Koliko je takšnih? Koliko je
obiskov z Unixov, Macintoshev, OS/2, Amig in kaj jaz vem česa še, ki ne
znajo prikazati CP 1250? Če je drugih več (jih je res?), ali jih je toliko
več, da odtehtajo bodisi vzdrževanje spisov na strežniku v ISO 8859-2 ali
pa sprotno konverzijo (CGI) iz CP1250 v ISO 8859-2?

> ... Lahko pa takoj na tej strani izberemo zeljeno kodno
> stran, ki je pravilno prikazana v http glavi in besedilu.
> Tam sta seveda vkljucena iso-8859-1 in iso-8859-2.

Ogledal sem si strani SŠP in moram reči, da se mi zdijo tehnično zelo
spodoben izdelek.

> Na <http://www.feri.uni-mb.si/si/index.html-l2>, 5. poglavje 'Kako
> pisemo HTML dokumente v ISO Latin 2 naboru?' pise
> > 1.Napisemo HTML dokumente, kot nam je naljubse.
> > 2.Shranimo dokumente pod ISO Latin 2, ce nam programska oprema to
> > omogoca. V nasprotnem primeru uporabimo filtre in dokumente
> > pretvorimo v ISO Latin 2 nabor znakov.
> To je res, je pa neprakticno izvajati zadnji stavek. Jaz ne poznam
> nobenega programa za vnos besedil za win95, ki shranjuje in
> odpira datoteke v iso-8859-2. Tudi ce bi ga nasel, bi stevilni
> standardni programi tega se vedno ne znali. V datotekah imamo zato
> cp1250.

Premalo poznam takó Microsoftovo okolje, kot tudi navade piscev spletnih
spisov pri vas. Uporabljate kakšna Microsoftova orodja za izdelavo strani
(FrontPage?) ali kvačkate HTML na roko (glede na omembo programa Beležnica
na spodaj omenjeni strani na SŠP bi rekel, da tudi drugo). Iz pošte, ki jo
dobivam, vidim edino, da zna Microsoft Mail pretvarjati pošto iz lokalnega
nabora v ISO-8859-2. 

> Malo bolj na dolgo nameravam svoje stalisce opisati na
>   <http://www.s-ssp.po.edus.si/inf/csz/>
> Ta stran je ze dosegljiva, ni pa se koncana.
> Morda bi moje resitve tudi druge zanimale, pa me zanimajo stalisca
> ostalih.

Želeli ste, poslušajte... ;-)

Da še sam vržem kakšno kost za glodanje: se je kdo že kaj ukvarjal z XML? 
Bo kaj poenostavil naše pošumevanje? Ali omogoča recimo to, da na začetku
vsakega spisa na nek enoličen način definiramo znakovne entitete, ki jih
uporabljamo v spisu (&ccaron; itd.) in prepustimo odjemniku, da jih
pravilno interpretira? 

Lep pozdrav, Primož

--
Primož Peterlin         email: primoz.peterlin na biofiz.mf.uni-lj.si
Inštitut za biofiziko MF, Lipičeva 2, SI-1000 Ljubljana, Slovenija
Fax: +386-61-1315127     WWW: http://sizif.mf.uni-lj.si/~peterlin/




Dodatne informacije o seznamu Starilist