[ LUGOS ] cp1250 > latin-2

Joze Fabcic joze.fabcic na guest.arnes.si
Pet Jan 9 16:47:31 CET 1998


Posiljam nekaj svojih pogledov na razpravo

1) Dovoljene kodne strani
> From:          Ales Casar <casar na uni-mb.si>
> Ne, ne, ne, to pa ne. Teoreticno gledano bi secer lahko naredil:
> 
> <META HTTP-EQUIV=3D"Content-Type" CONTENT=3D"text/html; charset=3Dneka-s=
olata">
> 
> potem pa svojemu browserju povedal, da je "neka-solata" pac to in to.
> Ampak to bi vodilo v anarhijo. Tako se tukaj lahko uporabljajo samo
> standardne oznake. "windows-1250" pa ni noben standard, razen mogoce
> kaksen interni microsoftov, kar pa seveda ne steje.

Se ne strinjam. Zdi se mi, da je tukaj linux se nekoliko v zaostanku.
http (rfc 2068, pogl. 3.4) pravi, naj se za charset uporablja 
vrednosti, ki jih doloca iana. 

Iana ima na naslovu 
<ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets>
mnoga kodiranja. Npr. 

> alias ISO646-YU, MIBenum=3D87                 (slo 7, ~{=B4^[@)
> name windows-1250, MIBenum=3D2250     (cp 1250, =E8=9A=9E=C8=8A=8E)

Jaz razumem te podatke, da lahko po celem svetu uporabljamo ime, ce 
ima svojo vrednost MIBenum. Ime windows-1250 ni sicer doloceno s kako 
svetovno organizacijo za standarde, ampak IANA v internetu nekaj 
velja.
Za stevilke MIBenum velja (navodilo iana)

>  The value space for MIBenum values has been divided into three
>  regions. The first region (3-999) consists of coded character sets
>  that have been standardized by some standard setting organization.
>  This region is intended for standards that do not have subset
>  implementations. The second region (1000-1999) is for the Unicode 
>  and ISO/IEC 10646 coded character sets together with a 
>  specification of a (set of) sub-repetoires that may occur.  The 
>  third region (>1999) is intended for vendor specific coded 
>  character sets.


2) Nacini urejanja csz na streznikih
> From:             Primoz Peterlin <peterlin na biofiz.mf.uni-lj.si>
> Cel kup nemarnih spletnih administratorjev ime svoje strani
> kodirane po CP1250, tega pa nikjer ne navedejo (kar implicira ISO
> Latin 1). Tu nima Navigator nobene mo nosti, da bi avtomati no
> ugotovil kodno stran.

Ne gre samo za nemarnost. Pri nas (<http://www-s.ssp.po.edus.si>)
je prva stran kodirana po cp1250, pa tega ne povemo v http glavi.
Pac krsimo standard, da omogocimo prikaz te strani tudi v starih 
programih /okoljih, ki ne znajo nic drugega kot us-ascii, iso-8859-1 
ali podobno. Lahko pa takoj na tej strani izberemo zeljeno kodno 
stran, ki je pravilno prikazana v http glavi in besedilu.
Tam sta seveda vkljucena iso-8859-1 in iso-8859-2.


3) Katera kodna stran naj bo v datotekah?

Na <http://www.feri.uni-mb.si/si/index.html-l2>, 5. poglavje 'Kako 
pisemo HTML dokumente v ISO Latin 2 naboru?' pise
> 1.Napisemo HTML dokumente, kot nam je naljubse. 
> 2.Shranimo dokumente pod ISO Latin 2, ce nam programska oprema to 
> omogoca. V nasprotnem primeru uporabimo filtre in dokumente 
> pretvorimo v ISO Latin 2 nabor znakov. 

To je res, je pa neprakticno izvajati zadnji stavek. Jaz ne poznam 
nobenega programa za vnos besedil za win95, ki shranjuje in 
odpira datoteke v iso-8859-2. Tudi ce bi ga nasel, bi stevilni 
standardni programi tega se vedno ne znali. V datotekah imamo zato 
cp1250.


Malo bolj na dolgo nameravam svoje stalisce opisati na 
  <http://www.s-ssp.po.edus.si/inf/csz/>
Ta stran je ze dosegljiva, ni pa se koncana. 
Morda bi moje resitve tudi druge zanimale, pa me zanimajo stalisca 
ostalih.

BP Joze




Dodatne informacije o seznamu Starilist