[LUGOS-SLO] koverzija iz win1250 v latin
Primoz Peterlin
primoz.peterlin at biofiz.mf.uni-lj.si
Wed Mar 27 17:18:55 CET 2002
-----BEGIN PGP SIGNED MESSAGE-----
On Wed, 27 Mar 2002, Ales Kosir wrote:
> V neki knjigi (recimo Linux z namizjem KDE) sem nasel tale zgled:
> tr "\250\212\232\216\236" "\350\251\271\256\276" < vhod > izhod
Eee... Pa si res moral na dan privleči to sramoto? :)
Zgled namreč, umm, ne da je povsem napačen, ampak ravno didaktičen pa tudi
ni. In to iz več razlogov:
1) Na prvi pogled - pretvarjamo namreč samo pet znakov - je očitno, da smo
avtorji na eno od črk pozabili. Na drugi pogled se izkaže, da je to veliki
Č. Ki - sreča! - nam na repu prinese izgovor: koda znaka (\310) je enaka v
obeh naborih (ISO 8859-2 in CP1250), zato nam ga ni treba pretvarjati.
Optimizacija, ne pa nemarnost!
2) Izkaže se, da je podobno optimiziran tudi mali Č (koda \350), ki ga v
vhodnem naboru ni. Do tod vse lepo in prav.
3) Pač pa iz neznanega razloga pretvarjamo dierezo (¨, koda \250) v mali
Č. Predvsem to slednje pušča nekako slab vtis, da smo bili avtorji
vendarle bolj nemarni kot pa prebrisani.
Skratka, en popravek več za drugo izdajo.
Sicer pa lahko kode znakov v različnih naborih izvemo tudi takole:
echo "ČŠŽčšž" | recode l2..Kamenicky | od -b
Lep pozdrav, Primož
- --
Primož Peterlin, Inštitut za biofiziko, Med. fakulteta, Univerza v Ljubljani
Lipičeva 2, SI-1000 Ljubljana, Slovenija. primoz.peterlin at biofiz.mf.uni-lj.si
Tel: +386-1-5437632, fax: +386-1-4315127, http://sizif.mf.uni-lj.si/~peterlin/
F8021D69 OpenPGP fingerprint: CB 6F F1 EE D9 67 E0 2F 0B 59 AF 0D 79 56 19 0F
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.0.6 (HP-UX)
Comment: For info see http://www.gnupg.org
iQB1AwUBPKHw9T3bcxr4Ah1pAQHvRgMAqSf1ekJfAX1U2A26vSlGMMIkVZ2Gy5KT
egivr0MnoOuSlwmyna23sGWThCqE53cvdwRP0P7FKkluo0zSAtBEzNC9Jmq96608
QWQv0/alfmGtqMFiS1vxF48vwDWm6rnk
=ii86
-----END PGP SIGNATURE-----
More information about the lugos-slo
mailing list