[LUGOS] ugotavljanje kodnega zapisa
Stojan Rancic
stojan at aufbix.org
Wed Apr 9 12:20:19 CEST 2003
Hojla Janko,
Wednesday, April 9, 2003, 12:14:55 PM, si napisal(a):
> Sam to delam tako:
> - preštejem pojave vsakega znaka nad 128 posebej
> - seštejem pojave ščžČŠŽ posebej po iso-8859-2 in win-1250
> - kodiranje v katerem je znakov več, razglasim za kodiranje besedila.
Ja, jaz sem se odlocil nekaj v tem stilu (perl):
open (IN,$fname);
@fo=<IN>;
close(IN);
foreach $line(@fo) {
if ($line =~ m/\xa9|\xae|\xbe|\xb9/) {$code=1;last;} #iso-8859-2
if ($line =~ m/\x8a|\x8e|\x9a|\x9e/) {$code=2;last;} #win-1250
}
if ($code==1) {system("recode -f iso-8859-2..us $fname");}
elsif ($code==2) {system("recode -f windows-1250..us $fname");}
.. ce je pac ravno samo "c ali "C v tekstu, pa naj bo ;)
GreetZ, Stojan
---------------
Alone: In bad company.
More information about the lugos-list
mailing list