[LUGOS] samba in charseti

Rok Potocnik r at rula.net
Sat Jan 10 23:33:05 CET 2004


On 10.01.04 at 02:18:24 +0100, Rok Potocnik wrote:
  Na enem prastarem redhatu sm se odlocu da bom nadgradil sambo 2.2 v 3.0, a
  glej ga zlomka, na masini je prek sambe sharanih ene 10 giga podatkov, ki
  uporabljajo sumnike... sumniki čšćđžČŠĆĐŽ na klientih zgledajo v konzoli kot
  \237ç\206ЧŹć\217ŃŚ, kar je zelo motece, vsaj zame... zato me pa zanima, kako
  bi z najmanj napora recodal imena datotek in direktorijev iz CP852 v
  ISO-8859-2, saj bi v smb.conf potem nastavil unix charset=ISO-8859-2; dos
  charset=CP852; da bi me glava malo manj bolela.

ok sm neki potencialnega naumio...
sam ne vem kak naj se lotim za naprej... verjetno z eno for zanko, ampak raj
uprasam, kot pa da bi nekaj poskusal na 10gb pomembnih podatkov...

cd /share
find . > files-old
todos < files-old > files-new
recode cp852..latin2 files-new
pol bi z nekim programom tipa diff lahk ugotovil katere vrstice se ujemajo
in jih zbrisal iz obeh filetkov, tak da bi ostale samo vrstice
filetkov/direktorijev, katerih vrstice se ne ujemajo (potem bi blo verjetn
se dobro locit filetke in jih prvo preimenovat, da se izognem temu, da bi
spremenil ime direktorija v latin2, pol pa sele hotu spremenit imena
datotek). ampak to je malenkostno... no zdje pa for zanka...
kak bi prebral iz vsakega fajla vrstico po vrstico... pomislu sm na kaj
takega...
wc -l files-old
for i in `seq 1 $ST_VRSTIC`
do
 mv `vrnivrstico $i files-old` `vrnivrstico $i files-new`
done

vrnivrstico bi pa mogoc lahk bla kaka regexp zadevsna.. ampak sm bolj ko ne
zgubljen v regexpu, pa kot sem rekel... mam samo eno moznost pri tem..
ponavljanj ne sme bit... vsaj pri 10gb podatkov ne.



More information about the lugos-list mailing list