[LUGOS-SLO] Re: wrote?
Ales Kosir
ales.kosir at zaslon.com
Thu Nov 7 14:29:57 CET 2002
> Seveda pa je veliko la¾je takole kot midva pametovati, kot spraviti
> skupaj kak¹en konkreten kos kode.
Nekoc sem to ze naredil. Ugotovitev je bila, da je najbolj zanesljiva metoda ta, da s spellcheckerjem nalagas slovarje za pricakovane jezike in meris, koliko neznanih besed imas v sporocilu. Ce je neznanih besed pod 25%, lahko pri raznolikih jezikih dobro uganes, za katerega gre. Med slovenscino in hrvascino (na primer) pa moras izbirati bolj natancno.
Ce noces nalagati velikih slovarjev ali ce jih nimas, ti pomaga kot osnovno zdravilo merjenje frekvence crk v besedilu. Ce naletis na a s pikicami (in ves, kateri kodni nabor je uporabljen), se lahko odlocas, da je jezik verjetno nemscina ali podobno. Metoda je zelo nezanesljiva, a boljsa kot nic. Dodatna tezava je, ce ne poznas kodnega nabora.
Boljsa metoda je merjenje pogostosti parov crk. Za to metodo sicer potrebujes matrike verjetnosti (frekvenc) crkovnih parov, a rezultat je bistveno boljsi od frekvenc samostojnih crk. Od te metode pa da spet bistveno boljse rezultate prvoomenjena metoda.
Lep pozdrav,
Ales
More information about the lugos-slo
mailing list