[LUGOS-SLO] Re: wrote?
Andraz Tori
Andraz.tori1 at guest.arnes.si
Thu Nov 7 08:17:12 CET 2002
On čet, 2002-11-07 at 07:05, Bostjan Jerko wrote:
> Ideja mi je zelo vsec, problem je sicer pri raznih "genericnih" naslovih ala yahoo.com ... Ampak 80% naslovnikov bi pa najbrz vseeno pokrilo.
glede na to, da imaš pri "wrote to" na voljo besedilo originala je stvar
verjetno možno za jezike, ki se jih zavestno podpre spraviti krepko čez
80% ... tudi za razne yahoomaile, hotmaile itd...
V bistvu je zadeva dost enostavna: po nekem pametnem zaporedju (recimo
iz naslovnika, ter naslova pošiljatelja in trenutnega localea etc.) greš
z vsemi dictionaryiji, ki jih imaš na sistemu delat spellcheck nad
orginalnim textom, dokler ne zadovoljiš nekega pogoja koliko procentov
mora biti besed pravilno napisanih oziroma v kolikor ga ne, izbereš
tisti jezik ki bi imel najmanj napak.
Gre za to, da poskušaš zadevo čimprej ugotoviti in odnehati, ker tudi
spell checkerji niso ravno rekorderji v hitrosti... morajo naložiti bazo
z diska, precej lahko zasedejo etc...
Verjetno pa so v kakšnih raziskovalnih ustanovah razvil tudi dovolj
točne napovedi s precej manjšo količino besed, ampak za to bi moral že
malo prebrskati po raznih dokumentih in še bolje koga ki se s tem
ukvarja vprašat kaj...
No ja, seveda je možno potem skrčiti izbor, če se dolgoročno opazuje
koliko različnih jezikov nek uporabnik sploh 'govori'...
Seveda pa je veliko lažje takole kot midva pametovati, kot spraviti
skupaj kakšen konkreten kos kode.
Lep pozdrav
Andraž Tori
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: application/pgp-signature
Size: 189 bytes
Desc: This is a digitally signed message part
Url : http://liste2.lugos.si/pipermail/lugos-slo/attachments/20021107/8f4f3af9/attachment-0001.pgp
More information about the lugos-slo
mailing list