[LUGOS-SLO] Statistika pogostosti posameznih znakov v besedilnem korpusu
Robert Ludvik
r at aufbix.org
Mon Oct 15 12:20:20 CEST 2007
Posredujem zanimivo sporočilo g. Jakopina.
-------- Izvirno sporočilo --------
Datum: Mon, 15 Oct 2007 09:00:52 +0000
Od: primoz.jakopin
Spostovani kolegi,
na spletni strani:
http://bos.zrc-sazu.si/Nova_beseda/Character_frequencies_U_abc_en.html
je obljubljena statistika pogostosti posameznih znakov v besedilnem
korpusu, ki obsega pribl. 1.323.000.000 znakov, stevilo v tabeli
zajetih znakov pa je 1.290.127.912 - navedeno je tudi na dnu strani.
Vec o sestavi korpusa dobite s klikom na ime Nova beseda v naslovu
strani.
Z lepimi pozdravi
Primoz Jakopin
More information about the lugos-slo
mailing list