[LUGOS-SLO] Statistika pogostosti posameznih znakov v besedilnem korpusu

Robert Ludvik r at aufbix.org
Mon Oct 15 12:20:20 CEST 2007


Posredujem zanimivo sporočilo g. Jakopina.

-------- Izvirno sporočilo --------
Datum: Mon, 15 Oct 2007 09:00:52 +0000
Od: primoz.jakopin

Spostovani kolegi,

na spletni strani:

http://bos.zrc-sazu.si/Nova_beseda/Character_frequencies_U_abc_en.html

je obljubljena statistika pogostosti posameznih znakov v besedilnem
korpusu, ki obsega pribl. 1.323.000.000 znakov, stevilo v tabeli
zajetih znakov pa je 1.290.127.912 - navedeno je tudi na dnu strani.
Vec o sestavi korpusa dobite s klikom na ime Nova beseda v naslovu
strani.

Z lepimi pozdravi
Primoz Jakopin


More information about the lugos-slo mailing list