[LUGOS-SLO] odstotek flektivnih oblik

Miha Rus - NTP MihaR at iolar.com
Wed Sep 13 15:42:13 CEST 2006


Tomaž, najlepša hvala za te napotke.

Lp, Miha 

-----Izvirno sporočilo-----
Od: Tomaz Erjavec [mailto:tomaz.erjavec at ijs.si] 
Poslano: 13. september 2006 15:41
Za: Linux in slovenjenje
Zadeva: Re: [LUGOS-SLO] odstotek flektivnih oblik

Zdravo,
ne vem zakaj bi bila reka napacna, je pa res zelo globoka. Da bi kdo tole
takole mimogrede sprogramiral zelo dvomim; za natancen odgovor bi rabil
velik korpus slovenskega jezika, kjer je nekdo vsako besedo na roke oznacil
s pravilno osnovno obliko; potem enostavno primerjas vsako besedno obliko z
osnovno, in voila, imas odgovor. Seveda pa ostane vprasanje, kje dobiti tak
korpus. 
Edini v sloveniji (cca 1M besed na roko oznacenih besed) je na ZRC SAZU,
vendar se do njega ne da.

Ce si srecen z manj natancno resitvijo, si lahko preneses slovenski del
IJS-ELAN and kar SVEZ-IJS, ki je bil oznacen avtomatsko, vec informacij na
nl.ijs.si Samo pozor, besedne oblike najprel lc-jaj, ker so leme vse z malo.

V bistvu mi je nerodno, da nisem ze sam to kdaj izracunal; mogoce bom, ko bo
vec casa..
lp,
Tomaz


Joze Klepec wrote:
> Napačna in pregloboka reka, človek.
> 
> Natančen odgovor ti bo dal kak veščak z Lugos-prog z ustrezno 
> napisanim programom. Seveda potrebuješ zadosten vzorec, cca. nekaj sto 
> tisoč besed. Računalnik ti bo zadevico opravil v pol ure - poprej pa 
> boš moral zagotoviti ustrezno besedilo in program, ki največkrat ni 
> mačji kašelj, vendar ga je možno napisati s srednješolskim znanjem v 
> srednje zahtevnem programskem jeziku.
> 
> LP, Jože
> 
> Miha Rus - NTP pravi:
>> Živeli, veščaki.
>>
>> Ali mi kdo pomore: kakšen odstotek bi bil število flektivnih oblik v 
>> kratkih, večinoma besednih nizih? Gre za uporabniški vmesnik telefona.
>> Primer za ruščino:
>>
>>  
>> English        Russian       Selected    masculine    Выбран       
>>     feminine    Выбрана           neuter    Выбрано       
>>     plural    Выбраны
>>
>> Gre res za približek. Je takšnih oblik več kot 50 %, se pravi vseh 
>> neimenovalniških oblik oz. takih, ki se pregibajo po spolu, sklonu in 
>> številu. Hic Rhodus, hic salta: potrebujem zelo hiter odgovor. Ne 
>> linčajte me, če nisem bil povsem ekzakten.
>>
>>
>> Večno vam bom hvalo pel,
>>
>> Miha Rus
>> _______________________________________________
>> lugos-slo mailing list
>> lugos-slo at lugos.si
>> http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-slo
>>
>>   
> 
> 
> _______________________________________________
> lugos-slo mailing list
> lugos-slo at lugos.si
> http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-slo


-- 
Tomaz Erjavec                | Dept. of Knowledge Technologies
email: tomaz.erjavec at ijs.si  | Jozef Stefan Institute
www:   http://nl.ijs.si/et/  | Jamova 39
fax:   (+386 1) 477-3131     | SI-1000 Ljubljana, Slovenia
_______________________________________________
lugos-slo mailing list
lugos-slo at lugos.si
http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-slo


More information about the lugos-slo mailing list