FW: [Solomonov Seminar] 67. Solomonov seminar
Ales Kosir
ales.kosir at zaslon.com
Mon Jan 21 16:37:55 CET 2002
FYI
-----Original Message-----
From: Marko Grobelnik [mailto:marko.grobelnik at ijs.si]
Sent: Monday, January 21, 2002 12:44 AM
To: Solomonov Seminar; e8 at ijs.si
Subject: [Solomonov Seminar] 67. Solomonov seminar
Vabim vas na 67. Solomonov seminar, ki bo
v torek, 22.1.2001 ob 13.uri v veliki predavalnici IJS.
O tematikah, ki se ukvarjajo z analizo besedil (text-mining) smo ze
nekajkrat govorili -
tokrat si bomo ogledali dve temi s katerimi se je ukvarjala Dunja Mladenic
med svojim postdoc obiskom na Carnegie Mellon University v Pittsburghu.
Prva tema govori o tem kako avtomatsko izdelati postopek za normalizacijo
besed (stemming) - torej, kako besedo iz sklona ali spregatve spravimo
v normlizirano obliko. V drugi temi pa bo predstavila sistem Corpus-Builder,
ki se sprehaja po webu in zbira dokumente na doloceno tematiko.
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Dunja Mladenic:
Avtomatska lematizacija in avtomatska gradnja korpusov
Pri obdelavi besedil sodi med osnovne prijeme tudi postopek, ki ga
imenujemo v anglescini "stemming" - po slovensko pa mu recemo krnjenje
ali pa v svoji bolj bogati obliki lematizacija. Vecji jeziki (pa so to ne
vsi)
tak postopek ze imajo. Problem seveda nastopi, ce obdelujemo neangleske
jezike, ki takih postopkov se nimajo izdelanih. Z nasim pristopom tak
postopek
zgradimo avtomatsko z metodami strojnega ucenja. Na predavanju bomo
prikazali uvodne eksperimente na primeru slovenskega jezika, ki so precej
obetavni.
V drugem delu seminarja si bomo ogledali postopek za avtomatsko
konstrukcijo korpusa za doloceno tematiko. Na kratko povedano,
gre za postopek, ki s pomocjo javnih iskalnikov zbere mnozico
dokumentov, ki imajo neko skupno lastnost - npr. tematsko,
ali jezikovno.
_______________________________________________
Solomonov-seminar mailing list
Solomonov-seminar at ijs.si
http://mailman.ijs.si/listinfo/solomonov-seminar
More information about the lugos-slo
mailing list