From smolejv at gmx.net Mon Apr 6 07:12:05 2015 From: smolejv at gmx.net (Vito Smolej) Date: Mon, 06 Apr 2015 07:12:05 +0200 Subject: [LUGOS-SLO] =?utf-8?q?regex_za_psovke_in_svinjarije_v_sloven?= =?utf-8?b?xaHEjWluaQ==?= Message-ID: <552215A5.4020900@gmx.net> Halo kolegice in kolegi Z naslednjim nizom sku?amo na slov. wikipediji pristri?i krila raznim trolom: \b(peder|pedr(a|e|i|u)|kurb(a|e|i|)|kur(ac|ca|cu|ci|?ev)|pi(zd|?k)(a|e|i|)|debil|fafan?j|jeb(i|a|em)|pras(ec|ica)|sex|seks|zarukan|jo?k(a|i|e)|faggot)\b O?itna pomanjkljivost tega prvega poskusa je, da direktni prevod iz nesklanjajo?e angle??ine (razen ?e se skloni ne vpletejo eksplicitno, kot je prvih nekaj primerov zgoraj) ignorira na?o deklinacijo. Isto velja za glagolske oblike. In tako dalje. Zato najprej vpra?anje tu, ?e je ?e kdo pri slov four-letter filtru kaj dlje. Ob za?etku dneva na roko iskati drek po trenutnem stanju prosto dostopnem delu spleti??a (do?li po?ti ipd) je delo, ki se mu vsak administrator rade volje odpove. Pri wikipediji pa je, kot veste, prosto dostopno (skoraj) vse. Hvala vnaprej! LP smo --- This email has been checked for viruses by Avast antivirus software. http://www.avast.com -------------- naslednji del -------------- HTML priponka je pre?i??ena... URL: http://liste2.lugos.si/pipermail/lugos-slo/attachments/20150406/bb55c39c/attachment.htm From Tomaz.Erjavec at ijs.si Mon Apr 6 10:25:35 2015 From: Tomaz.Erjavec at ijs.si (=?UTF-8?B?VG9tYcW+IEVyamF2ZWM=?=) Date: Mon, 06 Apr 2015 10:25:35 +0200 Subject: [LUGOS-SLO] =?utf-8?q?regex_za_psovke_in_svinjarije_v_sloven?= =?utf-8?b?xaHEjWluaQ==?= In-Reply-To: <552215A5.4020900@gmx.net> References: <552215A5.4020900@gmx.net> Message-ID: <552242FF.5050506@ijs.si> Zdravo, na roko pisat sklanjatve in spregatve je ?e kar sitno; kaj pa, ?e bi raje kar na?tel vse oblike? Po moje se jih velika ve?ina dobi iz sloleksa, http://www.slovenscina.eu/sloleks ki se ga da sneti, nato pa iz njega dobiti vse oblike z grepom na grde leme. lp, Toma? Dne 06/04/2015 ob 07:12 je Vito Smolej zapisal(a): > Halo kolegice in kolegi > > Z naslednjim nizom sku?amo na slov. wikipediji pristri?i krila raznim > trolom: > > \b(peder|pedr(a|e|i|u)|kurb(a|e|i|)|kur(ac|ca|cu|ci|?ev)|pi(zd|?k)(a|e|i|)|debil|fafan?j|jeb(i|a|em)|pras(ec|ica)|sex|seks|zarukan|jo?k(a|i|e)|faggot)\b > > > O?itna pomanjkljivost tega prvega poskusa je, da direktni prevod iz > nesklanjajo?e angle??ine (razen ?e se skloni ne vpletejo eksplicitno, > kot je prvih nekaj primerov zgoraj) ignorira na?o deklinacijo. Isto > velja za glagolske oblike. In tako dalje. > > Zato najprej vpra?anje tu, ?e je ?e kdo pri slov four-letter filtru > kaj dlje. Ob za?etku dneva na roko iskati drek po trenutnem stanju > prosto dostopnem delu spleti??a (do?li po?ti ipd) je delo, ki se mu > vsak administrator rade volje odpove. Pri wikipediji pa je, kot veste, > prosto dostopno (skoraj) vse. > > Hvala vnaprej! > > LP > > smo > > > ------------------------------------------------------------------------ > > > This email has been checked for viruses by Avast antivirus software. > www.avast.com > > > > > _______________________________________________ > lugos-slo mailing list > lugos-slo at lugos.si > http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-slo -------------- next part -------------- An HTML attachment was scrubbed... URL: http://liste2.lugos.si/pipermail/lugos-slo/attachments/20150406/6b8e6562/attachment.htm From smgl at lynxlynx.info Mon Apr 6 17:51:11 2015 From: smgl at lynxlynx.info (Jaka Kranjc) Date: Mon, 06 Apr 2015 17:51:11 +0200 Subject: [LUGOS-SLO] =?utf-8?q?regex_za_psovke_in_svinjarije_v_sloven?= =?utf-8?b?xaHEjWluaQ==?= In-Reply-To: <552242FF.5050506@ijs.si> References: <552215A5.4020900@gmx.net> <552242FF.5050506@ijs.si> Message-ID: <1992955.fV9VVxBESf@mobilis> On Monday 06 of April 2015 10:25:35 Toma? Erjavec wrote: > Zdravo, > na roko pisat sklanjatve in spregatve je ?e kar sitno; kaj pa, ?e bi > raje kar na?tel vse oblike? > Po moje se jih velika ve?ina dobi iz sloleksa, > http://www.slovenscina.eu/sloleks ki se ga da sneti, nato pa iz njega > dobiti vse oblike z grepom na grde leme. Zdravo, se strinjam, bi pa bilo nato mogo?e smiselno pretvoriti oblike nazaj v bolj zgo??en regex, ker bodo koreni pogosto enaki. Nima zaznavnega vpliva na hitrost ali obremenitev, zna biti pa bolj berljivo in ima manj mo?nosti, da prese?e velikost polja v bazi. Pa seveda pazljivo: http://thedailywtf.com/articles/The-Clbuttic-Mistake-[1] LP -- To err is humour -------- [1] http://thedailywtf.com/articles/The-Clbuttic-Mistake- -------------- naslednji del -------------- HTML priponka je pre?i??ena... URL: http://liste2.lugos.si/pipermail/lugos-slo/attachments/20150406/8911fdd3/attachment.htm