From smolejv at gmx.net Mon Apr 6 07:12:05 2015
From: smolejv at gmx.net (Vito Smolej)
Date: Mon, 06 Apr 2015 07:12:05 +0200
Subject: [LUGOS-SLO] =?utf-8?q?regex_za_psovke_in_svinjarije_v_sloven?=
=?utf-8?b?xaHEjWluaQ==?=
Message-ID: <552215A5.4020900@gmx.net>
Halo kolegice in kolegi
Z naslednjim nizom sku?amo na slov. wikipediji pristri?i krila raznim
trolom:
\b(peder|pedr(a|e|i|u)|kurb(a|e|i|)|kur(ac|ca|cu|ci|?ev)|pi(zd|?k)(a|e|i|)|debil|fafan?j|jeb(i|a|em)|pras(ec|ica)|sex|seks|zarukan|jo?k(a|i|e)|faggot)\b
O?itna pomanjkljivost tega prvega poskusa je, da direktni prevod iz
nesklanjajo?e angle??ine (razen ?e se skloni ne vpletejo eksplicitno,
kot je prvih nekaj primerov zgoraj) ignorira na?o deklinacijo. Isto
velja za glagolske oblike. In tako dalje.
Zato najprej vpra?anje tu, ?e je ?e kdo pri slov four-letter filtru kaj
dlje. Ob za?etku dneva na roko iskati drek po trenutnem stanju prosto
dostopnem delu spleti??a (do?li po?ti ipd) je delo, ki se mu vsak
administrator rade volje odpove. Pri wikipediji pa je, kot veste, prosto
dostopno (skoraj) vse.
Hvala vnaprej!
LP
smo
---
This email has been checked for viruses by Avast antivirus software.
http://www.avast.com
-------------- naslednji del --------------
HTML priponka je pre?i??ena...
URL: http://liste2.lugos.si/pipermail/lugos-slo/attachments/20150406/bb55c39c/attachment.htm
From Tomaz.Erjavec at ijs.si Mon Apr 6 10:25:35 2015
From: Tomaz.Erjavec at ijs.si (=?UTF-8?B?VG9tYcW+IEVyamF2ZWM=?=)
Date: Mon, 06 Apr 2015 10:25:35 +0200
Subject: [LUGOS-SLO] =?utf-8?q?regex_za_psovke_in_svinjarije_v_sloven?=
=?utf-8?b?xaHEjWluaQ==?=
In-Reply-To: <552215A5.4020900@gmx.net>
References: <552215A5.4020900@gmx.net>
Message-ID: <552242FF.5050506@ijs.si>
Zdravo,
na roko pisat sklanjatve in spregatve je ?e kar sitno; kaj pa, ?e bi
raje kar na?tel vse oblike?
Po moje se jih velika ve?ina dobi iz sloleksa,
http://www.slovenscina.eu/sloleks ki se ga da sneti, nato pa iz njega
dobiti vse oblike z grepom na grde leme.
lp,
Toma?
Dne 06/04/2015 ob 07:12 je Vito Smolej zapisal(a):
> Halo kolegice in kolegi
>
> Z naslednjim nizom sku?amo na slov. wikipediji pristri?i krila raznim
> trolom:
>
> \b(peder|pedr(a|e|i|u)|kurb(a|e|i|)|kur(ac|ca|cu|ci|?ev)|pi(zd|?k)(a|e|i|)|debil|fafan?j|jeb(i|a|em)|pras(ec|ica)|sex|seks|zarukan|jo?k(a|i|e)|faggot)\b
>
>
> O?itna pomanjkljivost tega prvega poskusa je, da direktni prevod iz
> nesklanjajo?e angle??ine (razen ?e se skloni ne vpletejo eksplicitno,
> kot je prvih nekaj primerov zgoraj) ignorira na?o deklinacijo. Isto
> velja za glagolske oblike. In tako dalje.
>
> Zato najprej vpra?anje tu, ?e je ?e kdo pri slov four-letter filtru
> kaj dlje. Ob za?etku dneva na roko iskati drek po trenutnem stanju
> prosto dostopnem delu spleti??a (do?li po?ti ipd) je delo, ki se mu
> vsak administrator rade volje odpove. Pri wikipediji pa je, kot veste,
> prosto dostopno (skoraj) vse.
>
> Hvala vnaprej!
>
> LP
>
> smo
>
>
> ------------------------------------------------------------------------
>
>
> This email has been checked for viruses by Avast antivirus software.
> www.avast.com
>
>
>
>
> _______________________________________________
> lugos-slo mailing list
> lugos-slo at lugos.si
> http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-slo
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://liste2.lugos.si/pipermail/lugos-slo/attachments/20150406/6b8e6562/attachment.htm
From smgl at lynxlynx.info Mon Apr 6 17:51:11 2015
From: smgl at lynxlynx.info (Jaka Kranjc)
Date: Mon, 06 Apr 2015 17:51:11 +0200
Subject: [LUGOS-SLO] =?utf-8?q?regex_za_psovke_in_svinjarije_v_sloven?=
=?utf-8?b?xaHEjWluaQ==?=
In-Reply-To: <552242FF.5050506@ijs.si>
References: <552215A5.4020900@gmx.net> <552242FF.5050506@ijs.si>
Message-ID: <1992955.fV9VVxBESf@mobilis>
On Monday 06 of April 2015 10:25:35 Toma? Erjavec wrote:
> Zdravo,
> na roko pisat sklanjatve in spregatve je ?e kar sitno; kaj pa, ?e bi
> raje kar na?tel vse oblike?
> Po moje se jih velika ve?ina dobi iz sloleksa,
> http://www.slovenscina.eu/sloleks ki se ga da sneti, nato pa iz njega
> dobiti vse oblike z grepom na grde leme.
Zdravo,
se strinjam, bi pa bilo nato mogo?e smiselno pretvoriti oblike nazaj v bolj zgo??en
regex, ker bodo koreni pogosto enaki. Nima zaznavnega vpliva na hitrost ali
obremenitev, zna biti pa bolj berljivo in ima manj mo?nosti, da prese?e velikost polja
v bazi.
Pa seveda pazljivo:
http://thedailywtf.com/articles/The-Clbuttic-Mistake-[1]
LP
--
To err is humour
--------
[1] http://thedailywtf.com/articles/The-Clbuttic-Mistake-
-------------- naslednji del --------------
HTML priponka je pre?i??ena...
URL: http://liste2.lugos.si/pipermail/lugos-slo/attachments/20150406/8911fdd3/attachment.htm