[ LUGOS ] Search engine for mailing lists

Darko Koruga darko.koruga na hermes.si
Čet Mar 1 09:21:37 CET 2001


> > Jaz raje priporocam mnoGoSearch, zadeva je precej bolj fleksibilna.
> > Najdes ga na http://search.mnogo.ru/
> 
> Kaj pomeni to, da je bolj fleksibilen?  Lahko, prosim, našteješ nekaj
> prednosti pred htDig?
>
Najprej to da podpira tako vgrajeno bazo ki je v resnici flat file in je
cisto OK za majhne zadeve. Potem podpira celo vrsto SQL baz (MySQL, Oracle,
Postgress, ...), zunanje parserje, MP3, limitiranje iskanja po dolocenih
URLjih. Podpira HTTP, FTP, NNTP, proxy. Podpira razlicne jezike in zna
uporabiti ispell. Ima zadeve kot so stopwords (da recimo ne dodja besed
kot so in, the, or v bazo). Je re-entrant tako da lahko vec procesov
naenkrat dostopa do baze. Upam da je to dovolj. Za konkreten primer:
poindeksiral sem svojih 540MB HTML dokumentov (kaksnih 28000 dokumentov)
in z vgrajeno bazo mi vrne rezultate iskanje nekje po 10 sekundah,
odvisno od tega kaj iscem seveda. Z MySQL je iskanje trajalo nekje 3-4s
ampak sem nasel na njihovi web strani skripto ki optimizira bazo tako
da je iskalni cas zdaj nekje 0.3-0.4s. Masina je Athlon 700TBird, 128MB
pomnilnika in 5400 rpm Seagate disk.

Lp,
            Darko

--
_______________________________________________________________
Darko Koruga                             darko.koruga na hermes.si

HERMES Softlab
Litijska 51                             phone: +386 61 1865 527
1000 Ljubljana, Slovenia                  http://www.hermes.si/




Dodatne informacije o seznamu Starilist