http://www.behav.org/00library/Tapolcai/default.htm

Tapolcai - Cserey: Számítógépes információforrások és szolgáltatások az állatorvos-tudomány területén

Tartalom
 
AltaVista és AltaVizsla
  Függelék 7.
      http://www.altavista.com    
      http://altavizsla.origo.hu    
           
  Az AltaVista keresőrendszer az egyik legelterjedtebb eszköz az Interneten közzétett szöveges dokumentumok szavai közötti keresésre. Nem éri el azonban a honlapokhoz csatolt különálló adatbázisokat, például a PubMed-et. Ugyanazon szoftver magyar változata az AltaVizsla, a MATÁV nyelvi leleménye, és szolgáltatása. Két fokozatot kínál fel a kereső: Simple Search (egyszerű keresés) és Advanced Search (részletes keresés). Az alapelvek mind a kettőben azonosak.  
           
Általános szabályok
   
 

 

Az AltaVista számára a szó a keresési alapegység. Azokat a karaktersorokat tekinti szónak, amelyeket szóköz, vagy valamilyen írásjel (&,%,$,/,#,~) határol. Nem feltétel, hogy a szó értelmes legyen. A kifejezések olyan szóegyüttesek, amelyek egymás mellett fordulnak elő. A kifejezéseket idézőjelek között célszerű beírni.

Példák:

A következő keresőkérdés: paris "petit galerie" louvre azokat a dokumentumokat találja meg, amelyek a lehető legtöbbet tartalmazzák a felsorolt szavakból és kifejezésekből, és ezeket a találati pontosság sorrendjébe rendezve jeleníti meg a program. A kisbetűs beírás a nagybetűket is megtalálja. Ha viszont a szóban nagybetű is szerepel, az egész szóra nézve pontos egyezést követel meg. Pl. pariS csak az éppen így leírt szavakat fogja keresni (valószínűleg egy sem lesz).

Hasonló a helyzet az ékezetes betűkkel. Ha ékezet nélkül írjuk be, az ékezetes változatait is megtalálja, de ha egy szóban szerepel egy ékezet, már csak pontosan azt a szóformát keresi a program.

   
           
Pontos mondatok vagy kifejezések:
   
 

 

Ha tudjuk, hogy egy bizonyos mondat vagy kifejezés meg fog jelenni a keresett oldalon, ezt idézőjelek között írjuk a kereső-kifejezésbe. Ha például az LGT "Nem adom fel" című számának szövegét keressük, használjuk a következő kifejezést: "nem adom fel míg egy darabban látsz".

   
           
A keresés "nyelvtani" szabályai (speciális funkciók):
   
 

 

Az AltaVizsla nem csupán szöveget tud keresni. Íme a Hálón való keresés egyéb módozatai:

  • anchor:szöveg : Azokat az oldalakat találja meg, amelyek a meghatározott szót vagy mondatot tartalmazzák egy link szövegében.
  • domain:domainnév : A meghatározott domainen belül keres oldalakat. Használjunk domain:hu-t, hogy Magyarországon bejegyzett oldalakat kapjunk.
  • host:name : Egy adott számítógépen keres oldalakat. A host:matav.hu a Matáv szerverein található oldalak között keres, míg a host:fzlk.com a Főzelék összes számítógépén kutat.
  • image:filename: Olyan oldalakat keres, amelyeken egy adott nevű képfájl található.
  • link:URLszöveg : Olyan oldalakat keres meg, amelyek az URLszövegben megadott című oldalra mutató linket tartalmaznak.
  • title:szöveg : Azon oldalakat kapjuk eredményül, melyek a megadott szót vagy kifejezést az oldal címében tartalmazzák (ezt a legtöbb böngésző az ablak legfelső sávján írja ki).
  • url:szöveg : Olyan oldalakat keres, amelyek URL-je tartalmazza a megadott szót vagy kifejezést.
   
 
Csonkolás

Használjunk csillagkaraktert (*) azon szavak végén, melyek többféleképpen végződhetnek. Szó közben is alkalmazható bizonytalan helyesírású szavak esetén. Legalább 3 karakternek kell a szó elején állnia, és legfeljebb 5 karakter hosszan értelmezi a folytatást. Mindez azonban csak kisbetűs írásmódban működik. Ha túl sok eredményt adna a kérdés, a program letiltja a végrehajtást (ignored).

Az arany* kifejezéssel például minden olyan szóra keresünk, amely "arany"-nyal kezdődik, mint például arany, aranyásó, aranyos, aranylik. A módszer nagyon jól használható, ha egy magyar szó összes toldalékolt változatára is kíváncsiak vagyunk. A csonkolás mindenütt használható, kivéve a Results Ranking Criteria mezőt.

Egyszerű keresés (Simple Search)

Az egymás mellett beírt szavakat statisztikusan fogja keresni: előre veszi azokat az oldalakat, amelyekben a lehető legtöbbet találja meg közülük.

Szavak, melyek mindenképpen vagy semmiképpen nem szerepelnek az oldalon:

Gyakran lehet tudni, hogy egy adott szó feltétlenül meg fog jelenni abban a dokumentumban, amelyet keresünk. Ha így áll a helyzet, javíthatjuk keresésünk hatásfokát azzal, ha utasítjuk a keresőt: csak azokat az oldalakat mutassa meg, ahol ez a szó szerepel. Ennek érdekében a szó elejéhez egy "+"-t kell illesztenünk (például a háziállatok gondozására vonatkozó cikk megtalálásához kipróbálhatjuk a kutya macska háziállat +gondozás keresőkifejezést). Ha nem elég pontosan meghatározott témára keresünk, igen széles körű eredményeket fogunk kapni. A keresés eredményét hatásosan tudjuk szűrni úgy, hogy olyan szót adunk a kereső-kifejezéshez, amely gyakran jelentkezik nem kívánt cikkekben. Ehhez a szó elé illesszünk egy mínuszjelet (-)

Ha például vörösbor nélkül készült marha- vagy sertéspörkölt receptjét akarjuk megkapni, próbálkozzunk a pörkölt marha sertés -vörösbor kereső-kifejezéssel.

Részletes keresés (Advanced Search)

A kereső kifejezésben előforduló AND, OR, NEAR, és NOT operátorokat is értelmezni tudja ebben a működésmódban. Kis betűvel írva vagy jelekkel helyettesítve (AND:& OR:| NEAR:~ NOT:!) is beírhatjuk a Keresési feltételek ablakba. Az operátorok jelentése:

AND: mindkét kifejezés legyen benne a dokumentumban.
OR: legalább az egyik legyen benne.
NEAR: mindkettő legyen benne 10 szó távolságon belül.
NOT: a kifejezést tartalmazó dokumentumokat zárja ki a találatok közül.

Több operátor használata esetén zárójellel tudjuk (és érdemes is) a pontos értelmet megadni. Pl.:

gold or silver and platinum

gold or (silver and platinum)

(gold or silver) and platinum

Az első kettő azonos jelentésű, de harmadik ettől eltérő.

Az AltaVista sorbarendezése egy értékelő (pontozó) algoritmus alapján működik. A részletes keresés (Advanced Search) sorbarendezési eljárása azonos az egyszerű keresésével (Simple Search). A találati lista sorrendje (Results Ranking Criteria) mezőbe beírt szó előfordulása lesz az értékelés alapja. A lista elején jelennek meg azok a dokumentumok, amelyekben ez a szó az első mondatokban, vagy többször fordul elő, és amelyekben egyáltalán nem, azok nem is fognak szerepelni a találati halmazban. Jó, ha tudjuk hogy ha beírunk egy szót a sorbarendezés kritériumaként, ezzel kizárjuk mindazokat a dokumentumokat, amelyekben az nem szerepel.

   
 
 
webszerkesztő