Kuidas teha oma kodulehekülg internetis leitavaks?

Netiportaalid räägivad sadadest tuhandetest kui mitte miljonitest külastustest päevas, sinu kodukas saab aga tipphetkel nii sadakond silmapaari nädalas. Reeglina on probleemiks üks kahest: kas sul pole sisu mis külastajale meeldiks või nad lihtsalt ei leia sind üles.

Kuigi alljärgnevalt tuleb juttu nimelt otsimisest-leidmisest tasuks seejuures pidevalt meeles pidada ka sisu ning mõelda selle peale, kuidas luua rohkem sellist sisu, mis potentsiaalseid külastajaid kohale (ja homme jälle tagasi) meelitaks. Kui ikka otsimootori logi näitab, et inimesed otsivad mobla-teemal sõna ‘helinad’ (‘nokia helinad’, ‘3210 helinad’ jne), siis miks mitte sellest oma telefonipoe kodulehel kirjutada? Vaadates hetkel Tehnokrati kodulehe sisemise otsimootori vastuseta jäänud päringuid leian muuhulgas ‘püsiühendus’, ‘palm’, ‘sms’ – arvatavasti on need sõnad, mille peale kasutajale meie nimi meelde tuli. Miks siis teda kurvastada?

Kõigepealt aga siiski otsingutest:

  • Kuidas kasutaja kodulehele tuleb
  • Kuidas otsimootorid toimivad
  • Otsisüsteemide probleemid
  • Kuidas meeldida / meldida
  • …ja otsisüsteemid sinu enda veebis

Kõrvalmärkus külastuste arvu kohta: kes soovib, võib enne reklaamikanali valimist ise kontrollida: näiteks http://www.ee/analog/, http://www.delfi.ee/analog/, http://www.mega.ee/analog/, http://www.neti.ee/analog/ jne — Analog on programmi nimi, mis veebiserveri logifaili analüüsib ja neid raporteid genereerib. Koos statistikaga leiab neilt lehtedelt ka Analogi konfiguratsioonifaili ehk täpse kirjelduse, kuidas nähtavad numbrid on saadud (küllap siis on olemas võimalus statistikat veidi oma heaks kallutada). Analog on täiesti tasuta ja jookseb nii kõikvõimalike Unixite kui ka Windows NT peal. Proovi ja lisa logianalüüs ka oma kodulehele!

Kuidas kasutaja kodulehele jõuab

Veebiserverid salvestavad külastajate kohta palju rohkem infot kui arvata võiks, näiteks on neile harilikult teada referer ehk lehekülg, millelt kasutaja leidis sinuni toonud lingi – olgu see siis kellegi kodulehe lingikogu või otsimootori antud vastuste nimekiri (tõsi küll, otsimootorid ei pruugi alati reeta kasutaja esitatud küsimust).

Kui ma jälgin Tehnokrati kodulehele (www.tehnokratt.net) tulevaid kasutajaid, siis kõige sagedamini on nende referer’iks neti.ee ehk otsimootor. Seejuures väike osa neist tuleb läbi teemakataloogi (Arvutid->Raadiosaated), ülejäänud on aga otsinud lihtsalt sõna ‘tehnokratt’ või mõnda meie veebis leiduvat võtmesõna. Seda vaatamata sellele, et me oma veebiaadressi nädalast nädalasse raadios ja teles kordame – lõbu, mida enamus mitte-raadiosaateid endale lubada ei saa. Ja vaatamata sellele, et meil on lisaks veidi võõrale .net aadessile olemas ka www.tehnokratt.ee, mis on ju igati lihtne ja meeldejääv.

leia_referrer:

Moraal: kasutajate avaleheks on portaal või otsimootor ja sealt kaudu nad meie juurde ka tulevad (vaadates www.ee otsilogi ilmneb, et paljud sisestavad otsimootorisse lausa täisaadressi, nt www.hansa.ee). Võiks vist väita, et kodulehe leitavus otsisüsteemide ja teemakataloogide kaudu on isegi tähtsam, kui väga vinge domeeninimi (nt www.kurgidsullerahamulle.ee) või selle reklaamimine meedias (nt Hansa, U-Pank jne).

Leitavust mõjutab aga õige mitu tegurit: (a) sinu aadress peab otsimootorile teada ja meele järgi olema, (b) otsimootoreid on mitmeid ning kasutajate eelistused on erinevad, (c) otsimootorite meetodid info indekseerimiseks ei pruugi olla kõige paremad.

Tõsi küll, need on vaid tehnilised põhjused. Vahest peaks hoopis mõtlema, miks kasutaja meie kodulehele tuleb? On olemas tõenäosus, et ta otsib mind firma- või tootenime järgi (‘tehnokratt’), hoopis loogilisem on eeldus, et teda huvitab miski, mida ma teen: müün autosid, meil on ühine lemmikjuust, ta tahab oma telefonile uut helinat laadida vms.

Tehnokrati veebis on üks lehekülg, mille ma tegin vahest pool aastat tagasi ühe saate taustaks ja kuhu jätsin võimaluse igaühel WAP-teemalisi linke lisada. Mina olen lehekülje juba unustanud, aga kasutajad leiavad selle üles ja lisavad oma soovitusi – ning ma ei usu, et keegi viitsiks minu Tehnokrati veebi hierarhias sobrada kuni selle lehekülje leidmiseni. Fakt on see, et kasutaja leidis teda huvitava lehe (ja sellega ka laiemas mõttes kogu meie saate veebi) tänu otsimootorile ning seejuures otsides märksõna, mis ei ole otseselt minu põhitegevusalaks.

Kuidas otsisüsteemid toimivad

Otsisüsteemid võiks laias laastus kaheks jagada: teemakataloogid ja täistekstiotsingud. Esimestes katalogiseeritakse inimeste (kasutajad, toimetajad) abil lehed teemade kaupa, näiteks Tehnokrati leiad sa reeglina Arvutid->Raadiosaated alt (siinkohal teemanimed fiktiivsed). Meie GPS-teemalise lehe peaks avastama Sport->Matkamine alt ja WAP-lingikogu hoopis kolmandast kohast (Arvutid->Side->WAP). Reaalses elus on küll valdav enamus kodulehtedest esindatud vaid ühe kategooria all – kas pole piisavalt sisu mis vääriks eraldi esiletoomist või on lihtsalt lehekülje tegija laisk olnud enda ülesandmisel. On aga ka teise poole erandeid, näiteks DMC Direct kelle kohta tehtav päring näitab neti.ee all kümmekond kategooriat, kust neid leida võib.

Sellisesse kataloogi pääsemiseks tuleb tavaliselt täita ankeet Lisa URL, kuid selle sisu käib enne avalikuks saamist läbi inim-toimetaja käest kelle ülesandeks on hoolitseda, et informatsioon oleks neutraalne, lehekülg satuks asjakohasesse kategooriasse ning oleks kirjelduse järgi leitav. Registreerides lehekülge www.kurgidsullerahamulle.ee ja pakkudes selgituseks “Pääsküla parimad väikesed nöpskurgikesed” jääb arvatavasti ‘Pääsküla parimad’ välja kui reklaamimaiguline väide ja nöpskurgikesed asenduvad lihtsalt sõnaga ‘kurgid’. Lõpptulemus on aga igal juhul kasutajale kiiremini leitav.

Jaanus Vainu kes toimetab neti.ee teemakataloogi ütleb nii:

Viidete kirjeldused sõnastan ma alati ise käsitsi ringi, lähtudes vajadusest esitada maksimaalselt sõnade algvorme ja mitte lauseid (mis teeks ka jutu pikaks). Sest meie logifaili monitooring näitab, et rahvas otsib peamiselt just algvormis sõnu ja ei oska kasutada sõnatüve järgi jms. kavalamaid otsingumeetodeid. Lisaks püüan ma ka hoida kataloogis samas teemas olevate viidete puhul sarnases stiilis kirjeldusi. Ning eemaldan ka mõttetud ja mitteinformatiivsed sidesõnad ja abisõnad (=ballast). Ning ei luba kellelgi lisada reklaamihõngulisi kiidusõnu ja võrdeid.

Pirjo Urvak www.ee’st toob välja järgmised punktid:

Eelkõige tuleb kirjelduse kirjutamisel pöörata tähelepanu sellele, milliste märksõnade kaudu võiks see lehekülg olla leitav. Samas ei saa kirjeldus olla vaid üks märksõnade jada, kuna kirjelduse üks funktsioon on siiski anda inimesele väike ülevaade lehel leiduvast. Tuleb mõelda ka sellele, et kirjelduses võib märksõna olla mingis käändes või pöördes. Näiteks firma puhul, mis tegeleb mööbli müügi ja valmistamisega, ei saa kirjelduseks panna ‘Mööbli müük ja valmistamine’, sest inimene sisestab otsiväljale arvatavasti sõna ‘mööbel’, mitte ‘mööbli’ – seepärast tuleb kirjelduseks panna ‘Mööbel – müük ja valmistamine’. Teine, võib olla pisut koomiline näide, on selline, et oma kirjelduses ei tohi ma kasutada ‘-seks’ vormi, nagu näit. ‘ühing liikluskorralduse parandamiseks’. Põhjus on selles, et enim otsitud sõna WWW Wärgist on ‘seks’.

Tihti on minuni jõudnud registreerimisvormidel kirjeldusse kirjutatud midagi slõugani taolist – a la ‘ Ostke meilt odavat ja kvaliteetset kosmeetikat!’- Sellisena me kirjeldust muidugi ei lisa, sest kirjeldus peab olema võimalikult konkreetne ja adjektiive ma reeglina üldse kirjeldustes ei kasuta.

On ka selliseid variante, kus on kirjelduse-väljale “laotud” kõik võimalikud märksõnade variandid. Näit. “tarkvara download, donwload, downlaod, mahalaadimine, mhalaadima….” ehk siis on mõeldud ka variantidele, kus otsingu päring võib olla valesti kirjutatud. Ka sellisena ei lisa ma kirjet kuna kirjeldus peab säilitama mingisuguse loogilise lause ülesehituse.

Teine tüüp otsimootoreid käib iseseisvalt läbi kogu neti surfides lingilt lingile ning üritab oma taibu kohaselt kogu lehekülje sisu teksti indekseerida ning leida selle lehekülje kohta käivad võtmesõnad – nende otsimisel peaks lehekülg sattuma nimekirjas ettepoole. Näiteks selle jutu puhul peaks vaieldamatult enim punkte saama sõna ‘otsimootor’ või ‘otsisüsteem’: seda esineb tekstis korduvalt, mõõdukate vahedega (arvatavasti pole tegemist katsega otsimootorit haneks tõmmata, näiteks kirjutades lehekülje algusesse paarkümmend korda ‘otsimootor’), lisaks ka pealkirjas ning bold-kirjas.

Lisaks sisule vaatavad otsimootorid aga veel ühte kohta: nimelt saab lehekülje märgendada meta-infoga mis kirjeldab leheküljel leiduvat päris-infot ja toob välja olulised võtmesõnad. Näiteks minnes Tehnokrati kodulehele ja valides Internet Exploreris View->Source peaks üsna lehekülje alguses nägema midagi sellist (ära pane tähele moondunud täpitähti):

<meta name="description" content="Tehnokratile jäi kooliaasta-alguse moesõnaga 'digitaalõpe' meelde hoopis teine küsimus: nimelt kui keeruline siis ikkagi on teha multimeedia-CDd ja miks me ei võiks seda kõike üle neti vaadata.">

<meta name="keywords" content="multimeedia, e-arve, digiõpe">

Esimene neist ehk description on lehekülje sisukokkuvõte – otsimootor saab seda näidata koos sinu lehekülje pealkirja ja aadressiga selle asemel, et tuua välja lihtsalt jupike lehe algusest.

Keywords on aga võtmesõnad, millega tasuks seda lehekülge seostada. Kui kasutaja otsib nimelt neid sõnu, peaks vastav lehekülg nimekirjas ettepoole sattuma – kuigi ka siinkohal kulub ära hoiatus liigse innukuse eest, sest otsimootoritel on kombeks lehed, millel üle paarikümne võtmesõna, lihtsalt kõrvale jätta kui potentsiaalne katse otsimootorit petta. Samas võib vahel olla vaja ohtralt märksõnu kasutada, näiteks avastasin ühe trükikoja kodulehe päisest loetelu: ofset, offset, offsett, ofsett (ehk ühe tõenäolise otsisõna kõik õiged ja valed kirjavormid).

Lisaks meta-väljadele leiab faili algusest reeglina ka lehekülje pealkirja:

<title>Tehnokratt | Kas multimeedia on keeruline ja kas nett kannatab videot?</title>

Kain Kalju neti.ee’st soovitab:

… Seega kindlasti oled number 1-3, kui sinu lehekülje aadress on www.nimi.ee, tiitel on “nimi”, META description “nimi blaah blaah”, sisaldab rõhutatud teksti “nimi blaah” jne.

Kainil jäi vist kogemata välja viide keywords’ile, omalt poolt lisaks aga soovituse kindlasti mõelda pikemalt ka lehekülje pealkirja peale, näiteks meie kodulehel koosneb see sõnast ‘Tehnokratt’ ja konkreetsel leheküljel oleva teksti pealkirjast. Nii on kindel, et ka juhul kui description kirjutamata jääb näevad otsijad lehekülje selgitusena mõtestatud teksti (oleks ju jama leida sadakond lehekülge millest igaühel pealkirjaks ‘Tehnokratt’).

Kahjuks ei ole meta-infost hetkel kasu www.ee puhul, nimelt kommenteerib Aivar Loik:

Metaväljades sisalduvat infot hetkel otsingutulemustes ei arvestata, kuna teatavad keskkonnad kasutavad selliseid võimalusi kurjasti ära. Edaspidi ilmselt mingi loogika nende arvestamiseks siiski tekib.

Kokkuvõtteks: edukad teevad nii ühte kui teist – muuhulgas hakkas selle ettekande valmimise ajal Eestis lisaks www.neti.ee’le täistekstiotsingut pakkuma ka www.ee / www.ee.everyday.com. Vahest kõige kuumemaks sõnaks on viimasel ajal otsisüsteemid, mis üritavad võimalikult intelligentselt otsustada lehekülgede sobivuse üle – näiteks jälgides, kaua kasutaja ühel või teisel leitud leheküljel püsis ning pakuvad järgmisele küsijale esimesena juba lehekülgi, mida kauem loeti. Tavalisemad üritavad kokku viia kasutaja päringu ja kas lehekülje kirjelduse või sealt leitud sisu, kusjuures täpseid algoritme üritatakse hoida võimalikult salajastena tagamaks, et keegi ei suuda süsteemi tahtlikult mõjutada.

Et saada teada kasutajate harjumusi on väga õpetlik vaadata www.ee otsilogisid, mille leiab http://www.ee/www/search_logs/ — ja siinkohal tahaks avaldada erakorralist tunnustust www.ee meeskonnale, kes lubas nimetatud aadressi veidi avalikumalt tutvustada (kellel huvi pikema nimekirja vastu peaks nendega otse ühendust võtma). Otsimootor on ju tegelikult kasutajale seda rohkem abiks, mida enam meie ehk lehekülgede ja sisu loojad suudame tema ootustele vastata. Kahju muidugi, et seda teadmist kiputakse kurjasti kasutama ja www.ee seetõttu meta-infot ei kasuta…

Otsisüsteemide probleemid

Näiliselt on kogu otsi-ala väga lihtne äri, seda võiks võrrelda näiteks firma serveri ülesehituse (kataloogid Kirjad, Hinnapakkumised jne) ja find-käsuga. Aga tühjagi – tegelik elu on palju keerulisem.

Teemakataloogid eeldavad, et lehekülje looja (või mõni fänn) selle koos mõtestatud kirjeldusega üles annab (ja toimetajad asja üle vaatavad ning heaks kiidavad). Otsimootori puhul lisandub ülesandmisele või ülesleidmisele lootus, et sinu lehekülge peetakse mingil teemal oluliseks ning automaatika selle nimekirja algusesse otsustab paigutada.

Kujutame näiteks ette eelmainitud olukorda: mul on veebis väga hea lehekülg, mis räägib WAPist. Läheme prooviks www.ee ja neti.ee mootoritesse ja vaatame, kas me selle ka leiame. Tutkit — sest ma pole ennast nende lehekülgede osas üles andnud. Aga tegelikult ma olen ju huvitatud sellest, et mind leitaks!

Või võtame teise olukorra, www.kurgidsullerahamulle.ee – anname selle prooviks üles teemakataloogi ja ütleme kirjelduseks “Kurgid hea rahaga” (ning eeldame siinkohal, et nii see ka kirja läheb). Seejärel paneme ennast keskmise kasutaja seisukohale ja mõtleme, miks me seda tahame leida? Küsib keskmine kasutaja hoopis “kurkide ostmine” või “kurk soodne” ja – ei midagi. Probleemiks on see, et Eesti otsimootorid ei sisalda nn morfomootorit, mis teeks indekseeritavatele ja otsitavatele sõnadele morfoanalüüsi ja leiaks, et kurgid, kurk ja kurkide käivad kõik tüve ‘kurk’ kohta. Sama olukord on loomulikult ka täisteksti-otsisüsteemide puhul: meie lehekülg leitakse, kui kasutaja otsib täpselt lehel esinevat sõna.

Käänetest ja pööretest samm edasi on sünonüümid: minu lemmiknäide on minna telefonikataloogi kodulehele, nt www.1182.ee ja otsida sõnu ‘ehituskaup’ ja ‘ehitusmaterjalid’ – ilmneb, et kuigi mina tahan osta ehituskaupa on korrektne küsida ikkagi materjali! Teemakataloogi puhul pole see vahest probleemiks, otsin silmaga e-tähe kandist ja leian, otsisõna sisestamisel võin ma aga hõlpsasti apsu teha. Minu soovitus kõigile analoogsete kataloogide pidajatele oleks kindlasti ehitada üles sünonüümide süsteem: seda enam, et tegelikult on keeletehnoloogia-tegijatel vastavad lahendused olema ja toimivad (muuhulgas on indekseeritud piibel).

Üheks Eesti otsimootorite eriprobleemiks on see, et nad ei ole reeglina ilma süsteemiadministraatori isikliku vahelesekkumiseta (ja võibolla isegi siis) nõus arvesse võtma lehekülgi, mis asuvad .net või .com domeenis. Nii et kui sa leiad kohalikust teemakataloogist www.tallinnasygisjooks.com või www.tehnokratt.net, ole õnnelik. Avastades, et nende veebide alam-lehekülgi ka automaatselt indekseeritakse, oleks kohane otsimootori-pidajat isiklikult õnnitleda, väike viski-kingitus pole kah paha idee ;-)

Kuidas ennast tutvustada

Et keegi sind leiaks, on kasulik ennast tutvustada. Seejuures lähtudes ülalpool kirjas olevast:

  • Sa ei ole ainult automüüja: kasutaja võib su leida hoopis GPSi, Thulema katuseraami või “besniinikulu 6 l/km” järgi.
  • Kataloogidesse ja otsimootoritesse meldimine on sinu enda teha: mõtle ennast kanaks, kes iga muna (lehekülje) järel kaagutab. Loomulikult ära unusta mõõdutunnet ja mõtle ikka kah, kas käsilolev muna kisa väärt on – muidu võid sõnumi ära lahjendada ja kataloogi-toimetajate musta nimekirja sattuda.
  • Kontroll: kas sa oled ikka leitav? Kas sinu eelmisel nädal lisatud lehekülg on leitav? Kuidas sind leitakse? Analüüsi oma veebilogi, katsu välja mõelda küsimusi, millega kasutaja võiks sinuni jõuda. Kas need toimivad? Kas keegi kurdab, et sinu vinget ehitustarvete poodi ei leia otsides näiteks ehituskaupu (või rauakaupu, tööriistu)?

Ehk absoluutse edu valem: Loo sisu ja anna sellest teistelegi teada. Sind ei leita, kui oled veebi ehitanud oma nägemuse järgi: mida ma tahan müüa. Mõtle kohe alguses selle peale, mida kasutajad otsivad.

Otsimootori jätk sinu kodulehel

Kuigi kõik ülaltoodu oli kirjutatud mõeldes suurte otsisüsteemide peale kehtib sama reeglistiks ka sinu enda veebis: st kasutajal on mugav infot üles leida otsimootorist ja mitte mööda lehekülgi huupi ringi rännates. Oma veebi puhul on aga paar eelist: nimelt ei pea sa murdma pead, kas ja millal otsimootor suvatseb sind külastada ning mida ta võtab arvata meta-infost. Lehekülje saab indekseerida kohe peale selle lisamist või muutmist ning lehekülje kirjeldus võib olla täpselt nii informatiivne kui vaja.

Tehnokrati veeb toimib Userland’i Frontier-serveril ja selle puhul on asi lihtne: ma lihtsalt palusin tal kõik lehed kohe peale loomist saata ka majasisesele otsimootorile indekseerimiseks. Asi ei peaks olema märkimisväärselt keerulisem ka mistahes muu serveritarkvara puhul – praktikas peaks see veebiloojale tähendama vaid ühe vormi lisamist ja selle sidumist vastava tarkvarajupiga. Lihtsus ei välista loomulikult asja eest suure raha küsimist aga…

Teine oluline punkt on nõuda kõikide lehekülgede varustamist meta-infoga kohe nende loomise hetkel (sest kes see ikka viitsib pärast hakata täiendusi tegema). Kui veeb tehakse valmis näiteks Microsofti FrontPage’is, on selles olemas võimalus lisada ka võtmesõnu ja kirjeldust (tõsi küll, mitte kõige mugavamal viisil, aga siiski). Tähelepanu maksaks aga eriti pöörata juhule, kui sulle on antud võimalus veebi otse brauserist muuta lehekülgi lisades ja muutes: ka sellisel puhul peaks olema normaalne võimalus lisada lehe kohta lisainfot.

leia_tehnokrattkeywords:

Lõppmoraal

Et sind leitaks:

  • Loo sisu, mida tahetakse lugeda (ja bookmarkida, linkida, tagasi tulla)
  • Märgenda kõik oma lehed meta-infoga
  • Kontrolli oma kirjet teema-kataloogis ja ülejäänud lehekülgede leitavust

2 Kommentaarid

  1. Zerberus
    Lisatud 22. dets. 2001 kell 04:04 | Püsiviide

    Ärge kirjutage vahepeal nii väikese kirjaga. Kui sa juba mitu tundi oled netis istunud, siis sa lihtsalt ei hakka nii kribu teksti mis on kaldkirjas lugema, olgu see nii hea kui tahes.

  2. Koer110791
    Lisatud 5. juuni 2011 kell 11:54 | Püsiviide

    coooooooooool!