Nimeotsing .pdf failidest

Vaatleme ajakirja Vaimupuu vanade numbrite arhiivi näitel otsingulahenduse loomist, mille kaudu on võimalik otsida suurest hulgast .pdf formaadis failidest.

Nimeotsing .pdf failidest

Ajakirja uuemates numbrites sisalduvad artiklid on lehele üles pandud tekstilises veebiformaadis, milles sisalduvad nimed on otsitavad kodulehe otsingusüsteemi kaudu ülemises paremas nurgas asuva rohelise taustaga otsinguvälja "Otsi lehelt" kaudu.

 

Paraku valmis uus kodulehekülg hiljuti ja vanemad numbrid on loetavad ajakirja "Arhiiv" sektsioonis ainult .pdf formaadis failidena (nagu näha alloleval pildil).

Nimeotsing .pdf failidest

 

Probleemi kirjeldus

Ajakirja vanemad numbrid on .pdf formaadis küll kenasti kujundatud ja üksikult faile avades väga hästi loetavad, kuid probleemiks on ülevaatlikkuse puudumine, millised artiklid millises numbris olid ning kellest konkreetsetes artiklites juttu oli.

 

Toimetuse töötajad mäletavad küll, et konkreetsete persoonidega on kunagi intervjuud tehtud, kuid mitte väga täpselt millises numbris artikkel ilmus.

 

Võimalikud lahendused

Lahendusi on mitmeid, neist kolm peamist on:

  1. Panna vanades numbrites sisalduvad artiklid kodulehele üles veebiformaadis, et need oleksid uute artiklitega ühtsetel alustel sama otsingusüsteemi kaudu otsitavad.
  2. Luua vanade numbrite kohta lühivormis sisukokkuvõtted, millest saaks lihtsamini ülevaate, millises numbris millised artiklid olid (ja keda konkreetses artiklis intervjueeriti ning mis oli peamiseks teemaks). 
  3. Luua selline otsingusüsteem, mis suudaks indekseerida ja kuvada otsinguvasteid .pdf failide seest, et nendest saaks lihtsal moel märksõnu ja nimesid otsida.

Esimene lahendus on muidugi eesmärki silmas pidades kõige parem, sest veebiformaadis on artiklid ka väikestel ekraanidel (näiteks nutitelefonides ja tahvelarvutites) paremini loetavad ning olemasolev otsingusüsteem suudab siis neist kõigist otsida. Selle variandi puuduseks on, et artiklite veebiformaadis ülespanek on väga töömahukas ja võtab tublisti aega.

 

Teine lahendus on kompromissvariant, mis on küll ajaliselt kiirem, kuid kui pikemas perspektiivis on ikkagi plaanis kõik artiklid veebiformaati viia, siis on sisukokkuvõtete loomisel osaliselt tegemist topelttööga.

 

Juhul kui kolmas variant on teostatav mõistliku ajakuluga, siis pakub see kiiremat võimalust teha vanade numbrite sisu koheselt otsitavaks, mis vähendab otsest survet artiklite veebiformaati viimiseks ja seda saab teha siis sõltumatus tempos.

 

Google otsing

Tuntud otsingumootor indekseerib lisaks veebiformaadis sisule ka .pdf faile ja selle kasutamine oleks üheks võimaluseks vanadest numbritest otsida. Võtame näiteks Vaimupuu 2016. aasta aprillinumbris ilmunud artikli "Helpific aitab aidata" ja otsime selles intervjueeritud Keiu Roosimäe nimega.

Nimeotsing .pdf failidest
Google otsingus tuleb vasteid kõigist allikatest, kus otsitav nimi esineb.

 

Kohandatud Google otsing

Õnneks on võimalus luua aadressil cse.google.com ühe kodulehe piires otsimiseks kohandatud otsing (ingl. Custom Search Engine), milles on võimalus täpsemini piiritleda milliselt domeenilt ja millistest formaatidest otsitakse.

Nimeotsing .pdf failidest
Custom Search Engine võimaldab piiritleda, milliselt saidilt ja millistest formaatidest otsingut teostatakse.

 

Järgneval illustratsioonil on näha, milline tulemus sama nimega vaimupuu.ee lehelt otsides Custom Search Engine otsingu kaudu nähtavale ilmub.

Nimeotsing .pdf failidest
Otsingutulemuse vaade Custom Search Engine kaudu, milles on tulemusi piiratud vaimupuu.ee lehega.

 

Kohandatud tulemuse kaudu tuleb piisavalt piiritletud tulemus, otsinguvastetena kuvatakse ainult vaimupuu.ee domeenil asuvaid .pdf faile.

 

Tasuta versioonis sisalduvad reklaamid

Üheks probleemiks tasuta CSE otsinguvariandi kasutamisel on Google poolt kuvatavad reklaamid. Konkreetsel illustratsioonil näha oleval booking.com reklaamil pole muidugi suuremat midagi otsitava nimega ühist, pigem soovib

Google lihtsalt selgelt ja läbivalt demonstreerida, et tasuta lõunaid ei ole ja suunata cse.google.com kasutajaid rohkem kasutama tasulist versiooni (sest Google on muuhulgas äriettevõte ja on huvitatud kasumiteenimisest).

Nimeotsing .pdf failidest
Sinisel taustal nupu "Upgrade to Site Search (Ads optional)" kaudu avanevate valikute vaade.

 

Google Custom Search Engine (lühidalt CSE) kasutamise eeliseks on kindlasti võimalus integreerida otsingukast ja vastete tulemuste kuvamise ekraan lihtsal ja ilma suuremat programmeerimistööd ette võtmata kodulehe sisus.

Nimeotsing .pdf failidest
CSE kodulehele integreerimise võimaluste valik. Laotusvariantide vahel saab lahedalt valida.

 

CSE otsingu miinused

Eelnevate näidete najal saime teada, et Google CSE on küll hästi seadistatav ja seda on lihtne kodulehega integreerida, kuid miinusteks on reklaamide kuvamine või kommertsversioonis vähemalt $100 aastamaks.

 

Google tavaotsingus filtrite kasutamine

Kui vaatlesime paar lõiku tagasi Google üldotsingu kaudu ilmuvaid vasteid, siis oli näha, et tulemused ilmusid paljudelt veebilehtedelt ja isegi Facebookist.

 

Selleks, et tulemustes kuvataks vasteid ainult ühelt konkreetselt veebilehelt, tuleks kirjutada otsingufraasi lõppu kitsendav filter "site: vaimupuu.ee"

Nimeotsing .pdf failidest

 

Tulemus on suurepärane selle poolest, et otsinguvastetena ilmuvad nüüd ainult ühe domeeni piires sisalduvad kirjed. Paraku on nüüd näha nende artiklite kohta, mis on nii veebiformaadis kui ka .pdf failides topeltkirjed.

 

Selleks, et kitsendada otsingut veelgi ja piirata tulemusi ainult .pdf failides sisalduvate vastetega, tuleks fraasi lõppu lisada juurde veel ".pdf$"

Nimeotsing .pdf failidest
Nüüd on ka tavalises otsingus tulemused filtreeritud nii ühe domeeniga kui ka failiformaadiga.

 

Tavaotsingu puuduseks on, et seda ei ole võimalik väga lihtsal moel veebilehega integreerida. Üheks võimaluseks on lihtsalt kirjeldada kasutajatele, millisel moel on võimalik failidest otsida ja teha näite varal filtri kasutamine lihtsamaks. Allpool on näha, kuidas sai ajutise variandina lehele lisatud lihtne paarirealine juhend koos näidet demonstreeriva ekraanipildiga. Teksti sisse lisatud google.com lingi küljes on otsingufraasi lõppu kirjutatav filter, mis peaks selle kasutamise veelgi lihtsamaks tegema - kasutaja peaks siis kirjutama ainult otsingufraasi.

Nimeotsing .pdf failidest
Ajakirja arhiivilehe algusesse lisatud paarirealine juhend, mis sisaldab otsingufiltri näidet.

 

Ekraanipildi ja lingiga viitava prototüübi puudused

Peamiseks probleemiks sellise google.com lehele viitava lahenduse juures on, et see on oluliselt keerukam kui lihtsalt samal lehel otsinguväljale fraasi kirjutamine. Lingi kaudu google.com lehele siirdununa ei jää juhendav erkaanipilt nähtavaks. Samuti tekkis illustreerival pildil ebakõla toimetatava fraasi vahel - kasutatud oli mitut fraasi, "otsingufraas" ja "kirjutasiiaotsingufraas", mis võisid otsijaid segadusse ajada. Üheks arusaamist raskendavaks probleemiks oli ka, et rohelise sõõriga ei olnud esile toodud mitte see fraas, mida oli vaja google lehel toimetada, vaid hoopis selle lõpus olev kitsendav filter "site: vaimupuu.ee .pdf$".

 

Edasiarendatud otsingulahendus

Peale põhjalikku testimist selgus, et google.com ei tunnista küll $_POST kaudu otsingufraaside otsingusüsteemi postitamist, kuid $_GET kaudu saab siiski täiesti edukalt fraasi google.com süsteemi saata.

 

Selle teadmise najal lõime Vaimupuu arhiivilehele otsinguvälja, millesse kirjutatud fraasid saadetakse javaskripti abil GET vormis google.com lehele.

Nimeotsing .pdf failidest
Kirjutades otsinguväljale nime, avab skript uues sakis lihtsalt google.com otsingutulemuste lehe.

Otsingufraasile lisatakse automaatselt javaskripti abil juurde domeeni ja faililaiendi filtrid - nii ei ole otsijal vaja enam nendega pead vaevata. Selle tulemusena on otsijatel nime kirjutamiseks selgema ja lihtsama väljanägemisega otsingukast, milles on nüüd hea rahulik otsingufraasi kirjutada.

 

Usutavasti on selline tulemus märksa kasutajasõbralikum ja teenib paremini algselt püstitatud eesmärki - pakkuda ajakirja lugejaile lihtsalt arusaadavat võimalust .pdf formaadis arhiivinumbrite sisust otsimiseks.

Veebirakendused
Meie poolt loodud kodulehed on mugavad toimetada ja saavad Google käest hea kvaliteediskoori. Hea nähtavus otsingutes aitab sul edustada enda organisatsiooni tulemuslikumalt ja mõistlike püsikuludega.

Lihtsast keerukamateni
Lisaks lihtsatele lehtedele oleme loonud  tootekataloogide ja tellimissüsteemidega e-poode ning ka keerukama andmestikuga kalkulaatoreid, mis teevad dünaamiliste arvutuste tulemused veebis nähtavaks.

Saada meile päring
Veebi tellimise esimeseks sammuks on päringuvormi täitmine, milles saad enda soovitud fookust lühidalt kirjeldada. Selle põhjal küsime täpsustavaid küsimusi ja teeme sulle detailse hinnapakkumise.

Kontaktandmed
Firma nimi: Aara disainibüroo OÜ,
registreerimisnumber. 11477099
IBAN: EE967700771001668194
Klienditoe tööaeg E-R kella 09.00-17.00
Saada enda küsimus:

Veebilehe disain ja CMS

Nimeotsing pdf failidest

Ajakirja uuemates numbrites sisalduvad artiklid on lehele üles pandud tekstilises veebiformaadis, milles sisalduvad nimed on otsitavad kodulehe otsingusüsteemi kaudu ülemises paremas nurgas asuva rohelise taustaga otsinguvälja "Otsi lehelt" kaudu Paraku valmis uus kodulehekülg hiljuti ja vanemad numbrid on loetavad ajakirja "Arhiiv" sektsioonis ainult Vaatleme ajakirja Vaimupuu vanade numbrite arhiivi näitel otsingulahenduse loomist, mille kaudu on võimalik otsida suurest hulgast .pdf formaadis failidest.

Nimeotsing . pdf failidest

www.aara.ee © 2022 Aara disainibüroo OÜ » Sisu ja vormi sünergia