Paieškos sistemos

Šioje pamokoje dėmesys sutelktas į tai, kaip paieškos sistemų kūrimas padarė perversmą internete. Studentai dirba komandomis, kad suprastų paieškos sistemų technologijas ir ištirtų, kaip jie gali gauti naudingos informacijos naudodamiesi paieškos sistemomis.

  • Sužinokite apie paieškos variklio pagrindus
  • Sužinokite, kaip pateikti užklausas paieškos sistemoms
  • Sužinokite, kaip rasti reikiamą medžiagą naudojant išplėstinės paieškos parinktis
  • Sužinokite apie komandinį darbą ir problemų sprendimą

Amžiaus lygiai: 8-18

Sukurti medžiagas (kiekvienai komandai)

Reikalingos medžiagos

  • Kompiuteriai su interneto prieiga
  • Negalima užblokuoti tokių populiarių paieškos sistemų kaip „Google“, „Yahoo“, „Bing“ ir kt

Dizaino iššūkis

Esate inžinierių komandos dalis, kuriant iššūkį kurti paieškos užklausas ir pranešti apie savo paieškos rezultatų aktualumą.

Kriterijai

  • Turi pranešti apie paieškų rezultatus.

Suvaržymai

  • Turi naudoti kelis paieškos variklius („Google“, „Yahoo“, „Bing“ ir kt.)
  1. Padalinkite klasę į 2-3 komandas.
  2. Išdalinkite paieškos sistemų darbalapį.
  3. Aptarkite temas skyriuje „Pagrindinės sąvokos“.
  4. Paaiškinkite, kad studentai turi dirbti kaip komanda, kad, naudodami darbalapį, sudarytų paieškos užklausas. Studentai turi palyginti skirtingų paieškos sistemų paieškos rezultatus pagal tas pačias paieškos užklausas.
  5. Paaiškinkite, kad studentai, naudodamiesi skirtingomis paieškos sistemomis, turėtų sudaryti savo paieškos rezultatų tinkamumo ataskaitą arba diagramą.
  6. Studentai susitinka atlikti ir dokumentuoti paieškos užklausų.
  7. Daugiau informacijos šia tema rasite skyriuje „Kasimas giliau“.

Laiko keitimas

Pamoka vyresniems mokiniams gali būti atliekama vos per 1 klasės laikotarpį. Tačiau norėdami padėti studentams nesijausti skubotiems ir užtikrinti mokinių sėkmę (ypač jaunesniems studentams), padalykite pamoką į du laikotarpius, suteikdami studentams daugiau laiko galvoti, išbandyti idėjas ir užbaigti jų dizainą. Atlikite testavimą ir trumpą informaciją kitame klasės laikotarpyje.

Paieškos sistemos pagrindai 

Sąvoka Paieškos sistema yra programų rinkinys, naudojamas informacijos paieškai konkrečioje srityje ir informacijos palyginimui duomenų bazėje. Paieškos sistemos padeda žmonėms tvarkyti ir rodyti informaciją taip, kad ji būtų lengvai prieinama.


Kodėl mums reikalingos paieškos sistemos?

Žiniatinklis skiriasi nuo to, ką žinojome. Pavyzdžiui, jei norėčiau nusipirkti knygą, nuėjau į vietinę knygų parduotuvę, išsirinkau patinkančią knygą, sumokėjau už ją ir grįžau namo. Knygų parduotuvė paprastai yra matomoje vietoje, jos priekinė dalis yra išregistruota, todėl ją palyginti lengva rasti.

Tačiau virtualioje erdvėje nėra kur „pasisukti“. Prieš mane yra tik kompiuterio ekranas. Kažkaip turiu rasti vietą norimai knygai įsigyti. Mano ekrane nėra gatvės, todėl negaliu važiuoti internete. Kartais tai akivaizdu: įveskite knygyno pavadinimą, pridėkite .com (kaip ir „barnesandnoble + .com“) ir tai yra gana geras statymas, kurį pateksite ten, kur norite. Bet ką daryti, jei tai yra specializuotas knygynas ir neturi interneto svetainės su akivaizdžiu URL?

Vienas šios problemos sprendimo būdų yra paieškos sistema. Tiesą sakant, tai tikriausiai yra vienas iš plačiausiai naudojamų būdų naršyti virtualioje erdvėje. Atsižvelgiant į informacijos, kurią galima gauti iš gero paieškos variklio, kiekį, tai panašu į „viskas viename“ turint „Geltonuosius puslapius“, gidų knygą ir kelių žemėlapį.

Paieškos sistemos gali pateikti daug daugiau informacijos nei tik svetainės URL. Jie taip pat gali rasti atsiliepimus, padėti palyginti kainas ir netgi sužinoti, ar buvo kokių nors su produktu ar gamintoju susijusių problemų. Daugeliui žmonių paieškos sistemų naudojimas tapo įprasta. Nebloga technologijai, kuriai net nėra 20 metų.

Paieškos sistemų darbas

Yra trys paieškos sistemų aspektai:

1) Tikrinimas

Žiniatinklio tikrinimas yra procesas, kai sistemingai pereinama iš tinklalapio į tinklalapį per žiniatinklio nuorodas, ieškant naujo turinio. Kai paieškos sistema tikrina, ji ieško naujo turinio, kurio nebuvo paskutinio tikrinimo metu, įskaitant failų ir tinklalapių atnaujinimus. Žiniatinklio paieškos sistemos saugo informaciją apie daugelį tinklalapių, kurias jie gauna iš paties HTML. Šiuos puslapius gauna žiniatinklio tikrintuvas, dar žinomas kaip voras - automatinė žiniatinklio naršyklė, sekanti kiekvieną svetainės nuorodą.

2.) Indeksavimas

Tada programos indeksuoja informaciją ir ištraukia konkrečius raktinius žodžius, kad ją suskirstytų į kategorijas. Pavyzdžiui, internete indeksavimas labai priklauso nuo raktinių žodžių tinklalapiuose ir meta žymų, kurios pateikia informaciją apie puslapį. Duomenys apie tinklalapius saugomi indeksų duomenų bazėje, kad būtų galima naudoti vėliau. Indekso tikslas - leisti informaciją rasti kuo greičiau. Kai kurios paieškos sistemos, pvz., „Google“, saugo visą šaltinio puslapį arba jo dalį (vadinamą talpykla), taip pat informaciją apie tinklalapius, o kitos, pvz., „AltaVista“, saugo kiekvieną kiekvieno rasto puslapio žodį.

3.) Ieškau

Kai vartotojas įveda užklausą į paieškos variklį, variklis patikrina jo rodyklę ir pateikia geriausiai atitinkančių tinklalapių sąrašą pagal jo kriterijus, paprastai su trumpa santrauka, kurioje yra dokumento pavadinimas, o kartais ir teksto dalys. Indeksas sudaromas iš informacijos, saugomos kartu su duomenimis, ir metodo, pagal kurį informacija indeksuojama.

Dauguma paieškos variklių palaiko Būlo operatorių AND, OR ir NOT naudojimą, norint patikslinti paieškos užklausą. Boolean operatoriai skirti pažodžiui ieškoti, kurie leidžia vartotojui patikslinti ir išplėsti paieškos terminus. Variklis ieško žodžių ar frazių tiksliai taip, kaip įvestas.

Paieškos variklio naudingumas priklauso nuo jo grąžinto rezultatų rinkinio aktualumo. Nors gali būti milijonai tinklalapių, kuriuose yra tam tikras žodis ar frazė, kai kurie puslapiai gali būti svarbesni, populiaresni ar patikimesni nei kiti.

Daugelis paieškos sistemų naudoja metodus rezultatams reitinguoti, kad pirmiausia būtų pateikti „geriausi“ rezultatai. Kaip paieškos variklis nusprendžia, kurie puslapiai geriausiai atitinka, ir kokia tvarka turėtų būti rodomi rezultatai, varikliai labai skiriasi. Metodai taip pat keičiasi laikui bėgant, kai keičiasi interneto naudojimas ir vystosi naujos technikos.

Paieškos sistemos algoritmai

Paieškos sistemos algoritmai yra unikalūs kiekvienam paieškos varikliui. Iš esmės paieškos variklio algoritmas yra taisyklių rinkinys arba unikali formulė, kurią paieškos variklis naudoja tinklalapio reikšmingumui nustatyti, o kiekviena paieškos sistema turi savo taisyklių rinkinį. Šios taisyklės nustato, ar tinklalapis yra tikras, ar tik šlamštas, ar jame yra reikšmingų duomenų, kurie žmonėms būtų įdomūs, ir daugybė kitų funkcijų, pagal kurias būtų reitinguojami ir pateikiami kiekvienos pradėtos paieškos užklausos rezultatai, atliekama organizuota ir informacinė paieška variklio rezultatų puslapis. Algoritmai, nes jie skiriasi kiekvienam paieškos varikliui, taip pat yra kruopščiai saugomos paslaptys, tačiau yra tam tikrų dalykų, kuriuos turi visi paieškos sistemos algoritmai.

1.) Atitikimas

Vienas iš pirmųjų dalykų, kuriuos tikrina paieškos variklio algoritmas, yra puslapio aktualumas. Nesvarbu, ar tai tik raktinių žodžių nuskaitymas, ar žvilgsnis į tai, kaip šie raktiniai žodžiai naudojami, algoritmas nustatys, ar šis tinklalapis apskritai turi kokią nors reikšmę konkrečiam raktiniam žodžiui. Tai, kur yra raktiniai žodžiai, taip pat yra svarbus svetainės tinkamumo veiksnys. Tinklalapiai, kurių pavadinimuose yra raktiniai žodžiai, taip pat antraštėje arba keliose pirmose teksto eilutėse, bus geriau vertinami pagal šį raktinį žodį nei svetainės, kuriose nėra šių funkcijų. Raktinių žodžių dažnis taip pat yra svarbus atitikimui.

2.) Individualūs veiksniai

Antroji paieškos sistemos algoritmų dalis yra atskiri veiksniai, dėl kurių tas konkretus paieškos variklis skiriasi nuo visų kitų paieškos sistemų. Kiekvienas paieškos variklis turi unikalius algoritmus, o individualūs šių algoritmų veiksniai lemia, kodėl paieškos užklausa pateikia „Google“ skirtingus rezultatus nei „Bing“ ar „Yahoo“. Vienas iš labiausiai paplitusių individualių veiksnių yra puslapių, kuriuos indeksuoja paieškos sistema, skaičius. Jie gali tiesiog indeksuoti daugiau puslapių arba dažniau juos indeksuoti, tačiau tai gali suteikti skirtingus kiekvieno paieškos variklio rezultatus. Kai kurios paieškos sistemos taip pat baudžia už šlamštą, o kitos - ne.

3.) Ne puslapio veiksniai

Kita algoritmų dalis, kuri vis dar yra individuali kiekvienam paieškos varikliui, yra ne puslapio veiksniai. Ne puslapio veiksniai yra tokie dalykai kaip paspaudimų matavimas (dažnis, kuriuo vartotojai pasirenka spustelėti interneto nuorodą į svetaines iš tų, kurias nurodo konkreti paieškos eilutė) ir susiejimas. Paspaudimų dažnio ir susiejimo dažnis gali būti rodiklis, rodantis, koks tinklalapis aktualus vartotojams ir lankytojams, ir tai gali paskatinti algoritmą reitinguoti tinklalapį aukščiau. Ne puslapio veiksnius žiniatinklio valdytojams yra sunkiau sukurti, tačiau, atsižvelgiant į paieškos sistemos algoritmą, jie gali turėti didžiulį poveikį puslapio reitingui.

Paieškos užklausų kūrimas

Paieškoje sukurta paieška atspindi jūsų mąstymą. Pradėkite nuo didelės vizijos ir pridėkite daugiau informacijos, kai jūsų paieška tęsiasi.

1.) Terminai ir eilutės

Žodžiai, kuriuos įvedate į pagrindinį paieškos variklio paieškos laukelį, vadinami terminais. Ieškodami informacijos, pabandykite naudoti dažniausiai naudojamus terminus, kurie yra būtini jūsų klausimui. Terminų grupė vadinama paieškos eilute arba paieškos užklausa. Pabandykite kurti paiešką po vieną terminą, kaip ir pridėtumėte karoliukus prie eilutės. Jums nereikia pridėti + ar žodžio ir tarp terminų, tačiau tarp kiekvieno termino ir kito turite palikti tarpą. Būkite kuo konkretesni. Paimkime scenarijų. Jūs gyvenate Niujorke ir norite valgyti ledus. Galite naudoti paieškos variklį, kad surastumėte netoliese esančių gerų ledų parduotuvių. Jums tinkama paieškos užklausa yra: ledai Niujorkas.

2.) Išbandykite frazės paiešką

Kartais geriausias būdas rasti informacijos yra dviejų ar daugiau žodžių paieška tam tikra tvarka. Įveskite šiuos žodžius kabutėse, kad atliktumėte frazės paiešką. Pavyzdžiui, galite ieškoti „žemės riešutų sviestas“, bet būkite atsargūs! Frazės paiešką naudokite tik vardams ir įprastoms ar įprastoms frazėms. Pavyzdžiui, jei norite valgyti ledų iš konkrečios parduotuvės, tarkime, Baskin Robbins, jūsų paieškos užklausa yra „Baskin Robbins“.

3.) Išskirkite kai kuriuos rezultatus

Kartais jūsų rezultatai apima terminą, kurio tikrai nenorite. Prie to termino pridėkite minuso ženklą, kad sukurtumėte neigiamą terminą. Tada pridėkite neigiamą terminą prie savo paieškos eilutės, kad jis nebūtų rodomas jūsų paieškos rezultatuose. Pavyzdžiui, jei jums nepatinka „Butterscotch“ ledai ir norite neįtraukti rezultatų, kuriuose yra „Butterscotch“, pabandykite: ledai –butterscotch Niujorkas.

Raskime atsakymą

Klausimas:

Jei nematote aiškiai, galite naudoti mano išradimą savo akių būklei įvertinti. Kas aš esu?

Kaip rasti atsakymą:

Iš klausimo galime padaryti išvadą, kad turime rasti asmens, kuris išrado tam tikrą procedūrą, kad patikrintų mūsų regėjimą, vardą. Taigi ieškokite: regėjimo testas. Jūs pastebėsite, kad tai daroma naudojant tam tikrą diagramą. Dabar ieškokite: regėjimo testų diagramos. Sužinosite, kad ji vadinama „Snellen diagrama“ ir ją sukūrė olandų oftalmologas Hermannas Snellenas 1862 m.

Atsakymas: Hermannas Snellenas

Kaip paieškos sistemos uždirba pinigus?

Iš esmės, paieškos variklis, kad ir koks būtų jo populiarumas, neatrodo pelningiausia iš verslo. Įvedate užklausą, paspaudžiate „Enter“ ir surandate rezultatus nemokėdami. Dažnai nepastebėta pinigų paieškos mašina, skirta paieškos sistemai, reklamuojasi.

Dauguma žiniatinklio paieškos sistemų yra komercinės įmonės, kurias remia pajamos iš reklamos, todėl kai kurie naudojasi praktika, leidžiančia reklamuotojams mokėti pinigus, kad jų sąrašai būtų reitinguojami aukščiau paieškos rezultatuose. Tos paieškos sistemos, kurios nepriima pinigų už savo paieškos rezultatų rezultatus, uždirba uždirbdamos su paieška susijusius skelbimus šalia įprastų paieškos sistemų rezultatų. Paieškos sistemos uždirba pinigus kiekvieną kartą, kai kas nors spustelėja vieną iš šių skelbimų.

Interneto ryšys

Rekomenduojama literatūra

  • Paieškos sistemų ir naršymo internete įvadas (ISBN: 0321306775)
  • Suprasti paieškos variklius (ISBN: 0898715814)
  • Paieškos sistemos: informacijos paieška praktikoje (ISBN: 0136072240)

Rašymo veikla

Parašykite esė (arba pastraipą, priklausomai nuo amžiaus) apie tai, kaip paieškos sistemų išradimas paveikė internetą.

Derinimas su ugdymo turinio sistemomis

Pastaba: Šios serijos pamokų planai yra suderinti su vienu ar keliais iš šių standartų rinkinių:  

Technologinio raštingumo standartai - visų amžių

Technologijos prigimtis

  • 1 standartas: studentai supras technologijų ypatybes ir taikymo sritį.
  • 2 standartas: studentai supras pagrindines technologijos sampratas. 

Gebėjimai technologiniam pasauliui

  • 12 standartas. Studentai lavins gebėjimus naudoti ir prižiūrėti technologines sistemas.

Suprojektuotas pasaulis

  • 17 standartas: studentai įgis supratimą ir gebės pasirinkti bei naudoti informacines ir komunikacines technologijas.

CSTA K-12 informatikos standartų K-3 klasės (5–8 metų)

5.1 1 lygis: informatika ir aš (L1)

  • Bendradarbiavimas (CL)
  1. Rinkite informaciją ir bendraukite elektroniniu būdu su kitais, padedami mokytojų, šeimos narių ar studentų partnerių.
  2. Dirbkite bendradarbiaudami ir bendradarbiaudami su bendraamžiais, mokytojais ir kitais, naudodamiesi technologijomis.
  • Kompiuterinė praktika ir programavimas (CPP)
  1. Naudokite technologinius išteklius tinkamiems tyrimams atlikti.
  • Kompiuteriai ir ryšio įrenginiai (CD)
  1. Norėdami sėkmingai valdyti kompiuterius ir susijusias technologijas, naudokite standartinius įvesties ir išvesties įrenginius.

CSTA K-12 informatikos standartų 3–6 klasės (8–11 metų)

5.1 1 lygis: informatika ir aš (L1)

  • Kompiuterinė praktika ir programavimas (CPP)
  1. Naudokite skaičiavimo įrenginius, kad pasiektumėte nuotolinę informaciją, bendraukite su kitais palaikydami tiesioginį ir savarankišką mokymąsi ir siekdami asmeninių interesų.

CSTA K-12 informatikos standartų 3–6 klasės (8–11 metų)

5.1 1 lygis: informatika ir aš (L1)

  1. Naršykite tarp tinklalapių naudodami hipersaitus ir atlikite paprastas paieškas naudodami paieškos sistemas.
  • Kompiuteriai ir ryšio įrenginiai (CD)
  1. Parodykite tinkamą klaviatūrų ir kitų įvesties ir išvesties įrenginių mokėjimo lygį.

Šiame darbalapyje yra keletas klausimų. Kiekviena studentų komanda turi sukurti paieškos užklausas. Studentai taip pat naudos interneto ryšį ieškodami atsakymų, o mokytojas gali įvertinti atsakymus vėliau. Studentai turi atkreipti dėmesį į atsakymus ir paieškos užklausas.

  1. Raskite žodžio reikšmę: „imbroglio“.

Atsakymas:

 

 

Paieškos užklausa:

 

 

  1. Suraskite tinklalapį, kuriame yra žodis „salsa“, bet NE žodis „šokis“.

Atsakymas:

 

 

Paieškos užklausa:

 

 

  1. Raskite tinklalapius, kuriuose yra tiksli frazė „Aš turiu svajonę“.

Atsakymas:

 

Paieškos užklausa:

 

 

  1. Raskite vietą, kurioje yra daugiausia sniego per metus.

Atsakymas:

 

 

Paieškos užklausa:

 

 

  1. Suraskite tinklalapį, kuriame yra žodžiai „dviračiu“ ir „Italija“.

atsakymas

 

 

 

Paieškos užklausa:

 

 

 

Pamokos plano vertimas

[kalbos keitiklis]