Mivel elképesztő mennyiségű információhoz tudunk hozzáférni, a keresett tartalom megtalálása szinte lehetetlen lenne anélkül, hogy lenne némi segítségünk az átválogatásukban.
A Google rangsorolási rendszerei pontosan erre szolgálnak: a Kereső indexében megtalálható több száz milliárd weboldal és más tartalom átválogatására, hogy a másodperc töredéke alatt megjelenítsék a legrelevánsabb és leghasznosabb eredményeket.
A legfontosabb tényezők a találatoknál
Annak érdekében, hogy a leghasznosabb információkkal láthassák el a felhasználókat, a Kereső algoritmusai számos tényezőt és jelet figyelembe vesznek, így például a lekérdezés szavait, az oldalak relevanciáját és hasznosságát, a források szakmaiságát, továbbá a felhasználó tartózkodási helyét és beállításait. Az egyes tényezőknél alkalmazott súlyozás a lekérdezés jellegétől függően változik. Például a tartalom frissessége nagyobb szerepet játszik az aktuális hírekre vonatkozó lekérdezéseknél, mint a szótári definíciókra vonatkozóknál.
Alább további információt talál azokról a fő tényezőkről, amelyek segítenek annak meghatározásában, hogy a rendszer mely találatokat jelenítse meg a lekérdezésére:
A keresett kifejezések jelentése
A releváns találatok megjelenítéséhez először is meg kell határoznunk, hogy a felhasználó egészen pontosan milyen információt keres, vagyis milyen szándék áll a keresés mögött. Nyelvi modellek építésével próbáljuk megfejteni, hogy a keresőmezőbe beírt, viszonylag kevés szó hogyan kapcsolható össze a leghasznosabb rendelkezésre álló tartalommal.
Ide tartoznak olyan látszólag egyszerű lépések, mint az elgépelések észlelése és kijavítása, és kiterjed arra is, hogy kifinomult szinonimarendszerünket is bevetjük, ami lehetővé teszi számunkra, hogy akkor is releváns dokumentumokat találjunk, ha nem pontosan a megadott szavakat tartalmazzák. Előfordulhat például, hogy a „laptop fényerejének beállítása” kifejezésre keresett rá, de a gyártó úgy fogalmazott, hogy „laptop fényerejének módosítása”. Rendszereink megértik, hogy hogyan kapcsolódnak a szavak és a szándék, így a megfelelő tartalomhoz vezethetik. Ennek a rendszernek a fejlesztése több mint öt éven át tartott, és a keresések több mint 30%-ában hozott jelentős fejlődést a használt nyelvtől függetlenül.
Rendszereink azt is megpróbálják értelmezni, hogy milyen típusú információt keresnek a felhasználók. Ha olyan szavakat használnak a lekérdezésben, mint a „főzés” vagy „képek”, rendszereink rájönnek, hogy a keresési szándékhoz receptek vagy képek megjelenítése a leginkább megfelelő. Ha franciául keresnek, a legtöbb megjelenő találat ezen a nyelven lesz, mivel valószínű, hogy ezt is szeretnék a felhasználók. Rendszereink azt is fel tudják ismerni, hogy sok lekérdezés helyi indíttatású, így ha a „pizza” kifejezésre keresnek rá, olyan közeli vállalkozások jelennek meg, amelyek kiszállítanak pizzát.
Ha felkapott kulcsszavakra keresnek rá, rendszereink képesek felmérni, hogy a naprakész információk hasznosabbak lehetnek, mint a régebben frissült oldalak. Ez azt jelenti, hogy amikor sporteredményekre, vállalati bevételekre vagy bármi kifejezetten új dologra keresnek rá, a legújabb információkat láthatják.
A tartalom relevanciája
Ezután rendszereink elemzik a tartalmat, és felmérik, hogy tartalmaz-e olyan információt, amely releváns lehet a keresés szempontjából.
A relevancia legalapvetőbb jele, hogy a tartalomban is megtalálhatók a kereséshez használt kulcsszavak. Ha például ezek a kulcsszavak szerepelnek az adott oldalon (vagy a szöveg fejlécében vagy törzsében), akkor az oldal nagyobb valószínűséggel jelenthet releváns találatot.
A kulcsszavak figyelése mellett rendszereink azt is elemzik, hogy a tartalmak más módokon relevánsak-e a lekérdezéseknél. A relevancia felméréséhez összesített és anonimizált interakciós adatokat is felhasználunk. Ezeket az adatokat olyan jelekké alakítjuk, amelyekkel gépi tanuláson alapuló rendszereink jobban megbecsülhetik az oldalak relevanciáját. Például a „kutyák” kulcsszóval indított keresésre valószínűleg senki sem olyan találatot vár, amely csak több százszor megismétli a „kutyák” szót. Algoritmusaink tehát ellenőrzik, hogy az oldalakon a „kutyák” kulcsszón kívül más releváns tartalmak is szerepelnek-e, például kutyákat ábrázoló képek, videók, esetleg kutyafajtákat felsoroló listák.
Fontos megjegyeznünk, hogy habár rendszereink számos hasonló számszerűsíthető jel alapján értékelik a relevanciát, nem arra készültek, hogy szubjektív jellemzőket (például nézőpontokat vagy politikai beállítottságot) azonosítsanak az oldalakon.
A tartalom minősége
A releváns tartalmak azonosítását követően rendszereink célja a leghasznosabbak priorizálása. Ehhez felismerik azokat a jeleket, amelyekből megállapítható a tartalmak szakmaisága, hitelessége és megbízhatósága.
Ennek meghatározásához figyelembe vesszük többek között például azt, hogy más fontos webhelyek is hivatkoznak-e az adott tartalomra. Ez gyakran minősült jó jelnek abban a kérdésben, hogy megbízható-e az adott információ. A Kereső minőségértékelési folyamatából származó összesített visszajelzés segítségével tovább finomítjuk az információk minőségének észlelésére használt eljárásokat.
Egy webhelyet egy algoritmus elemez
Az interneten található tartalmak és a tágabb információs ökoszisztéma állandóan változik, ezért folyamatosan mérjük és értékeljük a rendszereink teljesítményét. Így egyensúlyba kerülhet az információk relevanciája és szakmaisága, amivel biztosíthatjuk a megjelenő találatok megbízhatóságát.
A weboldalak használhatósága
Rendszereink a tartalmak használhatóságát is figyelembe veszik. Amikor minden találat viszonylag ugyanolyan, jobban teljesíthetnek azok a tartalmak, amelyeket könnyebben használhatónak találnak a felhasználók.
Rendszereink figyelembe veszik többek között az oldalélmény szempontjait, például az adott tartalom mobilbarát jellegét, hogy könnyen megtekinthető legyen a mobileszközök felhasználói számára. Ehhez hasonlóan azt is figyelik, hogy gyorsan betölt-e a tartalom, ami szintén fontos a mobilos felhasználóknak.
Kontextus és beállítások
Az olyan információk, mint a felhasználó tartózkodási helye, keresési előzményei és keresési beállításai mind-mind a segítségünkre vannak abban, hogy valóban az adott pillanatban hasznos és releváns találatokat jelenítsünk meg.
A tartózkodási helyet és az országot arra használjuk, hogy az adott területre vonatkozó tartalmakat jelenítsünk meg a felhasználónak. Tegyük fel, hogy a felhasználó Chicagóban van, és a „futball” kifejezésre keres. Ebben az esetben a Google valószínűleg az amerikai futballhoz és a Chicago Bears csapathoz kapcsolódó találatokat mutatja előbb. Ha azonban Londonban keres rá a „football” kifejezésre, a Google labdarúgással és az angol Premier League labdarúgó bajnoksággal kapcsolatos találatokat jelenít meg. A Kereső beállításai szintén fontos mutatói annak, hogy milyen találatok számíthatnak hasznosnak: például a preferált nyelvi beállítás, illetve hogy engedélyezte-e a felhasználó a Biztonságos Keresést, amely kiszűri a felnőtteknek szóló tartalmakat.
A Kereső olyan funkciókat is tartalmaz, amelyek a felhasználó Google-fiókjában végzett tevékenységek alapján szabják személyre a találatokat. Ha például a „közeli események” kifejezésre keres, a Google olyan javaslatokat választhat, amelyek megfelelnek a felhasználó érdeklődési köreinek.
Rendszereinket úgy terveztük, hogy igazodjanak a felhasználók érdeklődési köreihez, de ne következtessenek ki olyan személyes jellemzőket, mint például az etnikai hovatartozás, a vallás és a politikai nézetek.
A myaccount.google.com oldalon megadhatja, hogy milyen keresési tevékenységek legyenek használhatók a Kereső működése során (például beállíthatja azt is, hogy mely adatok kerüljenek mentésre Google-fiókjában). A Kereső tevékenységalapú személyre szabását az Internetes és alkalmazástevékenységek funkció kikapcsolásával tilthatja le.
A beállításokban olyan tartalmi preferenciákat is találhat, mint a Biztonságos Keresés. Ezek segítségével meghatározhatja, hogy megjelenhetnek-e a találatok között megrázó tartalmak, amelyek megbotránkoztatók lehetnek egyes felhasználók számára.
Kapcsolódó tartalom: