Internet Windows Android

Ce motoare de căutare există. Care sunt motoarele de căutare

După cum era de așteptat, Google a ocupat primul loc în clasamentul mondial. Contează mai mult de 70% din interogările de căutare de la rezidenți din întreaga lume. Mai mult, o treime din traficul google.com provine de la cetățeni americani. În plus, Google este cel mai vizitat site web din lume. Durata medie zilnică de utilizare a motorului de căutare Google este de 9 minute.

Avantajul motorului de căutare Google este absența elementelor inutile pe pagină. Doar o bară de căutare și o siglă a companiei. Chip sunt imagini animate și jocuri de browser dedicate sărbătorilor populare și locale.

2. Bing

Bing - motor de căutare de la Microsoft, conducându-și istoria din 2009. Din acel moment, a devenit un atribut obligatoriu al smartphone-urilor care rulează pe Windows. Bing este, de asemenea, minimalist - pe lângă antetul care enumeră toate produsele Microsoft, pagina conține doar bara de căutare și numele sistemului. Bing este cel mai popular în SUA (31%), China (18%) și Germania (6%).

3. Yahoo!

Locul al treilea a fost atribuit unuia dintre cele mai vechi motoare de căutare - Yahu. Majoritatea utilizatorilor locuiesc și în Statele Unite (24%). Avem impresia că restul lumii evită în mod deliberat ajutorul roboților de căutare ... Motorul de căutare este, de asemenea, popular în India, Indonezia, Taiwan și Marea Britanie. Pe lângă bara de căutare, Yahoo! sunt oferite prognoza meteo pentru regiunea dvs., precum și tendințele mondiale sub forma unui flux de știri.

4. Baidu

Un motor de căutare chinez care a câștigat notorietate în Rusia. Datorită politicii agresive și a lipsei traducerii în rusă sau engleză, extensiile acestui motor de căutare sunt percepute ca viruși. Este foarte dificil să le eliminați complet și să scăpați de ferestrele pop-up cu hieroglife. Cu toate acestea, acest site este al patrulea în lume prin prezență. 92% din audiența sa este cetățean chinez.

5. AOL

AOL este un motor de căutare american al cărui nume înseamnă America Online. Popularitatea sa este mult mai mică decât cea a sistemele anterioare... Zoriile sale au fost în anii 90 și 00. Aproape 70% din audiența AOL este din Statele Unite.

6. Ask.com

Acest motor de căutare, datând din 1995, are destul de multe interfață neobișnuită... Ea percepe toate cererile ca întrebări și oferă opțiuni pentru răspunsuri în conformitate cu rezultatele căutării. Acest lucru este oarecum similar cu serviciul Answers.Mail. Cu toate acestea, rezultatele nu includ răspunsuri de la amatori, ci articole cu drepturi depline. În ultimul an, site-ul a pierdut aproximativ 50 de poziții în clasamentul mondial al celor mai populare resurse de Internet și ocupă în prezent doar locul 104.

7. Emoționează

Acest motor de căutare nu este remarcabil și arată ca multe alte site-uri. Oferă utilizatorilor o mulțime de servicii (cum ar fi Știri, Poștă, Vremea, Călătorii etc.) Interfața site-ului evocă, de asemenea, amintiri ale internetului anilor 90 și, probabil, s-a schimbat puțin de atunci.

8. DuckDuckGo

Dezvoltatorii avertizează imediat că acest motor de căutare nu vă urmărește acțiunile pe net. În zilele noastre, acesta este un argument puternic atunci când alegeți un motor de căutare. Site-ul este conceput într-o manieră modernă, folosește culori strălucitoare și imagini amuzante. Spre deosebire de alte motoare de căutare, „motorul de căutare rață” este tradus în rusă. În ultimul an, site-ul a câștigat înapoi aproximativ 400 de poziții și în martie 2017. se află pe linia 504 a clasamentului de popularitate Alexa.

9. WolframAlpha

O caracteristică distinctivă a acestei căutări este varietatea serviciilor auxiliare concepute pentru interogări legate de anumite cunoștințe. Adică, în rezultatele căutării nu veți vedea linkuri către postări în rețelele sociale sau articole în presa galbenă. Vi se vor oferi numere specifice și fapte dovedite sub forma unui singur document... Acest browser este ideal pentru școlari și studenți.

10. Yandex

Cel mai popular motor de căutare din Rusia și din țările CSI. În plus, aproximativ 3% din audiența site-ului este din Germania. Site-ul este remarcabil pentru un număr mare de servicii pentru toate ocaziile (muzică, radio, program transport public, imobiliare, traducător etc.) De asemenea, resursa oferă o selecție largă de design individual de site-uri web, precum și personalizarea widgeturilor „pentru tine”... Yandex ocupă locul 31 în lume în popularitate, după ce a pierdut 11 poziții în ultimul an.

Cel mai popular serviciu web din vremea noastră este motorul de căutare. Totul este de înțeles aici, deoarece zilele în care reprezentanții primilor utilizatori de internet puteau observa elemente noi în rețea au dispărut de mult.

Apare și se acumulează atât de multe informații încât a devenit foarte dificil pentru o persoană să o găsească exact pe cea de care ar avea nevoie. Imaginați-vă cum ar fi o căutare pe Internet dacă un utilizator obișnuit ar trebui să caute informații, nu înțelege unde. Nu înțeleg unde, pentru că căutare manuală nu veți găsi prea multe informații.

Motor de căutare ce este?

Este bine dacă utilizatorul cunoaște deja site-uri care pot avea informațiile necesare, dar ce ar trebui să facă altfel? Pentru a ușura viața unei persoane în căutarea informațiilor necesare pe internet, au fost inventate motoarele de căutare sau pur și simplu motoarele de căutare. Motorul de căutare este foarte performant funcție importantă, fără de care Internetul nu ar fi modul în care suntem obișnuiți să-l vedem - aceasta este căutarea informațiilor în rețea.

Sistem de căutare- Acesta este un site web special sau într-un alt mod un site care oferă utilizatorilor, la cererea lor, hyperlinkuri către pagini, site-uri care răspund la o anumită interogare de căutare.

Pentru a fi puțin mai precis, căutarea informațiilor pe Internet se realizează grație setului funcțional software și hardware și unei interfețe web pentru interacțiunea cu utilizatorii.

Pentru interacțiunea umană cu motorul de căutare, a fost creată o interfață web, adică un shell vizibil și ușor de înțeles. Această abordare a dezvoltatorilor de motoare de căutare facilitează găsirea multor oameni. De regulă, pe internet se efectuează căutări folosind motoare de căutare, dar există și sisteme de căutare pentru servere FTP, anumite tipuri de bunuri pe World Wide Web sau informații de știri sau alte instrucțiuni de căutare.

Căutarea poate fi efectuată nu numai prin conținutul text al site-urilor, ci și prin alte tipuri de informații pe care o persoană le poate căuta: imagini, videoclipuri, fișiere sonore etc.

Cum caută un motor de căutare?

Căutarea pe Internet în sine, la fel ca și navigarea pe site-uri web, este posibilă utilizând un browser de Internet - un browser. Numai după ce utilizatorul și-a setat cererea în bara de căutare, căutarea în sine este efectuată direct.

Orice motor de căutare conține parte software, pe care se bazează întregul motor de căutare, se numește motor de căutare - acesta este un pachet software care oferă posibilitatea de a căuta informații. După apelarea la un motor de căutare, formarea unei persoane interogare de căutareși introducând-o în bara de căutare, motorul de căutare generează o pagină cu o listă a rezultatelor căutării, cele mai relevante, în opinia motorului de căutare, sunt situate mai sus aici.

Relevanța căutării este căutarea materialelor care sunt cele mai relevante pentru solicitarea utilizatorului și localizarea hyperlink-urilor pe acestea pe SERP cu rezultate mai precise decât altele. Distribuția rezultatelor în sine se numește clasarea site-ului.

Deci, cum își pregătește un motor de căutare materialele pentru eliberare și cum caută motorul de căutare însuși informații? Colectarea informațiilor în rețea este facilitată de un robot unic pentru fiecare motor de căutare sau, într-un alt mod, un bot, care are, de asemenea, o serie de alte sinonime, cum ar fi un crawler sau un păianjen, iar activitatea sistemului de căutare în sine poate să fie împărțit în trei etape:

Prima etapă a activității unui motor de căutare poate fi atribuită scanării site-urilor din rețeaua globală și colectării copiilor paginilor web pe propriile servere. Aceasta formează o cantitate imensă de informații neprocesate și nepotrivite pentru rezultatele căutării.

A doua etapă a activității motorului de căutare se reduce la punerea în ordine a informațiilor primite anterior, la prima etapă, de pe site-uri. Se efectuează sortarea care, în cel mai mic timp, va favoriza căutarea de foarte înaltă calitate pe care utilizatorii o așteaptă efectiv de la motorul de căutare. Etapa se numește indexare, ceea ce înseamnă că paginile sunt deja pregătite pentru livrare, iar baza curentă va fi considerată un index.

Este a treia etapă care determină rezultatele cautarii, după ce ați acceptat o cerere din partea clientului dvs., bazându-vă pe cheia sau lângă cuvintele cheie specificate în cerere. Acest lucru contribuie la selectarea celor mai adecvate informații pentru cerere și la emiterea ulterioară a acesteia. Deoarece există o mulțime de informații, motorul de căutare efectuează o clasare în conformitate cu algoritmii săi.
Cel mai bun motor de căutare este considerat a fi cel care poate furniza materialul care răspunde cel mai corect la solicitarea utilizatorului. Dar chiar și aici pot exista rezultate care au fost influențate de persoanele interesate să-și promoveze site-ul, astfel de site-uri, deși nu întotdeauna, dar apar adesea în rezultatele căutării, dar nu pentru o lungă perioadă de timp.

Deși liderii mondiali au fost deja identificați în multe regiuni, motoarele de căutare continuă să își dezvolte căutarea de calitate. Cu cât căutarea poate fi mai bună, cu atât mai mulți oameni o vor folosi.

Cum se folosește motorul de căutare?

Ce este un motor de căutare și cum funcționează este deja clar, dar cum să îl utilizați corect? Majoritatea site-urilor au întotdeauna o bară de căutare, iar lângă aceasta se află un buton Căutare sau Căutare. O interogare este introdusă în bara de căutare, după care trebuie să apăsați butonul de căutare sau, așa cum se întâmplă mai des, apăsați tasta Enter de pe tastatură și în câteva secunde veți obține rezultatul interogării sub forma o listă.

Dar obținerea răspunsului corect la o interogare de căutare nu este întotdeauna posibilă prima dată. Pentru ca căutarea a ceea ce doriți să nu devină dureroasă, trebuie să compuneți corect o interogare de căutare și să urmați recomandările descrise mai jos.

Compunem corect interogarea de căutare

Iată câteva sfaturi pentru utilizarea motorului de căutare. Respectarea unor trucuri și reguli atunci când căutați informații într-un motor de căutare va face posibilă obținerea rezultatului dorit mult mai rapid. Urmați aceste instrucțiuni:

  1. Ortografia corectă a cuvintelor asigură suma maximă se potrivește cu obiectul informațional dorit (Deși motoarele de căutare moderne au învățat deja cum să corecteze erorile de ortografie, acest sfat nu trebuie neglijat).
  2. Utilizând sinonime în interogarea dvs., puteți acoperi o gamă mai largă de căutare.
  3. Uneori schimbarea unui cuvânt din textul interogării poate aduce mai multe rezultate, re-formează interogarea.
  4. Aduceți specificitate interogării, utilizați apariții exacte de fraze care ar trebui să definească esența principală a căutării.
  5. Experimentați cu cuvinte cheie. Utilizare Cuvinte cheieși expresiile pot ajuta la definirea punctului principal, iar motorul de căutare va oferi rezultate mai relevante.

Deci, un motor de căutare nu este altceva decât o oportunitate de a găsi informațiile de interes și, de obicei, de a le folosi complet gratuit, de a învăța ceva, de a înțelege ceva sau de a face concluzia corectă pentru dvs. Mulți nu își mai pot imagina viața fără căutare vocală, în care textul nu trebuie să fie tastat, trebuie doar să vă pronunțați solicitarea, iar dispozitivul de intrare aici este un microfon. Toate acestea mărturisesc dezvoltarea constantă a tehnologiilor de căutare pe Internet și necesitatea acestora.

Motoarele de căutare sunt considerate cele mai populare site-uri de pe Internet. Acest lucru nu este surprinzător, deoarece pentru a găsi ceva în rețea, trebuie mai întâi să utilizați serviciile de căutare.


Sunt destul de puțini și nici măcar utilizatori cu experiență Internet, cunoașteți cel puțin 2-3 motoare de căutare.

Care sunt motoarele de căutare? Cineva știe despre un motor de căutare, unii știu despre 10 servicii de căutare, dar de fapt sunt multe altele.

Desigur, popularitatea lor este diferită, precum și interfața și calitatea rezultatelor. Vă vom prezenta o listă cu diferite motoare de căutare pe care le puteți compara.

Motoare de căutare populare

Serviciile de căutare au fost dezvoltate pentru diferite categorii de persoane. Cele mai cunoscute acoperă țări sau chiar întreaga lume, în timp ce cele mai puțin cunoscute sunt concepute pentru regiuni sau interesele utilizatorilor.

Iată 10 motoare de căutare despre care ar trebui să știți:

  1. - toată lumea știe despre acest motor de căutare, este cel mai popular din Rusia și oferă utilizatorilor săi o gamă largă de funcționalități (de la plăți electronice la un panou pentru webmasteri).
  2. - liderul dintre toate site-urile din lume. Este folosit de oameni din toate țările și este considerat cel mai înalt motor de căutare de calitate. La fel ca Yandex, clienților li se oferă multe instrumente suplimentare.
  3. - sistem de căutare și informare, ținând cont de morfologia în limba rusă. Site-ul are mai multe versiuni separate, de exemplu, XRambler, prin care puteți căuta mai multe servicii simultan.
  4. - acest sistem este extrem de popular în străinătate. A fost mult timp tradus în rusă, dar nu a primit multă faimă în Runet. Utilizatorii pot căuta diferit (după imagini, videoclipuri etc.).
  5. - o companie bine-cunoscută din Runet, angajată în dezvoltarea în mai multe direcții simultan. Pe lângă propriul motor de căutare și cel mai popular serviciu de poștă, aceștia sunt proprietarii de proiecte precum Odnoklassniki și Vkontakte.
  6. - a fost creat ca resursă de stat în Rusia, dar nu a primit distribuție în masă. Prin intermediul acestuia, puteți efectua diverse formate de căutare, precum și puteți primi informații utile.
  7. - conceput pentru a căuta informații în segmentul chinez al internetului. Cine știe, poate asta îți va fi de folos. Puteți primi știri, căuta imagini, muzică, primi hărți și multe altele.
  8. - un proiect al binecunoscutei companii Microsoft. În ceea ce privește volumul de trafic, acest site ocupă locul al doilea în clasamentul mondial al motoarelor de căutare. Funcționează din 1998 și a fost modernizat de multe ori în acest timp.
  9. - numai străinii folosesc acest serviciu. Proiectul este american și, pe lângă motorul de căutare, compania are o serie de alte site-uri și servicii. Este demn de remarcat faptul că au cel mai mare director de linkuri către site-uri de pe internet.

Dacă nu puteți găsi informații într-unul dintre motoarele de căutare, atunci de ce să nu le căutați prin alt site? Acum aveți mai multe resurse de calitate și sunteți sigur că veți găsi ceea ce aveți nevoie.

Mai recent, erudiția a fost la un preț excelent. Dar astăzi, cunoașterea tuturor capitalelor lumii și a celor mai mici detalii istorice este absolut inutil. În loc să vă umpleți creierul cu fapte inutile, trebuie doar să știți ce motoare de căutare sunt pe Internet. Orice altceva va fi decis de cel mai inteligent algoritm software.

Scurtă descriere a motoarelor de căutare

Motorul de căutare este sistem software, care este conceput pentru a căuta informații în World Wide Web... Rezultatele interogărilor sunt prezentate de obicei sub forma unui SERP, format dintr-o duzină de blocuri scurte de text (fragmente) combinate cu conținut multimedia.

Astăzi, există aproximativ o duzină de instrumente internaționale de căutare a datelor. Toți operează pe aceleași principii:

  1. Responsabil pentru colectarea informațiilor tractor pe şenile- robot (mai ușor - program special), care „accesează cu crawlere” de la site la site și intră în index Tipuri variate date (conținutul paginii, scripturi de programare, metaetichete etc.);
  2. După adăugarea la index, informațiile devin disponibile pentru utilizatorul mediu prin interfața barei de căutare;
  3. Rezultatele de pe pagina cu rezultate sunt clasificate într-un mod special. Indicatorul cheie este relevanţă- respectarea cererii inițiale.

Cum se folosește motorul de căutare?

Dezvoltatorii acestor sisteme au făcut tot posibilul pentru ca toată lumea, chiar și un copil, să poată lucra cu ei. Și, trebuie să spun, au reușit:

  1. Pentru a atrage mintea unui motor de căutare, accesați site-ul său oficial. Proiecta pagini de început poate diferi, dar linia pentru introducerea textului va fi cu siguranță în locul cel mai proeminent;
  2. O modalitate și mai ușoară este de a seta cererea prin bara de adrese a browserului. Majoritatea browserelor moderne acceptă această caracteristică;
  3. Dacă tastarea textului într-o anumită situație este dificilă sau imposibilă, puteți utiliza funcția de intrare vocală (lansată apăsând pictograma cu un microfon);
  4. La o fracțiune de secundă după apel, sistemul va da rezultatele;
  5. Operatorii booleani pot fi folosiți pentru a accelera căutările. Deci, adăugarea unui semn minus în fața unui cuvânt îl va exclude din rezultatele căutării, un semn plus va indica motorului de căutare că acest cuvânt trebuie să fie neapărat în textul căutării, iar o frază între ghilimele începe o căutare a expresiei exacte. ;
  6. Dacă nu găsiți informațiile de care aveți nevoie, nu contează. Nimeni nu se deranjează să folosească un alt serviciu. Iată o prezentare generală a principalilor jucători de pe această piață.

Prezentare generală a serviciilor cheie

La începutul secolului, aproape fiecare stat avea propriul său motor de căutare național. Cu toate acestea, după câțiva ani, competiția a lăsat doar câțiva jucători globali:

  • Google este liderul incontestabil al pieței. Acesta reprezintă cea mai mare parte a traficului de căutare din lume. În țările dezvoltate, cota sa variază între 80 și 90%. În Rusia, succesul mașinii nu este atât de impresionant: doar 40% cota;
  • Yandex- principalul concurent pentru Google în Rusia, ocupă în prezent o poziție de lider, dar datorită schimbării algoritmului de căutare din 2017, a început treptat să-și piardă pozițiile;
  • - ocupă locul trei în runet (aproximativ 5%), caută de la un cunoscut Companie rusă, parte a Mail.Ru Group, care deține retele sociale Vkontakte, Odnoklassniki, motorul de căutare Nigma (îl vom descrie mai jos), sistem de plata Qiwi și multe altele.
  • Bing- serviciu de la Microsoft. Cele mai bune rezultate se obțin în principal pe limba engleză... Segmentul de limbă rusă este practic nedezvoltat. Totuși, acest lucru nu împiedică Bing să fie motorul de căutare # 2 din lume (7%);
  • Aceasta este urmată de o mică marjă de către o companie chineză „Baidu”, care deservește în principal piețele din Asia de Est (China și Japonia). Este puțin cunoscut în Occident și în Rusia;
  • Yahoo!- a stat la originea sferei moderne a tehnologiilor înalte, dar a pierdut în competiție. Astăzi folosește o soluție de la Microsoft;
  • Nigma- Motorul de căutare odinioară popular, fondat de programatorii ruși în 2005, aproape că și-a pierdut acum partea din trafic;
  • Duckduckgogo- se poziționează ca un serviciu care are grijă de datele personale ale utilizatorilor (nu există colectare și personalizare cache).

Yandex: „totul nostru” în runet

O conversație despre căutarea informațiilor pe internet ar fi incompletă fără a menționa un jucător cheie pe piața rusă - Yandex. Fondatorii săi Arkady Volozh și Ilya Segalovich au lansat un joint-venture cu mult înainte de nașterea brandului Google. De mai multe decenii, motorul de căutare a izbucnit în topul celui mai mare din lume (numărul 4 din 2014).

Motivul principal al acestui fenomen este cea mai bună calitate serviciu:

  • Yandex a fost primul care a lansat o căutare bazată pe morfologia rusă. Această inovație i-a permis în 2001 să-l depășească pe gigantul de atunci al industriei IT Rambler;
  • Din 2009, serviciul a început să ia în considerare regiunea de reședință a utilizatorului. Datorită acestui fapt, site-urile regionale au primit un impuls pentru dezvoltare;
  • În același an, a fost lansat algoritmul de învățare automată Matrixnet, care a crescut semnificativ viteza și calitatea serviciului;
  • În același timp, se dezvoltă un site web în limba engleză, pentru care Yandex a închiriat un birou în California;
  • În 2012, rezultatele interogării au început să ia în considerare preferințele personale ale unui anumit utilizator.

Popularitatea sistemului este în continuă creștere: din 2001 până în 2017, volumul de trafic a crescut de 280 de ori. Dar, după cum am scris mai devreme, după o schimbare cardinală a algoritmului în 2017, Yandex a început să piardă cota vizitatorilor săi în favoarea Google, vezi statisticile complete ale traficului Runet pe acest moment puteți urmări linkul.

Cum să eliminați informații despre dvs. din motorul de căutare?

Internetul nu este doar un avantaj pentru întreaga omenire, ci și o potențială sursă de amenințări. Unele dintre ele reprezintă o amenințare semnificativă pentru datele personale ale utilizatorilor obișnuiți. Chiar și cele mai jignitoare informații nu pot fi șterse după ce sunt online.

Acest lucru, cel puțin, a fost până de curând. Din ianuarie 2016, legea „Cu privire la dreptul la uitare” este în vigoare în Rusia. Acum fiecare persoană care nu este mulțumită de reputația sa în lume virtuala, îl poate curăța într-un mod complet legal. Este nevoie de:

  1. Trimiteți o cerere către organizația care furnizează servicii de căutare;
  2. Atașați toate dovezile posibile ale falsității și irelevanței datelor, care se propune a fi eliminate din emisiune;
  3. Majoritatea motoarelor de căutare îl fac mai ușor pentru utilizatori. Puteți trimite o cerere printr-un formular online special (pentru Yandex);
  4. Timp de zece zile, compania va verifica cererea pentru motive legale;
  5. În cazul unui rezultat pozitiv, informațiile trebuie eliminate din index;
  6. Dacă nu sunt stabilite motivele îndepărtării, organizația notifică solicitantul.

Gazda permanentă a programului „Oameni deștepți și deștepți” Yuri Vyazemsky, într-unul dintre interviurile sale, a menționat cum a descoperit un cuvânt neobișnuit în Bulgakov și a încercat să-i găsească sensul. Lucrările din bibliotecă au durat un an întreg (!). Astăzi este imposibil să ne imaginăm o astfel de situație: există multe motoare de căutare pe Internet. Un singur clic - și toată lumea se poate conecta la mintea lumii.

Revizuire video a motoarelor de căutare anonime

În acest videoclip, Anton Morozov vă va spune ce motoare de căutare există care păstrează confidențialitatea completă a utilizatorului:

Motoare de căutare(PS) au fost o parte indispensabilă a Internetului de ceva timp. Astăzi sunt mecanisme imense și complexe, care nu sunt doar un instrument pentru găsirea vreunui informatie necesara, dar și zone destul de interesante pentru afaceri.


Mulți utilizatori de căutare nu s-au gândit niciodată la principiile muncii lor, la modalitățile de procesare a cererilor utilizatorilor, la modul în care aceste sisteme sunt construite și funcționează. Acest material va ajuta oamenii care sunt angajați în optimizare și să înțeleagă structura și funcțiile de bază ale motoarelor de căutare.

Funcțiile și conceptul PS

Sistem de căutare Este un complex hardware și software care este conceput pentru a efectua funcția de căutare pe Internet și răspunde la o solicitare a utilizatorului, care este de obicei setată sub forma unei expresii text (sau, mai precis, o interogare de căutare), prin emiterea o listă de linkuri către surse de informații, realizată în funcție de relevanță. Cele mai comune și mai mari motoare de căutare: Google, Bing, Yahoo, Baidu. În Runet - Yandex, Mail.Ru, Rambler.

Să aruncăm o privire mai atentă la înțelesul însuși al interogării de căutare, luând Yandex.

Solicitarea trebuie formulată de utilizator în deplină conformitate cu subiectul căutării sale, cât mai simplu și concis posibil. De exemplu, dorim să găsim informații în acest motor de căutare: „cum să alegi o mașină pentru tine”. Pentru a face acest lucru, deschideți pagina principalași introduceți o interogare pentru a căuta „cum să alegeți o mașină”. Apoi funcțiile noastre se rezumă la urmărirea linkurilor furnizate către sursele de informații din rețea.




Dar chiar și acționând în acest fel, este posibil să nu obțineți informațiile de care avem nevoie. Dacă am primit un rezultat negativ similar, trebuie doar să ne reformăm solicitarea sau nu există o bază de căutare în baza de căutare. Informatii utile pe acest fel cerere (acest lucru este foarte posibil cu parametrii de interogare „îngustați”, cum ar fi, de exemplu, „cum să alegeți o mașină în Anadyr”).

Sarcina cea mai de bază a fiecărui motor de căutare este de a oferi oamenilor exact tipul de informații de care au nevoie. Și învățarea utilizatorilor să creeze tipul „corect” de interogări pentru motoarele de căutare, adică fraze care să corespundă principiilor lor de lucru, este practic imposibil.

De aceea, dezvoltatorii de motoare de căutare realizează astfel de principii și algoritmi pentru munca lor, ceea ce le-ar permite utilizatorilor să găsească informațiile de care sunt interesați. Aceasta înseamnă că sistemul trebuie să „gândească” în același mod în care gândește o persoană atunci când caută informațiile necesare pe internet.

Când introduce întrebarea într-un motor de căutare, vrea să găsească ceea ce are nevoie, cât mai ușor și rapid posibil. După ce a primit rezultatul, utilizatorul își face propria evaluare a funcționării sistemului, ghidat de mai multe criterii. A reușit să găsească informațiile de care avea nevoie? Dacă nu, de câte ori a trebuit să reformateze textul interogării pentru a-l găsi? Cât de relevante au fost informațiile pe care le-a primit? Cât de repede i-a procesat solicitarea motorul de căutare? Cât de convenabil au fost furnizate rezultatele căutării? Rezultatul dorit a fost primul sau a fost pe locul 30? Câte junk (informații inutile) au fost găsite împreună cu informații utile? Vor exista informații relevante pentru el, atunci când utilizați PS, într-o săptămână sau într-o lună?




Pentru a obține răspunsurile corecte la astfel de întrebări, dezvoltatorii de căutare îmbunătățesc constant principiile clasamentului și algoritmii acestuia, adăugând noi caracteristici și funcții și, prin orice mijloace, încearcă să facă lucru mai rapid sisteme.

Principalele caracteristici ale motoarelor de căutare

Să desemnăm principalele caracteristici ale căutării:

Completitudine.

Completitudinea este una dintre cele mai importante caracteristici ale unei căutări, este raportul dintre numerele găsite la cerere documente informative la lor totalul pe internet legat de cerere dată... De exemplu, există 100 de pagini pe Internet care au expresia „cum să alegi o mașină”, iar pentru aceeași interogare au fost selectate doar 60 din total, atunci în acest caz completitudinea căutării va fi de 0,6. Este clar că, cu cât este mai completă căutarea în sine, cu atât este mai probabil ca utilizatorul să găsească exact documentul de care are nevoie, desigur, dacă există.

Precizie.

O altă funcție principală a unui motor de căutare este acuratețea. Determină gradul de corespondență la cererea utilizatorului a paginilor găsite pe Web. De exemplu, dacă există sute de documente pentru expresia cheie „cum să alegi o mașină”, jumătate dintre ele conțin această expresie, iar restul pur și simplu au astfel de cuvinte (cum să alegi corect un radio auto și să-l instalezi într-o mașină ” ), atunci acuratețea căutării este egală cu 50/100 = 0,5.

Cu cât căutarea este mai precisă, cu atât utilizatorul va găsi mai repede informațiile de care are nevoie, cu atât mai puține „gunoaie” variate vor fi găsite printre rezultate, cu atât mai puține documente găsite nu vor corespunde sensului interogării.

Relevanţă.

Aceasta este o componentă semnificativă a căutării, care se caracterizează prin timpul care trece de la momentul publicării informațiilor pe internet până la introducerea lor în baza indexului motorului de căutare.

De exemplu, a doua zi după informațiile de ieșire iPad nou, mulți utilizatori au apelat la căutare cu tipurile de interogări corespunzătoare. În majoritatea cazurilor, informațiile despre aceste știri sunt deja disponibile în căutare, deși a trecut foarte puțin timp de la apariția sa. Acest lucru se datorează faptului că motoarele de căutare mari au o „bază rapidă”, care este actualizată de mai multe ori pe zi.

Viteza de căutare.

O funcție precum viteza de căutare este strâns legată de așa-numita „rezistență la încărcare”. În fiecare secundă, un număr imens de oameni apelează la căutare, o astfel de sarcină necesită o reducere semnificativă a timpului de procesare a unei cereri. Aici interesele atât ale motorului de căutare, cât și ale utilizatorului coincid complet: vizitatorul dorește să obțină rezultate cât mai repede posibil, iar motorul de căutare trebuie să-și proceseze solicitarea cât mai repede posibil pentru a nu încetini procesarea cererilor ulterioare.

Vizibilitate.

O prezentare clară a rezultatelor este un element esențial al confortului căutării. Pentru multe interogări, motorul de căutare găsește mii și, în unele cazuri, milioane de documente diferite. Datorită compoziției neclare a frazelor cheie pentru căutare sau inexactității sale, chiar și primele rezultate ale unei interogări nu au întotdeauna doar informațiile necesare.

Aceasta înseamnă că o persoană trebuie adesea să-și facă propria căutare printre rezultatele furnizate. Diverse componente ale paginilor cu rezultate ale motorului de căutare ajută la navigarea în rezultatele căutării.

Istoria dezvoltării motoarelor de căutare

Când Internetul a început să se dezvolte pentru prima dată, numărul utilizatorilor săi obișnuiți era mic, iar cantitatea de informații de accesat era relativ mică. Practic, doar specialiștii din domeniile de cercetare aveau acces la această rețea. În acel moment, sarcina de a găsi informații nu era la fel de urgentă ca acum.

Una dintre primele metode de organizare a accesului larg la resursele informaționale a fost crearea de cataloage de site-uri, iar linkurile către acestea au început să fie grupate pe subiecte. Acest prim proiect a fost resursa Yahoo.com, care a fost deschisă în primăvara anului 1994. Ulterior, când numărul de site-uri din directorul Yahoo a crescut semnificativ, a fost adăugată o opțiune pentru a căuta informațiile necesare în director. Nu era încă pe deplin un motor de căutare, deoarece aria unei astfel de căutări era limitată doar la site-urile incluse în acest director și nu la absolut toate resursele de pe Internet. Anuarele de link-uri au fost utilizate pe scară largă mai devreme, dar acum și-au pierdut aproape complet popularitatea.

Într-adevăr, chiar și cataloagele imense de astăzi au informații despre o mică parte a site-urilor de pe Internet. Cel mai faimos și catalog mareîn lume are informații despre cinci milioane de site-uri, când baza de date Google conține informații pe mai mult de 25 de miliarde de pagini.




Primul motor de căutare real a fost WebCrawler, care a apărut în 1994.

AltaVista și Lycos au apărut în anul următor. Mai mult, primul a fost liderul în căutarea informațiilor pentru o perioadă foarte lungă de timp.




În 1997, Sergey Brin, împreună cu Larry Page, au creat o mașină Motor de căutare Google ca proiect de cercetare la Universitatea Stanford. Astăzi este Google, cel mai solicitat și popular motor de căutare din lume.




În septembrie 1997, a fost anunțat (oficial) Yandex PS, care în în prezent este cel mai popular motor de căutare din Runet.




Conform datelor privind septembrie 2015, cotele motoarelor de căutare din lume sunt distribuite după cum urmează:
  • Google - 69,24%;
  • Bing - 12,26%;
  • Yahoo! - 9,19%;
  • Baidu - 6,48%;
  • AOL - 1,11%;
  • Întrebați - 0,23%;
  • Excitat - 0,00%


Conform datelor privind Decembrie 2016 ONE, ponderea motoarelor de căutare în Runet:

  • Yandex - 48,40%
  • Google - 45,10%
  • Search.Mail.ru - 5,70%
  • Rambler - 0,40%
  • Bing - 0,30%
  • Yahoo - 0,10%

Cum funcționează motorul de căutare

În Rusia, principalul motor de căutare este Yandex, apoi Google, apoi [email protected]. Toate motoarele de căutare mari au structura lor, care este foarte diferită de altele. Totuși, putem identifica elementele de bază comune tuturor motoarelor de căutare.

Modul de indexare.

Această componentă constă din trei programe robot:

Păianjen(în engleză spider) - un program conceput pentru a descărca pagini web. Păianjenul descarcă o anumită pagină, extragând simultan toate linkurile din ea. Descărcabil cod html din aproape fiecare pagină. Pentru a face acest lucru, roboții folosesc protocoale HTTP.




„Păianjenul” funcționează după cum urmează. Robotul trimite o cerere către server „get / path / document” și alte comenzi Cerere HTTP... Ca răspuns, programul robot primește un flux de text care conține informații de un tip de serviciu și, desigur, documentul în sine.
  • URL-ul paginii descărcate;
  • data la care pagina a fost descărcată;
  • antetul de răspuns al serverului HTTP;
  • html-code, „corpul” paginii.
Tractor pe şenile(Păianjenul „călător”). Acest program merge automat la toate linkurile care se găsesc pe pagină și le evidențiază. Sarcina sa este de a determina unde ar trebui să meargă păianjenul în viitor, pe baza acestor legături sau pe baza unei liste date de adrese.

Indexator(un robot indexer) este un program care analizează paginile descărcate de păianjeni.



Indexatorul analizează complet pagina în elemente constitutiveși le analizează folosind tipurile sale morfologice și lexicale de algoritmi.

Analiza se efectuează pe diferite părți ale paginii, cum ar fi titluri, text, link-uri, stil și caracteristici structurale, etichete html si etc.

Astfel, modulul de indexare face posibilă urmărirea legăturilor unui anumit număr de resurse, descărcarea paginilor, extragerea masei de legături către pagini noi din documentele primite și efectuarea analizei detaliate a acestora.

Bază de date

Bază de date(sau indexul motorului de căutare) este un complex de stocare a datelor, o serie de informații în care parametrii fiecărui document procesat de modulul de indexare și descărcat sunt stocate într-un anumit mod.

Căutare server

Acesta este cel mai important element al întregului sistem, deoarece viteza și, desigur, calitatea căutării depind în mod direct de algoritmii care stau la baza funcționalității sale.

Motorul de căutare funcționează după cum urmează:

  • Solicitarea care vine de la utilizator este supusă analizei morfologice. Mediul informațional al oricărui document disponibil în baza de date este generat (va fi afișat în continuare ca un fragment, adică un câmp de informații al textului corespunzător acestei cereri).
  • Datele primite sunt transmise ca parametri de intrare către un modul de clasificare specializat. Acestea sunt procesate pentru toate documentele și, ca rezultat, pentru fiecare astfel de document, se calculează propria evaluare, care caracterizează relevanța unui astfel de document la cererea utilizatorului și a altor componente.
  • În funcție de condițiile specificate de utilizator, această evaluare poate fi bine ajustată de altele.
  • Apoi este generat fragmentul în sine, adică pentru orice document găsit, un titlu, o adnotare care îndeplinește cel mai bine cererea și un link către acest document sunt extrase din tabelul corespunzător, în timp ce formele și cuvintele găsite sunt evidențiate.
  • Rezultatele căutării rezultate sunt transmise persoanei care a efectuat-o sub forma unei pagini către care sunt date rezultatele căutării (SERP).
Toate aceste elemente sunt strâns interconectate și funcționează, interacționând, formând un mecanism distinct, dar destul de complicat pentru funcționarea PS, care necesită cheltuieli uriașe de resurse.