Internet Windows Android
Kengaytirish

Qidiruv tizimlarining rivojlanish tarixi. Qidiruv tizimlarining rivojlanish tarixi Amerika qidiruv tizimidagi tarix

Runet-dagi birinchi qidiruv tizimi nima edi? Yandex, Aport yoki Rambler?

Birinchi Runet qidiruv tizimlari (Rambler asoschilaridan birining so'zlariga ko'ra, ulardan 2 yoki 3 tasi bor edi) juda tez unutilib ketdi. Ular orasida AltaVista tizimining morfologik kengaytmalari ham bor edi, ular bizga o'z nomlarini qoldirmadi. Shuning uchun biz qolganlardan tanlashimiz kerak:

Rambler

"Rambler" ni yaratish 1996 yilda, Internetning rus segmentida bir necha o'nlab saytlar mavjud bo'lgan paytda boshlangan. Rivojlanish o'sha yilning kuzida tugadi. rambler.ru domeni 26-sentyabrda ro'yxatga olingan va 1996 yil 8 oktyabr, ijodkorlardan birining tug'ilgan kunida Rambler foydalanuvchilar uchun ochiq edi.

Rambler - Runetdagi birinchi qidiruv tizimi hozirda mavjud bo'lganlardan.

Aport qidiruv tizimi 1996 yil fevral oyida ishlab chiqilgan, ammo o'sha paytda u faqat russia.agama.com saytida qidirgan. Asta-sekin, saytlar soni o'sdi va rasmiy ochilish bilan 1997 yil 11 noyabr yillar davomida "Aport" allaqachon 10 000 saytni qidirayotgan edi. Shunday qilib, "Aport" Runetdagi birinchi qidiruv tizimlaridan biri edi, ammo qidiruv doirasi cheklanganligi sababli uni eng qadimgi deb tan olish mumkin emas.

Yandex

Yandex-ni ishlab chiqqan CompTek kompaniyasi 1989 yilda tashkil etilgan. 1993 yilda CompTek qattiq disklarni qidirish dasturi bo'lgan Yandex-ni ishlab chiqdi. 1996 yilda dasturga Internetda qidirish imkoniyati qo'shildi. 1997 yilda birinchi qidiruv roboti yozilgan, Runet indekslangan va 1997 yil 23 sentyabr yili Yandex-ning rasmiy taqdimoti bo'lib o'tdi.

CompTek tomonidan Yandex eng qadimgi emas, lekin ularning qidiruv texnologiyalari va tilshunoslik va morfologiyadagi tadqiqotlari Rossiyadagi eng qadimgi hisoblanadi.

Internetning dastlabki kunlarida foydalanuvchilar imtiyozli ozchilik edi va mavjud ma'lumotlar miqdori nisbatan kichik edi. O'sha paytda unga asosan turli yirik o'quv yurtlari va laboratoriyalar xodimlari kirish imkoniga ega bo'lib, olingan ma'lumotlardan ilmiy maqsadlarda foydalanilgan. O'sha paytda Internetdan foydalanish hozirgidek dolzarb emas edi.

1990 yilda Britaniyalik olim Tim Berners-Li (u ham URI, URL, HTTP, World Wide Web ixtirochisi) veb-saytni yaratdi. info.cern.ch, bu dunyodagi birinchi Internet saytlari katalogi. Shu paytdan boshlab Internet nafaqat ilmiy jamoatchilik orasida, balki shaxsiy kompyuterlarning oddiy egalari orasida ham mashhur bo'la boshladi.

Shunday qilib, Internetdagi axborot resurslariga kirishni osonlashtirishning birinchi usuli saytlar kataloglarini shakllantirish edi. Ulardagi manbalarga havolalar mavzular bo'yicha guruhlangan.

Bunday turdagi birinchi loyiha Yahoo, ochiq deb hisoblanadi 1994 yil aprelda. Undagi saytlar sonining tez o'sishi tufayli tez orada talab bo'yicha kerakli ma'lumotlarni qidirish imkoniyati paydo bo'ldi. Albatta, bu hali to'liq qidiruv tizimi emas edi. Qidiruv faqat katalogdagi ma'lumotlar bilan cheklangan.

Internet rivojlanishining dastlabki bosqichlarida havolalar kataloglari juda faol ishlatilgan, ammo asta-sekin mashhurligini yo'qotgan. Sababi oddiy: zamonaviy ma'lumotnomalarda ko'plab resurslar mavjud bo'lsa ham, ular Internetda mavjud bo'lgan ma'lumotlarning faqat kichik qismini ko'rsatadi. Masalan, eng katta tarmoq katalogi - DMOZ(Ochiq katalog loyihasi). Unda sakkiz milliarddan ortiq hujjatlarni o'z ichiga olgan Google qidiruv bazasi bilan taqqoslanmaydigan besh milliondan sal ko'proq manbalar haqida ma'lumot mavjud.

Eng katta rus tilidagi katalog Yandex katalogidir. Unda bir yuz to'rt mingdan sal ko'proq resurslar haqida ma'lumotlar mavjud.

Qidiruv tizimini ishlab chiqish xronologiyasi

1945 yil- Amerikalik muhandis Vannevar Bush keyinchalik gipermatn ixtirosiga olib kelgan g'oyaning eslatmalarini e'lon qildi va shu tarzda saqlangan ma'lumotlardan ma'lumotlarni tezda ajratib olish tizimini ishlab chiqish zarurligi (hozirgi qidiruv tizimlarining ekvivalenti) haqida bahslashdi. U taqdim etgan xotira kengaytiruvchi qurilma kontseptsiyasida asl g'oyalar mavjud bo'lib, ular oxir-oqibat Internetda o'z ifodasini topgan.

1960-yillar Gerard Salton va uning Kornel universitetidagi guruhi SMART ma'lumot qidirish tizimini ishlab chiqdi. SMART - bu Saltonning Magic Automatic Retriever of Text-ning qisqartmasi. Jerar Salton zamonaviy qidiruv texnologiyasining otasi hisoblanadi.

1987-1989 - ishlab chiqilgan Archi— FTP arxivlarini indekslash uchun qidiruv tizimi. Archie skript bo'lib, ftp serverlaridagi ro'yxatlarga qo'shishni avtomatlashtiradi, keyinchalik ular mahalliy fayllarga o'tkaziladi va shundan keyingina mahalliy fayllarda kerakli ma'lumotlarni tezkor qidirish amalga oshiriladi. Qidiruv standart Unix grep buyrug'i asosida amalga oshirildi va foydalanuvchining ma'lumotlarga kirishi telnet orqali amalga oshirildi.

Keyingi versiyada ma'lumotlar alohida ma'lumotlar bazalariga bo'lingan, ulardan biri faqat matnli fayl nomlarini o'z ichiga olgan; ikkinchisi - mingta xostlarning ierarxik kataloglariga havolalar bilan yozuvlar; va birinchi ikkitasini bog'laydigan yana biri. Archie-ning ushbu versiyasi avvalgisiga qaraganda samaraliroq edi, chunki u faqat fayl nomlarini qidirib, oldingi takrorlashlarning ko'pini yo'q qildi.

Qidiruv tizimi tobora ommalashib bordi va ishlab chiquvchilar uning ishini qanday tezlashtirish haqida o'ylashdi. Yuqorida aytib o'tilgan ma'lumotlar bazasi siqilgan daraxt nazariyasiga asoslangan boshqasi bilan almashtirildi. Yangi versiya asosan fayl nomlari roʻyxati oʻrniga toʻliq matnli maʼlumotlar bazasini yaratdi va avvalgidan ancha tez edi. Bundan tashqari, kichik o'zgarishlar Archie tizimiga veb-sahifalarni indekslash imkonini berdi. Afsuski, turli sabablarga ko'ra tez orada Archi ustida ishlash to'xtatildi.

1993 yilda Butunjahon Internet uchun dunyodagi birinchi qidiruv tizimini yaratdi Wandex. U Massachusets texnologiya instituti xodimi Metyu Grey tomonidan ishlab chiqilgan World Wide Web Wanderer boti asosida yaratilgan.

1993 yil- Martin Koster yaratadi Aliweb World Wide Webdagi birinchi qidiruv tizimlaridan biri. Sayt egalari qidiruvda paydo bo'lishi uchun ularni Aliweb indeksiga o'zlari qo'shishlari kerak edi. Buni juda kam veb-ustalar qilganligi sababli, Aliweb mashhur bo'lmadi.

1994 yil 20 aprel- Vashington universitetidan Brayan Pinkerton ozod qilindi veb-brauzer- sahifalarni to'liq indekslagan birinchi bot. Qidiruv mexanizmi va uning o'tmishdoshlari o'rtasidagi asosiy farq foydalanuvchilarning istalgan veb-sahifada istalgan kalit so'zni qidirish qobiliyatidir. Bugungi kunda ushbu texnologiya har qanday qidiruv tizimining qidiruv standartidir. WebCrawler qidiruv tizimi foydalanuvchilarning keng doirasiga ma'lum bo'lgan birinchi tizim edi. Afsuski, o'tkazish qobiliyati yuqori emas edi va tizim ko'pincha kunduzi ishlamaydi.

1994 yil 20 iyul- ochildi Lycos- Karnegi Melon universitetida yaratilgan qidiruv texnologiyasidagi jiddiy rivojlanish. Maykl Maldin ushbu qidiruv tizimiga mas'ul bo'lgan va hali ham Lycos Inc kompaniyasining etakchi shaxsidir. Lycos 54 000 hujjat katalogi bilan ochildi. Va bunga qo'shimcha ravishda, u taqdim etgan natijalar tartiblangan, shuningdek, prefikslar va taxminiy mosliklarni hisobga olgan. Ammo Lycos-ning asosiy farqi uning doimiy o'sib borayotgan katalogida edi: 1996 yil noyabriga kelib, 60 million hujjat indekslangan edi, bu o'sha davrdagi boshqa qidiruv tizimlaridan ko'proq.

1994 yil yanvar- Asos solingan ma'lumot qidirish. Bu haqiqatan ham innovatsion emas edi, lekin bir qator foydali qo'shimchalarga ega edi. Bunday mashhur qo'shimchalardan biri sizning sahifangizni real vaqtda qo'shish qobiliyati edi.

1995 yil- ishga tushirildi AltaVista. AltaVista qidiruv tizimi paydo bo'lgach, tezda foydalanuvchilar tomonidan tan olindi va o'z turlari orasida etakchiga aylandi. O'sha paytda tizim deyarli cheksiz tarmoqli kengligiga ega edi, bu tabiiy tilda so'rovlarni shakllantirish, shuningdek, murakkab so'rovlarni shakllantirish mumkin bo'lgan birinchi qidiruv tizimi edi. Foydalanuvchilarga 24 soat ichida oʻz URL manzillarini qoʻshish yoki oʻchirishga ruxsat berildi. AltaVista shuningdek, qidirish uchun juda ko'p maslahatlar va fokuslarni taklif qildi. AltaVista tizimining asosiy afzalligi ko'plab tillarni, jumladan xitoy, yapon va koreys tillarini qo'llab-quvvatlashdir. Darhaqiqat, 1997 yilda Internetda biron bir qidiruv tizimi bir nechta tillar bilan, ayniqsa noyob tillar bilan ishlamagan.

1996 yil- AltaVista qidiruv tizimi rus tili uchun morfologik kengaytmani ishga tushirdi. Xuddi shu yili birinchi mahalliy qidiruv tizimlari Rambler.ru va Aport.ru ishga tushirildi. Birinchi mahalliy qidiruv tizimlarining paydo bo'lishi Runet rivojlanishining yangi bosqichini belgilab berdi, bu rus tilida so'zlashuvchi foydalanuvchilarga o'z ona tillarida so'rov yuborish, shuningdek, Internetda sodir bo'layotgan o'zgarishlarga tezda javob berish imkonini berdi.

1996 yil 20 may- Inktomi korporatsiyasi o'zining qidiruv tizimi bilan birga paydo bo'ldi hotbot. Uning yaratuvchilari Kaliforniya universitetining ikkita jamoasi edi. Sayt paydo bo'lgach, u tezda mashhur bo'ldi. 2001-yil oktabr oyida Denni Sallivan "Inktomi spam-ma'lumotlar bazasi jamoatchilikka ochildi" sarlavhali maqolani yozdi, unda Inktomi qanday qilib tasodifan o'sha paytda 1 millionga yaqin URL manziliga ega bo'lgan spam-saytlar ma'lumotlar bazasini jamoatchilikka ochiq qilib qo'yganini tasvirlab berdi.

1997 yil- G'arb mamlakatlarida S.Brin va Stenford universitetidan L.Peyj asos solganida, qidiruv tizimlarining rivojlanishida burilish yuz berdi. Google(BackRub loyihasining asl nomi). Ular o'zlarining qidiruv tizimini ishlab chiqdilar, bu foydalanuvchilarga morfologiya, noto'g'ri yozilgan so'zlarni hisobga olgan holda yuqori sifatli qidiruvlarni amalga oshirish imkoniyatini berdi, shuningdek, qidiruv natijalarida dolzarblikni oshirdi.

1997 yil 23 sentyabr- e'lon qildi Yandex, bu tezda rus tilida so'zlashuvchi Internet foydalanuvchilari orasida eng mashhur qidiruv tizimiga aylandi. Yandex qidiruv tizimining ishga tushirilishi bilan mahalliy qidiruv tizimlari bir-biri bilan raqobatlasha boshladi, qidiruv tizimini takomillashtirish va saytlarni indekslash, natijalarni chiqarish, shuningdek, yangi xizmatlar va xizmatlarni taklif qilish.

Shunday qilib, qidiruv tizimlarining rivojlanishi va ularning shakllanishi yuqorida sanab o'tilgan bosqichlar bilan tavsiflanishi mumkin.

Bugungi kunga qadar jahon bozorida uchta yetakchi – Google, Yahoo va Bing o‘rnini egalladi. Ularning o'z ma'lumotlar bazalari va o'zlarining qidiruv algoritmlari mavjud. Ko'pgina boshqa qidiruv tizimlari ushbu uchta asosiy qidiruv tizimining natijalaridan foydalanadi. Misol uchun, AOL Google ma'lumotlar bazasidan, AltaVista, Lycos va AllTheWeb esa Yahoo ma'lumotlar bazasidan foydalanadi.Barcha boshqa qidiruv tizimlari, turli kombinatsiyalarda, ro'yxatga olingan motorlarning natijalarini (natijalarini) ishlatadi.

Agar biz MDH mamlakatlarida mashhur bo'lgan qidiruv tizimlarining shunga o'xshash tahlilini o'tkazadigan bo'lsak, mail.ru Google qidiruvini, o'zining yangi ishlanmalarini yuklagan Rambler esa o'z navbatida Yandex ni translyatsiya qilishini ko'ramiz. Shuning uchun, butun Runet bozorini ushbu ikki gigant o'rtasida bo'lish mumkin.

Shuning uchun MDH mamlakatlarida veb-sayt reklamasi, qoida tariqasida, faqat ushbu ikkita PSda amalga oshiriladi.

Internet hamjamiyatining rivojlanishining dastlabki yillarida faol Internet foydalanuvchilari ozchilikni tashkil etdi va Internet resurslaridagi ma'lumotlarning miqdori nisbatan kichik edi. Jahon axborot tarmog'iga asosan ilmiy laboratoriyalar va yirik o'quv yurtlari xodimlarigina kirish imkoniga ega edi. Umuman olganda, tarmoq resursidan foydalanish bugungi kundagidek dolzarb emas edi.

Qidiruv tizimlari tarixi

1990 yilda info.centr.ch veb-saytining paydo bo'lishi Internetning ommaga tarqalishi yo'lidagi katta qadam bo'ldi. Ushbu sayt Internet saytlarining birinchi ommaviy katalogi edi. Yaratuvchisi britaniyalik olim Tim Berners-Li bo‘lib, u ham URI, HTTP, World Wide Web va URL yaratuvchisi hisoblanadi. O'sha paytdan boshlab Internet-saytlar nafaqat foydalanuvchilarning ixtisoslashgan doiralarida, balki uy kompyuterlarining oddiy egalari orasida ham dolzarb bo'lib qoldi. Ushbu ma'lumotnomada qulaylik uchun ma'lumotlar resurslari o'xshash mavzular bo'yicha guruhlar asosida joylashtirilgan, bu ma'lumot qidirishni sezilarli darajada osonlashtiradi.

Ammo taraqqiyot shu bilan to'xtab qolmadi va 1994 yilda Lukos nomi bilan mashhur Karnegi universiteti tomonidan ishlab chiqilgan qidiruv texnologiyasi tug'ildi. Maykl Maldin tomonidan yaratilgan ushbu katalog 50 000 dan ortiq hujjatlar resursidan boshlangan. Lukosda so'rovlar so'rovning taxminiy mosligi deb hisoblangan va qidiruv natijasi kirish va chiqish ma'lumotlari o'rtasidagi mosligiga qarab tartiblangan. Shuningdek, resurs doimiy ravishda yangi Internet sahifalari bilan to'ldirilib borildi. Noyabrga kelib, Lukos 55 million sahifa va hujjatlarga ega edi, bu kunning har qanday hujjatlar katalogidan ancha ko'p.

1994 yil oxirida Infosek resursi paydo bo'ldi. Boshqa resurslarga nisbatan bir qator afzalliklarga ega edi. Masalan, foydalanuvchi tomonidan real vaqtda katalog ma'lumotlar bazasiga saytlarni qo'shish.

1995 yilda yangi qidiruv tizimi monster AltaVista edi. U tezda Internet foydalanuvchilari orasida mashhurlikka erishdi va o'z sohasida etakchi o'rinni egalladi. Uning asosiy xususiyati so'rovlarni tabiiy, so'zlashuv tilida shakllantirish qobiliyati edi, shuningdek, foydalanuvchilarga o'z URL manzillarini qo'shishga ruxsat berildi. Shunga qaramay, AltaVista-ning asosiy afzalligi koreys, yapon va xitoy, shuningdek rus tillari kabi bir nechta til paketlarini qo'llab-quvvatlash edi.

Qidiruv texnologiyasidagi ulkan qadam Internetda yangi qidiruv tizimining paydo bo'lishi bo'ldi, uning nomi hozirda har bir foydalanuvchi, ya'ni Google tomonidan eshitiladi. 1997 yilda Stenford universitetidan L. Peyj va S. Brin o'z avlodlarini qidirish algoritmlariga yangi xususiyatlarni kiritdilar. Qidiruvda tizim tomonidan chiqarilgan qidiruv natijalarining dolzarbligi tizimlaridan foydalanilgan va so'rovda morfologiya va mumkin bo'lgan imlo xatolari hisobga olingan.

Bugungi kunda qidiruv tizimlari bozorida uchta asosiy yetakchi bor: Bing, Google va Yahoo. Ularning ixtiyorida qidirish algoritmlari va o'z ishlab chiqarishlarining ma'lumotlar bazalari mavjud. Ko'pgina qidiruv tizimlari, ularning ko'plari, qidiruv tizimlari orasida ushbu uchta titanning ishlanmalaridan foydalanadilar.

Qidiruv mexanizmlari tufayli oddiy odamga axborot sohasining keng qamrovini ochish osonroq bo'ldi. Ularning rivojlanishisiz odamlar o'rtasida ma'lumot almashish usullarini takomillashtirish mumkin emas.

Qidiruv tizimining arxitekturasi odatda quyidagilarni o'z ichiga oladi:

Entsiklopedik YouTube

    1 / 5

    ✪ 3-dars: Qidiruv tizimi qanday ishlaydi. SEO ga kirish

    ✪ Ichkaridan qidiruv tizimi

    ✪ Shodan - Qora Google

    ✪ Cheburashka qidiruv tizimi Rossiyada Google va Yandex o'rnini egallaydi

    ✪ 1-dars - Qidiruv tizimi qanday ishlaydi

    Subtitrlar

Tarix

Xronologiya
Yil Tizim Tadbir
1993 W3Catalog?! ishga tushirish
Aliweb ishga tushirish
JumpStation ishga tushirish
1994 veb-brauzer ishga tushirish
ma'lumot qidirish ishga tushirish
Lycos ishga tushirish
1995 AltaVista ishga tushirish
Daum Baza
ochiq matn veb indeksi ishga tushirish
Magellan ishga tushirish
Hayajonlantirish ishga tushirish
SAPO ishga tushirish
Yahoo! ishga tushirish
1996 Dogpile ishga tushirish
Inktomi Baza
Rambler Baza
hotbot Baza
Jeevsdan so'rang Baza
1997 Shimoliy yorug'lik ishga tushirish
Yandex ishga tushirish
1998 Google ishga tushirish
1999 AlltheWeb ishga tushirish
GenieKnows Baza
Naver ishga tushirish
Teoma Baza
Vivisimo Baza
2000 Baidu Baza
Exalead Baza
2003 info.com ishga tushirish
2004 Yahoo! Qidirmoq Yakuniy ishga tushirish
A9.com ishga tushirish
sogu ishga tushirish
2005 MSN Qidiruv Yakuniy ishga tushirish
Ask.com ishga tushirish
Nigma ishga tushirish
yaxshi qidiruv ishga tushirish
Meni qidiring Baza
2006 wikiseek Baza
Quaero Baza
Jonli qidiruv ishga tushirish
ChaCha Ishga tushirish (beta)
Guruji.com Ishga tushirish (beta)
2007 wikiseek ishga tushirish
Sproose ishga tushirish
Wikia Qidiruv ishga tushirish
blackle.com ishga tushirish
2008 DuckDuckGo ishga tushirish
Tooby ishga tushirish
Pikollator ishga tushirish
Viewzi ishga tushirish
Kuil ishga tushirish
Bugami ishga tushirish
LeapFish Ishga tushirish (beta)
O'rmon ishga tushirish
VADLO ishga tushirish
quvvat to'plami ishga tushirish
2009 Bing ishga tushirish
KAZ.KZ ishga tushirish
Yebol Ishga tushirish (beta)
Mugurdy yopilish
Skaut ishga tushirish
2010 Kuil yopilish
Blekko Ishga tushirish (beta)
Viewzi yopilish
2012 WAZZUB ishga tushirish
2014 Sun'iy yo'ldosh Ishga tushirish (beta)

Internet rivojlanishining dastlabki bosqichida Tim Berners-Li CERN veb-saytida joylashtirilgan veb-serverlar ro'yxatini yuritdi. Ko'proq saytlar bor edi va bunday ro'yxatni qo'lda saqlash tobora qiyinlashdi. NCSA veb-saytida maxsus "Nima yangiliklar!" bo'limi mavjud edi. (o'zb. Yangiliklar!), Bu erda ular yangi saytlarga havolalarni chop etishdi.

Internetda qidirish uchun birinchi kompyuter dasturi Archi(Inglizcha archie - "c" harfisiz arxiv). U 1990-yilda Monrealdagi MakGill universitetining kompyuter fanlari talabalari Alan Emtage, Bill Xilan va J. Piter Deutsch tomonidan yaratilgan. Dastur barcha mavjud anonim FTP serverlaridan barcha fayllar ro'yxatini yuklab oldi va fayl nomlari bo'yicha qidirish mumkin bo'lgan ma'lumotlar bazasini yaratdi. Biroq, Archie dasturi bu fayllarning mazmunini indekslamadi, chunki ma'lumotlar miqdori juda kichik bo'lib, hamma narsani qo'lda osongina topish mumkin edi.

1991 yilda Minnesota universitetida Mark Makkeyll tomonidan ishlab chiqilgan Gopher tarmoq protokolini ishlab chiqish va tarqatish ikkita yangi qidiruv dasturini yaratishga olib keldi, Veronika va Jughead. Archi singari, ular Gopher indeks tizimlarida saqlangan fayl nomlari va sarlavhalarini qidirdilar. Veronika (ingliz) Kompyuterlashtirilgan arxivlarga juda oson kemiruvchilarga yo'naltirilgan tarmoq indeksi) barcha Gopher roʻyxatlari boʻylab koʻpgina Gopher menyu sarlavhalari uchun kalit soʻzlarni qidirishga ruxsat berilgan. Jughead dasturi Jonzining universal gopher ierarxiyasini qazish va namoyish qilish) ba'zi Gopher serverlaridan olingan menyu ma'lumotlari. Archie qidiruv tizimining nomi komikslar seriyasiga aloqador bo'lmasa ham "Archi", shunga qaramay, Veronika va Jughead bu komikslarning qahramonlari.

1993 yil yoziga kelib, ko'plab ixtisoslashtirilgan kataloglar qo'lda yuritilgan bo'lsa-da, hali Internetda qidirish uchun yagona tizim mavjud emas edi. Jeneva universitetida Oskar Nierstrasz ushbu sahifalarni vaqti-vaqti bilan ko'chiradigan va ularni standart formatga qayta yozadigan bir qator Perl skriptlarini yozdi. Bu asos bo'ldi W3Catalog?!, 1993-yil 2-sentyabrda ishga tushirilgan birinchi ibtidoiy veb-qidiruv tizimi.

Ehtimol, Perlda yozilgan birinchi qidiruv tizimi 1993 yil iyun oyida Metyu Grey tomonidan yaratilgan "World Wide Web Wanderer" boti bo'lgan. Ushbu robot "Wandex" qidiruv indeksini yaratdi. Wanderer robotining maqsadi World Wide Web hajmini o'lchash va so'rovdagi so'zlarni o'z ichiga olgan barcha veb-sahifalarni topish edi. 1993 yilda ikkinchi qidiruv tizimi Aliweb paydo bo'ldi. Aliweb brauzerdan foydalanmadi, aksincha veb-sayt ma'murlaridan o'z saytlarida ma'lum formatdagi indeks fayli mavjudligi haqida bildirishnomalarni kutdi.

JumpStation, 1993 yil dekabr oyida Jonatan Fletcher tomonidan yaratilgan, brauzer yordamida veb-sahifalarni qidirgan va indekslagan va qidiruv so'rovlarini shakllantirish uchun interfeys sifatida veb-shakldan foydalangan. Bu qidiruv tizimining uchta asosiy funktsiyasini (tasdiqlash, indekslash va haqiqiy qidirish) birlashtirgan birinchi Internet qidiruv vositasi edi. Vaqtning cheklangan kompyuter resurslari tufayli indekslash va shuning uchun qidiruv faqat brauzer tomonidan topilgan veb-sahifalarning sarlavhalari va sarlavhalari bilan cheklangan.

Qidiruv tizimlari 1990-yillarning oxiridagi Dot-com Bubble-da ishtirok etdi. Bir nechta kompaniyalar bozorga ajoyib tarzda kirib, o'zlarining IPOlari paytida rekord darajadagi daromad keltirdilar. Ba'zilar ommaviy qidiruv tizimi bozorini tark etdilar va faqat korporativ sektor bilan ishlaydi, masalan Shimoliy yorug'lik.

Google kalit so'zlarni sotish g'oyasini 1998 yilda goto.com saytida qidiruv tizimini boshqaradigan kichik kompaniya bo'lganida oldi. Ushbu harakat qidiruv tizimlari uchun bir-biri bilan raqobat qilishdan Internetdagi eng daromadli biznes tashabbuslaridan biriga aylanishni ko'rsatdi. Qidiruv tizimlari qidiruv natijalarida birinchi o'rinlarni alohida kompaniyalarga sota boshladi.

Google qidiruv tizimi 2000-yillarning boshidan beri taniqli mavqega ega. Kompaniya PageRank algoritmidan foydalangan holda yaxshi qidiruv natijalari tufayli yuqori mavqega erishdi. Algoritm ommaga Google asoschilari Sergey Brin va Larri Peyj tomonidan yozilgan “Qidiruv tizimining anatomiyasi” maqolasida taqdim etilgan. Ushbu iterativ algoritm veb-sahifalarni "yaxshi" va "muhim" sahifalar boshqalarga qaraganda ko'proq havolalar olishini nazarda tutib, veb-sahifaga giperhavolalar soniga qarab tartiblaydi. Google interfeysi spartan uslubida ishlab chiqilgan bo'lib, bu erda hech qanday ortiqcha narsa yo'q, veb-portalda qidiruv tizimini yaratgan ko'plab raqobatchilardan farqli o'laroq. Google qidiruv tizimi shu qadar mashhur bo'ldiki, unga taqlid qiluvchilar paydo bo'ldi, masalan, Sirli qidiruvchi(maxfiy qidiruv tizimi).

Rus tilida ma'lumot qidirish

1996 yilda Altavista qidiruv tizimida rus morfologiyasini hisobga olgan holda qidiruv amalga oshirildi va original rus qidiruv tizimlari Rambler va Aport ishga tushirildi. 1997 yil 23 sentyabrda Yandex qidiruv tizimi ochildi. 2014-yil 22-mayda Sputnik milliy qidiruv tizimi Rostelekom tomonidan ochildi, u 2015-yilda beta-sinovda. 2015-yil 22-aprelda yangi Sputnik xizmati ishga tushirildi. Bolalar, ayniqsa xavfsizligi yuqori bo'lgan bolalar uchun.

Klaster tahlili va metama'lumotlarni qidirish usullari katta mashhurlikka erishdi. Ushbu turdagi xalqaro mashinalardan eng mashhuri edi "Klassik" kompaniyalar Vivisimo. 2005 yilda Moskva davlat universiteti ko'magida Rossiyada avtomatik klasterlashni qo'llab-quvvatlaydigan Nigma qidiruv tizimi ishga tushirildi. 2006 yilda rus metamashini Quintura ochildi, u teg buluti shaklida vizual klasterlashni taklif qildi. Nigma, shuningdek, vizual klasterlash bilan tajriba o'tkazdi.

Qidiruv mexanizmi qanday ishlaydi

Qidiruv tizimining asosiy komponentlari: qidiruv roboti, indeksator, qidiruv tizimi.

Qoida tariqasida, tizimlar bosqichma-bosqich ishlaydi. Birinchidan, brauzer tarkibni oladi, keyin indeksator qidiriladigan indeksni yaratadi va nihoyat, brauzer indekslangan ma'lumotlarni qidirish uchun funksionallikni ta'minlaydi. Qidiruv tizimini yangilash uchun ushbu indekslash davri takrorlanadi.

Qidiruv mexanizmlari HTML-sahifalardan olgan ko'plab veb-sahifalar haqidagi ma'lumotlarni saqlash orqali ishlaydi. Qidiruv roboti yoki "crawler" (eng. Crawler) - sahifada topilgan barcha havolalarni avtomatik ravishda kuzatib boradigan va ularni ta'kidlaydigan dastur. Brauzer havolalar yoki oldindan belgilangan manzillar ro'yxati asosida qidiruv tizimiga hali ma'lum bo'lmagan yangi hujjatlarni qidiradi. Sayt egasi robots.txt dan foydalanib, ba'zi sahifalarni chiqarib tashlashi mumkin, bu saytning fayllari, sahifalari yoki kataloglarini indekslashni oldini olish uchun ishlatilishi mumkin.

Qidiruv tizimi keyingi indekslash uchun har bir sahifaning mazmunini tahlil qiladi. So'zlar sarlavhalardan, sahifa matnidan yoki maxsus maydonlardan - meta teglardan olinishi mumkin. Indeksator - sahifani qismlarga bo'lgandan so'ng, o'ziga xos leksik va morfologik algoritmlardan foydalangan holda tahlil qiladigan modul. Veb-sahifaning barcha elementlari ajratiladi va alohida tahlil qilinadi. Veb-sahifa ma'lumotlari keyingi so'rovlarda foydalanish uchun indeks ma'lumotlar bazasida saqlanadi. Indeks foydalanuvchi so'rovi bo'yicha ma'lumotlarni tezda topish imkonini beradi. Google kabi bir qator qidiruv tizimlari asl sahifaning to'liq yoki bir qismini, ya'ni kesh deb ataladigan joyni, shuningdek, veb-sahifa haqidagi turli ma'lumotlarni saqlaydi. AltaVista kabi boshqa tizimlar topilgan har bir sahifaning har bir so'zini saqlaydi. Keshni ishlatish allaqachon tashrif buyurilgan sahifalardan ma'lumotlarni olishni tezlashtirishga yordam beradi. Keshlangan sahifalar har doim qidiruv so'rovida foydalanuvchi ko'rsatgan matnni o'z ichiga oladi. Bu veb-sahifa yangilanganda foydali bo'lishi mumkin, ya'ni u foydalanuvchi so'rovining matnini o'z ichiga olmaydi va keshdagi sahifa hali ham eski. Bu holat havolalarning yo'qolishi bilan bog'liq (Eng. linkrot) va Google-ning foydalanuvchilarga qulay (foydalanish) yondashuvi. Bu so'rov matnini o'z ichiga olgan keshdan qisqa matn qismlarini chiqarishni o'z ichiga oladi. Eng kam ajablanish printsipi amal qiladi, foydalanuvchi odatda olingan sahifalar matnlarida qidiruv so'zlarini ko'rishni kutadi ( foydalanuvchi taxminlari). Keshlangan sahifalar yordamida qidiruvni tezlashtirishdan tashqari, keshlangan sahifalar boshqa joyda mavjud bo'lmagan ma'lumotlarni o'z ichiga olishi mumkin.

Qidiruv tizimi indeksatordan olingan chiqish fayllari bilan ishlaydi. Qidiruv tizimi foydalanuvchi so'rovlarini qabul qiladi, ularni indeks yordamida qayta ishlaydi va qidiruv natijalarini qaytaradi.

Agar foydalanuvchi qidiruv tizimiga so'rovni kiritganida (odatda kalit so'zlardan foydalangan holda), tizim uning indeksini tekshiradi va eng mos veb-sahifalar ro'yxatini (ba'zi bir mezon bo'yicha saralangan) qaytaradi, odatda hujjatning sarlavhasini va qisqacha izohini o'z ichiga oladi. ba'zan matn qismlari. Qidiruv indeksi veb-sahifalardan olingan ma'lumotlarga asoslangan maxsus texnikaga muvofiq tuzilgan. 2007-yildan beri Google qidiruv tizimi vaqtga qarab qidirish, izlayotgan hujjatlarni yaratish imkonini beradi (“Qidiruv asboblari” menyusiga qo‘ng‘iroq qiling va vaqt oralig‘ini belgilang). Ko'pgina qidiruv tizimlari so'rovlarda mantiqiy VA, OR, EMAS operatorlaridan foydalanishni qo'llab-quvvatlaydi, bu sizga qidirilayotgan kalit so'zlar ro'yxatini yaxshilash yoki kengaytirish imkonini beradi. Bunday holda, tizim so'z yoki iboralarni aynan kiritilgan tarzda qidiradi. Ba'zi qidiruv tizimlari ruxsat beradi taxminiy qidiruv, bu holda foydalanuvchilar kalit so'zlarga masofani ko'rsatib, qidiruv maydonini kengaytiradilar. Shuningdek bor kontseptual qidiruv, bu veb-sahifalar matnlarida qidiruv so'zlari va iboralardan foydalanishning statistik tahlilidan foydalanadi. Ushbu tizimlar so'rovlarni tabiiy tilda tuzish imkonini beradi. Bunday qidiruv tizimining misoli ask com veb-saytidir.

Qidiruv tizimining foydaliligi u topadigan sahifalarning dolzarbligiga bog'liq. Millionlab veb-sahifalar so'z yoki iborani o'z ichiga olishi mumkin bo'lsa-da, ba'zilari boshqalarga qaraganda ko'proq mos, mashhur yoki obro'li bo'lishi mumkin. Ko'pgina qidiruv tizimlari "eng yaxshi" natijalarni ro'yxatning yuqori qismiga olib chiqish uchun reyting usullaridan foydalanadi. Qidiruv mexanizmlari qaysi sahifalar ko'proq mos kelishini va natijalar qanday tartibda turli yo'llar bilan ko'rsatilishi kerakligini hal qiladi. Qidiruv usullari, xuddi Internetning o'zi kabi, vaqt o'tishi bilan o'zgaradi. Shunday qilib, qidiruv tizimlarining ikkita asosiy turi paydo bo'ldi: oldindan belgilangan va ierarxik tartiblangan kalit so'zlar tizimlari va matn tahlili asosida teskari indeks yaratiladigan tizimlar.

Aksariyat qidiruv tizimlari reklamadan daromad keltiradigan tijorat korxonalari bo'lib, ba'zi qidiruv tizimlarida siz haq evaziga berilgan kalit so'zlar bo'yicha qidiruv natijalarida yuqori o'rinlarni sotib olishingiz mumkin. Natijalar tartibi uchun haq talab qilmaydigan qidiruv tizimlari kontekstli reklamadan daromad oladi, reklama xabarlari esa foydalanuvchi talabiga mos keladi. Bunday reklamalar qidiruv natijalari ro'yxati bilan sahifada ko'rsatiladi va qidiruv tizimlari foydalanuvchi har safar reklama xabarlarini bosganida daromad oladi.

Qidiruv mexanizmi turlari

Qidiruv tizimlarining to'rt turi mavjud: robotlashtirilgan, inson tomonidan boshqariladigan, gibrid va meta-tizimlar.

  • qidiruv robotlaridan foydalanadigan tizimlar
Ular uch qismdan iborat: skaner ("bot", "robot" yoki "o'rgimchak"), indeks va qidiruv tizimining dasturiy ta'minoti. Brauzer tarmoqni chetlab o'tish va veb-sahifalar ro'yxatini yaratish uchun kerak. Indeks veb-sahifalar nusxalarining katta arxividir. Dasturning maqsadi qidiruv natijalarini baholashdir. Ushbu mexanizmdagi brauzer doimiy ravishda tarmoqni o'rganayotganligi sababli, ma'lumotlar yanada dolzarbdir. Ko'pgina zamonaviy qidiruv tizimlari ushbu turdagi tizimlardir.
  • inson tomonidan boshqariladigan tizimlar (resurslar kataloglari)
Ushbu qidiruv tizimlari veb-sahifalar ro'yxatini oladi. Katalogda manzil, sarlavha va saytning qisqacha tavsifi mavjud. Resurs katalogi faqat veb-ustalar tomonidan taqdim etilgan sahifa tavsiflaridan natijalarni qidiradi. Kataloglarning afzalligi shundaki, barcha resurslar qo'lda tekshiriladi, shuning uchun kontentning sifati birinchi turdagi tizim tomonidan avtomatik ravishda olingan natijalarga nisbatan yaxshiroq bo'ladi. Ammo bir kamchilik ham bor - bu kataloglarni yangilash qo'lda amalga oshiriladi va ishlarning haqiqiy holatidan sezilarli darajada orqada qolishi mumkin. Sahifalar reytingini bir zumda o'zgartirib bo'lmaydi. Bunday tizimlarga misollar Yahoo katalogi, dmoz va Galaxy.
  • gibrid tizimlar
Yahoo, Google, MSN kabi qidiruv tizimlari qidiruv robotlari va inson tomonidan boshqariladigan tizimlardan foydalangan holda tizimlarning funktsiyalarini birlashtiradi.
  • meta-tizimlar
Meta-qidiruv tizimlari bir vaqtning o'zida bir nechta qidiruv tizimlarining natijalarini birlashtiradi va tartiblaydi. Ushbu qidiruv tizimlari har bir qidiruv tizimi o'ziga xos indeksga ega bo'lganda va qidiruv tizimlari kamroq "aqlli" bo'lganda foydali bo'lgan. Hozirda qidiruv juda yaxshilangani uchun ularga bo'lgan ehtiyoj kamaydi. Misollar: MetaCrawler va MSN qidiruvi.

Qidiruv mexanizmi bozori

Google 68,69% bozor ulushi bilan dunyodagi eng mashhur qidiruv tizimi hisoblanadi. Bing ikkinchi o'rinni egallaydi, uning ulushi 12,26% ni tashkil qiladi.

Dunyodagi eng mashhur qidiruv tizimlari:

Qidiruv tizimi 2014 yil iyul oyida bozor ulushi 2014 yil oktyabr oyida bozor ulushi 2015 yil sentyabr oyida bozor ulushi
Google 68,69 % 58,01 % 69,24%
Baidu 17,17 % 29,06 % 6,48%
Bing 6,22 % 8,01 % 12,26%
Yahoo! 6,74 % 4,01 % 9,19%
AOL 0,13 % 0,21 % 1,11%
Hayajonlantirish 0,22 % 0,00 % 0,00 %
So'rang 0,13 % 0,10 % 0,24%

Osiyo

Sharqiy Osiyo mamlakatlarida va Rossiyada Google eng mashhur qidiruv tizimi emas. Xitoyda, masalan, ko'proq mashhur qidiruv tizimi Soso?!.

Janubiy Koreyada Naverning xususiy qidiruv portalidan Yahoo! Yaponiya va Yahoo! Tayvan, mos ravishda Yaponiya va Tayvandagi eng mashhur qidiruv tizimlari.

Rossiya va rus tilidagi qidiruv tizimlari

2015 yil iyun oyida LiveInternet ma'lumotlariga ko'ra, rus tilidagi qidiruv so'rovlarining qamrovi bo'yicha:

  • Hamma tilda:
    • Yahoo! (0,1%) va ushbu kompaniyaga tegishli qidiruv tizimlari: Inktomi, AltaVista, Alltheweb
  • Ingliz tilida so'zlashuvchi va xalqaro:
    • So'rangJeeves(Teoma mexanizmi)
  • Rus tilida so'zlashuvchi - "rus tilida so'zlashuvchi" qidiruv tizimlarining aksariyati ko'plab tillarda - ukrain, belarus, ingliz, tatar va boshqalarda matnlarni indekslaydi va qidiradi. Ular barcha hujjatlarni ketma-ket indekslaydigan "barcha tilli" tizimlardan farq qiladi, chunki ular asosan rus tili ustunlik qiladigan domen zonalarida joylashgan resurslarni indekslaydi yoki boshqa yo'l bilan o'z robotlarini rus tilidagi saytlar bilan cheklaydi.

Ba'zi qidiruv tizimlari tashqi qidiruv algoritmlaridan foydalanadi.

Miqdoriy Google qidiruv tizimi ma'lumotlari

Internet foydalanuvchilari soni va qidiruv tizimlari va foydalanuvchilarning ushbu tizimlarga bo'lgan talablari doimiy ravishda o'sib bormoqda. Kerakli ma'lumotlarni qidirish tezligini oshirish uchun katta qidiruv tizimlarida juda ko'p serverlar mavjud. Serverlar odatda server markazlariga (ma'lumotlar markazlari) guruhlanadi. Mashhur qidiruv tizimlarida butun dunyo bo'ylab tarqalgan server markazlari mavjud.

2012-yil oktabr oyida Google “Internet qaerda yashaydi” loyihasini ishga tushirdi, unda foydalanuvchilarga kompaniyaning maʼlumotlar markazlari bilan tanishish imkoniyati beriladi.

Google qidiruv tizimi ma'lumotlar markazlarining ishi haqida quyidagilarni biladi:

  • 2011 yil holatiga ko'ra, barcha Google ma'lumotlar markazlarining umumiy quvvati 220 MVt deb baholangan.
  • Google 2008-yilda Oregon shtatida 6,5 ​​million m² yangi uch binoli majmua ochishni rejalashtirganida, Harper's Magazine bunday yirik majmua 100 MVt dan ortiq elektr energiyasini iste'mol qiladi, deb hisoblagan, bu 300 000 kishilik shaharning energiya iste'moli bilan solishtirish mumkin. .
  • 2012 yilda Google serverlarining taxminiy soni 1 000 000 tani tashkil etadi.
  • Google kompaniyasining ma'lumotlar markazlariga sarflagan xarajatlari 2006 yilda 1,9 milliard dollarni, 2007 yilda esa 2,4 milliard dollarni tashkil qilgan.

Google tomonidan indekslangan World Wide Web hajmi 2014 yil dekabr holatiga ko'ra taxminan 4,36 milliard sahifani tashkil etadi.

Diniy taqiqlarni hisobga oladigan qidiruv tizimlari

Internetning jahon miqyosida tarqalishi va elektron qurilmalarning arab va musulmon dunyosida, xususan, Yaqin Sharq mamlakatlari va Hindiston yarimorolida ommaviyligi ortib borayotgani islom an’analarini hisobga oladigan mahalliy qidiruv tizimlarining rivojlanishiga xizmat qildi. Bunday qidiruv tizimlari foydalanuvchilarga taqiqlangan saytlarga, masalan, pornografiyaga ega saytlarga kirishdan qochishga yordam beradigan va faqat mazmuni islom diniga zid bo'lmagan saytlardan foydalanishga imkon beruvchi maxsus filtrlarni o'z ichiga oladi. Musulmonlarning Ramazon oyidan sal oldin, 2013-yil iyul oyida dunyo tanishtirildi Halol googling- Google va Bing kabi boshqa qidiruv tizimlaridan olingan qidiruv natijalarini filtrlash orqali foydalanuvchilarga faqat halol "to'g'ri" havolalarni beruvchi tizim. Ikki yil avval, 2011-yil sentabr oyida Yaqin Sharqdagi foydalanuvchilarga xizmat ko‘rsatish uchun I'mHalal qidiruv tizimi ishga tushirilgan edi. Biroq, ushbu qidiruv xizmati, egasining so'zlariga ko'ra, mablag' yo'qligi sababli qisqa vaqt ichida yopilishi kerak edi.

Musulmon dunyosida sarmoya etishmasligi va texnologiya tarqalishining sekin sur'ati taraqqiyotga to'sqinlik qildi va jiddiy islomiy qidiruv tizimining muvaffaqiyatiga to'sqinlik qildi. Musulmon turmush tarzi veb-loyihalariga katta sarmoyalarning muvaffaqiyatsizligi, ulardan biri edi Muxlim. U Rite Internet Ventures kabi sarmoyadorlardan millionlab dollar oldi va hozirda - I'mHalal-ning yopilishidan oldin so'nggi xabariga ko'ra - "keyingi Facebook yoki Google faqat O'rtada bo'lishi mumkin" degan shubhali fikrni o'ylab topmoqda. Sharq. Agar siz bizning yorqin yoshlarimizni qo'llab-quvvatlasangiz." Shunga qaramay, islomiy internet mutaxassislari yillar davomida shariatga nima to‘g‘ri kelishi yoki bo‘lmasligini aniqlash bilan band bo‘lib, veb-saytlarni “halol” yoki “harom” deb tasniflaydi. Barcha sobiq va hozirgi islomiy qidiruv tizimlari shunchaki maxsus indekslangan maʼlumotlar toʻplamidir yoki ular Google, Yahoo va Bing kabi yirik qidiruv tizimlari boʻlib, foydalanuvchilarning harom saytlarga kirishini oldini olish uchun foydalaniladi, masalan, yalangʻochlik haqidagi saytlar, LGBT, qimor va islomga qarshi deb hisoblangan boshqa narsalar.

Dinga yoʻnaltirilgan boshqa qidiruv tizimlari orasida Google’ning yahudiy versiyasi boʻlgan Jewogle va SeekFind.org nasroniy sayti foydalanuvchilarni eʼtiqodini susaytiradigan yoki zaiflashtiradigan kontentdan uzoqlashtirish uchun filtrlarni oʻz ichiga olgan nasroniy saytlari keng tarqalgan.

Shaxsiy natijalar va filtr pufakchalari

Google va Bing kabi ko'plab qidiruv tizimlari foydalanuvchi tizimdagi o'tmishdagi faoliyati asosida qanday ma'lumotlarni ko'rishni xohlashini tanlab taxmin qilish uchun algoritmlardan foydalanadi. Natijada, veb-saytlar faqat foydalanuvchining o'tmishdagi manfaatlariga mos keladigan ma'lumotlarni ko'rsatadi. Ushbu effekt "filtr pufakchasi" deb ataladi.

Bularning barchasi foydalanuvchilarning o'z nuqtai nazariga zid bo'lgan kamroq ma'lumot olishiga va o'zlarining "axborot pufakchasi" ga intellektual izolyatsiya qilinishiga olib keladi. Shunday qilib, “pufak effekti” fuqarolik fikrini shakllantirish uchun salbiy oqibatlarga olib kelishi mumkin.

Qidiruv mexanizmi tarafkashligi

Qidiruv mexanizmlari veb-saytlarni ularning mashhurligi va dolzarbligining kombinatsiyasi asosida tartiblash uchun dasturlashtirilgan bo'lsa-da, haqiqat shundaki, eksperimental tadqiqotlar turli xil siyosiy, iqtisodiy va ijtimoiy omillar SERPlarga ta'sir qilishini ko'rsatadi.

Bunday noto'g'ri munosabat iqtisodiy va tijorat jarayonlarining bevosita natijasi bo'lishi mumkin: qidiruv tizimida reklama beruvchi kompaniyalar ushbu qidiruv tizimidagi organik qidiruv natijalarida ko'proq mashhur bo'lishi mumkin. Mahalliy qonunlarga mos kelmaydigan qidiruv natijalarini olib tashlash siyosiy jarayonlarning ta'siriga misol bo'la oladi. Misol uchun, Google Holokostni inkor etish noqonuniy bo'lgan Frantsiya va Germaniyadagi ba'zi neonatsist veb-saytlarini ko'rsatmaydi.

Tarafsizlik ijtimoiy jarayonlarning oqibati ham bo'lishi mumkin, chunki qidiruv tizimining algoritmlari ko'pincha "mashhur" natijalar foydasiga formatlanmagan nuqtai nazarlarni istisno qilish uchun mo'ljallangan. Asosiy qidiruv tizimlarining indekslash algoritmlari Amerika saytlariga ustunlik beradi.

Qidiruv bombasi siyosiy, ijtimoiy yoki tijorat maqsadlarida qidiruv natijalarini manipulyatsiya qilishga urinishning bir misolidir.

Shuningdek qarang

  • Qwika
  • Elektron kutubxona#Ro‘yxatlar kutubxonalar va qidiruv tizimlari
  • Veb dasturchi asboblar paneli

Eslatmalar

Adabiyot

  • Ashmanov I. S., Ivanov A.A. Qidiruv tizimlarida veb-saytlarni reklama qilish. - M. : Uilyams, 2007. - 304 p. - ISBN 978-5-8459-1155-1.
  • Baikov V.D. Internet. Ma'lumot qidirish. Veb-sayt reklamasi. - Sankt-Peterburg. : BHV-Peterburg, 2000. - 288 p. - ISBN 5-8206-0095-9.
  • Kolisnichenko D.N. Internetda qidiruv tizimlari va veb-saytlarni targ'ib qilish. - M.: Dialektika, 2007. - 272 b. - ISBN 978-5-8459-1269-5.
  • Lande D.V. Internetda bilim qidiring. - M. : Dialektika, 2005. - 272 p. - ISBN 5-8459-0764-0.
  • Lande D.V., Snarskiy A. A., Bezsudnov I.V. Internet: Murakkab navigatsiya tarmoqlar: modellar va algoritmlar. - M.: Librokom (URSS tahririyati), 2009. - 264 b. - ISBN 978-5-397-00497-8.
  • Chu X., Rosenthal M.

Qidiruv mexanizmlarining paydo bo'lishi haqidagi hikoya 1945 yil iyul oyida, amerikalik olim Vannevar Bush shaxsiy kompyuterlarning paydo bo'lishini bashorat qilishga muvaffaq bo'lgan mashhur "Biz o'ylayotganimizda" maqolasini yozishga muvaffaq bo'lgan paytdan boshlanadi. gipermatn g'oyasini shakllantirish. E'tibor bering, Vanniver Bushning o'zi biz hozir foydalanadigan qidiruv tizimlarining prototiplarini yaratishda ishtirok etgan. Biroq, 1938 yilda u mikrofilm haqida ma'lumotni tezda qidira oladigan qurilmani ishlab chiqish va patentlash imkoniyatiga ega bo'ldi.

Vanniver Bush qidiruv texnologiyalari va Internet g'oyasining asoschisi hisoblansa-da, boshqa olimlar uning g'oyalarini hayotga tatbiq etishdi. 1958 yilda Qo'shma Shtatlarda Mudofaa vazirligi qoshida ADIP (Advanced Research Projects Agency, ARPA, Advanced Research Projects Agency) tashkil etildi, unda 1963 yildan 1969 yilgacha olimlar ma'lumot olish imkonini beradigan mutlaqo yangi kontseptsiya ustida ishlashlari mumkin edi. kompyuter tarmog'i orqali uzatilishi mumkin.

Dastlab, shifrlangan ma'lumotlarni uzatish imkonini beruvchi ushbu ulanish harbiy maqsadlarda qo'llanilishi rejalashtirilgan edi, ammo ma'lumot uzatish xavfsizligi darajasi juda past bo'lib chiqdi, shuning uchun harbiylardan rivojlanishni davom ettirishdan bosh tortish so'ralgan.

Biroq, faqat 1980-yillarning oxirlarida kompyuter tarmog'ini yaratish g'oyasi qayta tiklandi. Bunga AQShning bir qancha universitetlari yordam berdi, ular o'z ishlanmalarida tarmoqlarni ulash orqali o'zlarining ta'limga oid ma'lumotlar kutubxonalarini birlashtira oldilar.

1990-yillarda Internetning keskin rivojlanishi kuzatildi. 1993 yil fevral oyidan boshlab, NCSA xodimi Mark Andressen (Superkompyuter ilovalari milliy markazi, www.ncsa.uiuc.edu) UNIX ostida Mozaik gipermatnni ko'rsatadigan dasturning dastlabki versiyasini tugatgan zahoti, chunki aynan uning o'zi edi. qulay grafik interfeys va u bizning davrimizda foydalanadigan brauzerlarning prototipiga aylana oldi. Internet mashhurlikka erisha boshladi.

1990-yillarning oʻrtalarida kerakli maʼlumotlarni topish uchun saytlar joylashgan katalogdan foydalanish kerak edi. O'sha paytda bunday ma'lumotnomalar ko'p emas edi va ular ko'p saytlar bilan porlamadi, lekin ulardagi ma'lumotlar sarlavhalar va mavzular bo'yicha tartiblangan. Shuni ta'kidlash kerakki, 1993 yilda uchta qidiruv botlari allaqachon Internetda edi. Ushbu ishlanmalar notijorat bo'lib, katta hajmdagi ma'lumotlar oqimidan so'ng ular ish bilan shug'ullana olmadilar, shuning uchun ular Internetning jadal rivojlanishi tufayli yo'qoldi.

1995 yildan beri global Internetda asosiy o'rinni keyinchalik juda katta bo'lgan qidiruv tizimlari egallab kelmoqda, G'arbda - Google, Yachoo, Alta Vista, Rossiyada esa - Yandex, Rambler, Aport.

Keling, Rossiyada qidiruv tizimlarining rivojlanish tarixiga to'xtalib o'tamiz. Bu erda bizning qidiruv tizimlarimizni unchalik oson yo'l kutmagan edi. G'alaba va mag'lubiyatlar ham bo'ldi.

Yandex kompaniyasi 1990 yilda rivojlana boshladi, ammo faqat 1997 yilda u biz juda yaxshi biladigan qidiruv tizimiga aylandi.

Yandex Rossiyada so'zsiz yetakchi hisoblanadi, chunki yetakchi ekspertlarning hisob-kitoblariga ko'ra, oy davomida Yandex auditoriyasining qamrovi Rossiyadagi muntazam Internet-auditoriyaning taxminan yarmini tashkil etgan. Bu raqamlar Aport va Ramblerning potentsial auditoriyasidan yuqori. Yaqinda boshqa yirik elektron pochta xizmatidan juda kuchli Go Mail qidiruvi paydo bo'ldi, ammo bu holda kompaniya Yandex algoritmidan foydalanishga muvaffaq bo'ldi va shu sababli biz Pochta tizimi sahifalaridan qidiruvni Yandex-ga bog'lashimiz mumkin. qidirmoq. Ammo so'nggi janjal Mail Groupni Yandex qidiruvidan uzoqlashishga majbur qildi. Janjalning aniq sabablarini hozirgacha hech kim bilmaydi.

Yandex qidiruvi sarlavhalarni, shuningdek, hujjat matnida so'zning majburiy mavjudligini hisobga oladi. So'z birikmasi bo'lgan, bir-biriga yaqin joylashgan va bir paragrafda joylashgan so'zlarga ustunlik beriladi. Yandex-da qidiruv rus tilining morfologiyasini hisobga oladi, bu uning o'ziga xos xususiyati, ya'ni "foto tabiat" yoki "foto tabiat" so'rovi bo'lsa, u ushbu so'zlarga mos keladigan hujjatlarni ham beradi. .

Rambler 1997 yil kuzida Moskva viloyati Pushchino shahridagi Mikrobiologiya ilmiy-tadqiqot instituti olimlari guruhi tomonidan ochilgan birinchi Runet qidiruv xizmati. Rambler-da qidirish sahifadagi qalin (kuchli va b teglar) va sarlavhalarda tez-tez paydo bo'ladigan asosiy so'zlarni indekslash orqali qurilgan (h1 teglari). Yandex-dan farqli o'laroq, Rambler qidiruvi kalit so'z teglarini e'tiborsiz qoldirishi mumkin, shuning uchun ular uni sof qidiruv deb atashni yaxshi ko'radilar, lekin shu bilan birga, qidiruvning to'g'ri tozaligi hali sezilmagan. Bu muammo boshqa qidiruv tizimlarida ham paydo bo'ladi. Ayni paytda Ramblerning qidiruv pozitsiyalari juda tushib ketdi va ekspertlar va sinoptiklar ushbu tizim muntazam ko'ngilochar portalga qayta o'qitilishini taxmin qilmoqdalar. Ushbu tizimni faollashtiradigan yagona narsa - Blogunning o'z reklama tarmog'i.

Aport qidiruv tizimi birinchi marta 1996 yil fevral oyida Rossiya klubining ochilishi sharafiga Agama matbuot anjumanida namoyish etilgan, o'sha paytda u hali Internetda keng ko'lamli qidiruv tizimi emas edi. Aportning boshqa qidiruv tizimlaridan farqi shundaki, u berilgan kalit so‘zlarni nafaqat kalit so‘zlar, balki tasvir sarlavhalari (alt) va tavsifda ham qidira oladi. Ammo bu yangilik uzoq davom etmadi. Boshqa qidiruv tizimlari ham xuddi shu narsani takrorladi va endi Aport o'z foydalanuvchilarini ajablantiradigan boshqa hech narsaga ega emas. 2011 yilda Aport qidiruv tizimi qidiruv bozoridagi yirik o'yinchilar tomonidan qo'lga olinishi mumkin.

Qidiruvning kamchiliklari

Hozirgi vaqtda qidiruv tizimlari har qanday usulda qidiruv texnologiyalarini yaxshilashda davom etmoqda. Ammo, afsuski, ularning hech biri qanchalik rivojlangan bo'lmasin, mukammal qidiruv bilan maqtana olmaydi. Hozirgi vaqtda qidiruv tizimlarining asosiy kamchiliklari kam rivojlangan so'rovlarni umumlashtirish tizimlarini va axborot manbalarini tanlashga katta bog'liqlikni o'z ichiga olishi mumkin. Axborot mazmuni etarli bo'lmagan taqdirda, uni qandaydir tarzda qidiruv natijalari tanlovining ko'pligi bilan qoplash mumkin. Ammo odamlar nimani topmoqchi ekanligini kompyuterga inson tilida tushuntirish hali haqiqatga aylantirilmagan. Shu sababli, qidiruv tizimlarining hech biri o'zini ensiklopediya deb ataolmaydi. Biroq, kelajak, albatta, inson tushunchalarini qayta ishlashga qaratilgan informatsion qidiruvda ekanligi sir emas.