Інтернет Windows Android

Які пошукові системи існують. Які є пошукові системи

Очікувано Гугл зайняв перше місце в світовому рейтингу. На його частку припадає більше 70% пошукових запитів від жителів з усіх куточків Землі. Причому третина всього трафіку google.com доводиться на громадян США. Крім того, Гугл є найбільш відвідуваним сайтом у світі. Середня щоденна тривалість використання пошукової системи Гугл становить 9 хвилин.

Перевагою пошукача Гугл є відсутність зайвих елементів на сторінці. Лише рядок пошуку і логотип компанії. фішкою є анімовані картинки і браузерні ігри, приурочені до популярних і локальним свят.

2. Bing

Бінг - пошукова система від Microsoft, Яка веде свою історію з 2009 року. З цього моменту вона стала обов'язковим атрибутом смартфонів на ОС Windows. Bing також відрізняє мінімалізм - крім шапки з переліком всіх продуктів Microsoft, на сторінці розташована лише пошуковий рядок і назва системи. Найбільш популярний Бінг в США (31%), Китаї (18%) і Німеччини (6%).

3. Yahoo!

Третє місце закріпилося за одним з найстаріших пошукових систем - Яху. Основна маса користувачів також проживає в США (24%). Складається враження, що весь інший світ свідомо уникає допомоги пошукових роботів ...Також пошуковик популярний в Індії, Індонезії, Тайвані і в Великобританії. Крім рядки пошуку, на сторінці Yahoo! пропонується прогноз погоди в вашому регіоні, а також світові тренди у вигляді стрічки новин.

4. Baidu

Китайський пошуковик, який в Росії здобув погану славу. Через агресивну політику та відсутність перекладу на російську або англійську мови, розширення цієї пошуковий системи сприймаються як вірусів. Їх дуже складно видалити до кінця і позбутися від спливаючих вікон з ієрогліфами. Тим не менш, цей сайт є четвертим в світі по відвідуваності. 92% його аудиторії становлять громадяни Китаю.

5. AOL

AOL - американська пошукова система, чия назва розшифровується як America Online. Її популярність значно нижче, ніж у попередніх систем. Її світанок припадав на 90-е і 00-е роки. Майже 70% аудиторії АОЛ - жителі Сполучених Штатів.

6. Ask.com

У цієї пошукової системи, яка веде свою історію з 1995, досить незвичайний інтерфейс. Всі запити вона сприймає як запитань і пропонує варіанти відповідей відповідно до пошуковою видачею. Це чимось нагадує сервіс Ответи.Мейл. Однак в видачу потрапляють не відповіді любителів, а повноцінні статті. За останній рік сайт втратив близько 50 позицій в світовому рейтингу найпопулярніших інтернет-ресурсів і на сьогоднішній день займає лише 104 місце.

7. Excite

Цей пошуковик нічим не примітний, і схожий на масу інших сайтів. Він пропонує користувачам масу сервісів (таких, як Новини, Пошта, Погода, Подорожі і т.д.) Інтерфейс сайту також викликає спогади про ВЕБе 90-х рр і, можна припустити, мало змінився з тих пір.

8. DuckDuckGo

Розробники відразу попереджають, що дана пошукова система не відслідковує ваші дії в мережі. У наші дні це є вагомим аргументом при виборі пошуковика. Дизайн сайту виконаний в сучасній манері, використовує яскраві фарби і забавні картинки. На відміну від інших пошукових машин, «качиний пошуковик» переведений на російську мову. За останній рік сайт відіграв близько 400 позицій і в березні 2017р. знаходиться на 504 рядку рейтингу популярності Alexa.

9. WolframAlpha

Відмінною рисою цього пошуку є різноманіття допоміжних сервісів, розрахованих на запити, пов'язані з тими чи іншими знаннями. Тобто, у видачі ви не побачите посилань на пости в соцмережах або статті жовтої преси. Вам запропонують конкретні цифри і перевірені факти в формі єдиного документа. Цей браузер ідеально підходить школярам і студентам.

10. Yandex

Пошуковик, найбільш популярний в Росії і країнах СНД. Крім того, близько 3% аудиторії сайту є жителями Німеччини. Сайт примітний великою кількістю сервісів на всі випадки життя (музика, радіо, розклад громадського транспорту, Нерухомість, перекладач та ін.) Також ресурс пропонує великий вибір індивідуального оформлення сайту, а також настройку віджетів «під себе». Яндекс займає 31 місце в світі за популярністю, втративши 11 позицій за останній рік.

Найбільш популярним веб сервісом сучасності є саме пошукова система. Тут все зрозуміло, адже ті часи, коли представники перших користувачів інтернету могли спостерігати новинки в мережі вже давним-давно пішли.

Інформації з'являється і накопичується так багато, що людині стало дуже важко знайти саме ту, яка йому була б необхідна. Уявіть, як би виглядали б пошук в інтернеті, якби пересічному користувачеві довелося б шукати інформацію не зрозумій де. Саме не зрозумій де, тому як ручним пошуком багато інформації не знайдеш.

Пошукова система, що це таке?

Добре якщо користувачеві вже відомі сайти, на яких можливо є потрібна інформація, але що робити в іншому випадку? Для того, щоб полегшити життя людині в пошуку потрібної інформації в інтернеті і були придумані пошукові системи або просто пошуковики. Пошукова система виконує одну дуже важливу функцію, Без якої інтернет був би не таким як ми його звикли бачити - це пошук інформації в мережі.

Пошукова система - це спеціальний веб вузол або по-іншому сайт, який надає користувачам за їх запитами гіперпосилання на сторінки, сайтів, що відповідають на поставлене пошукової запит.

Якщо бути трохи точнішим, то пошук інформації в інтернеті, який наразі триває завдяки програмно-апаратного функціональному набору і веб інтерфейсу для взаємодії з користувачами.

Для взаємодії людини з пошуковою системою і був створений веб інтерфейс, тобто видима і зрозуміла оболонка. Даний підхід розробників пошукових систем полегшує пошук багатьом людям. Як правило, саме в інтернеті здійснюється пошук за допомогою пошукових систем, але також існують системи пошуку для FTP-серверів, окремих видів товарів у всесвітній павутині, або новинної інформації або ж інші пошукові напрямки.

Пошук може здійснюватися не тільки по текстового наповнення сайтів, але і по інших типах інформації, які людина може шукати: зображення, відео, звукові файли і т.д.

Як здійснюється пошук пошуковою системою?

Сам пошук в інтернеті, рівно так само як перегляд веб сайтів можливий за допомогою інтернет оглядача - браузера. Тільки після того, як користувач задав свій запит в рядку пошуку, здійснюється безпосередньо і сам пошук.

Будь-яка пошукова система містить програмну частину, На якій заснований весь пошукової механізм, його називають пошуковим движком - це програмний комплекс і забезпечує можливість пошуку інформації. Після звернення до пошукача, формування людиною пошукового запиту і введення його в рядок пошуку, пошукова система генерує сторінку зі списком результатів пошуку, найбільш релевантні, на думку пошукача тут розташовуються вище.

Релевантність пошуку - пошук найбільш відповідають запиту користувача матеріалів і розташування на них гіперпосилань на сторінці видачі з більш точними результатами вище інших. Саме распределеніерезультатов називається ранжируванням сайтів.

Так як же пошуковик готує для видачі свої матеріали і як відбувається пошук інформації самим пошукачем? Збору інформації в мережі сприяє унікальний для кожної пошукової системи робот або по-іншому бот, що володіє так само поруч інших синонімів як краулер або павук, а саму роботу системи пошуку можна розділити на три етапи:

До першого етапу роботи пошукової системи можна віднести сканування сайтів в глобальній мережі і збір на свої власні сервери копій веб сторінок. Це утворює величезну кількість поки ще не обробленої і не придатною інформації для пошукової видачі.

Другий етап роботи пошукача зводиться до впорядкування отриманої раніше, на першому етапі інформації від сайтів. Проводиться така сортування, яка за найменший час буде сприяти тому самому якісному пошуку, якого власне і чекають користувачі від пошукової системи. Етап називають індексацією, це означає, що сторінки вже є підготовленими до видачі, а актуальна база буде вважатися індексом.

Якраз третій етап і обумовлює пошукову видачу, Після прийому запиту від свого клієнта, спираючись на ключові або близько ключові слова, зазначені в запиті. Це сприяє відбору найбільш відповідною запиту інформації, і подальшої її видачі. Так як інформації, дуже і дуже багато, пошукова система виконує ранжування у відповідність зі своїми алгоритмами.
Кращою пошуковою системою вважається та, яка зможе надати найбільш коректно відповідає на запит користувача матеріал. Але і тут можуть зустрічатися результати, на які вплинули люди, зацікавлені в просування свого сайту, такі сайти хоч і не завжди, але часто з'являються в результатах пошуку, але не на довго.

Хоч світові лідери вже в багатьох регіонах визначені, пошукові системи тривають розвивати свій якісний, пошук. Чим якісніше пошук вони зможуть надати, тим більше людей будуть ним користуватися.

Як користуватися пошуковою системою?

Що таке пошукова система і як вона працює вже зрозуміло, але як їй правильно користуватися? На більшості сайтів завжди присутній рядок пошуку, а поруч з нею знаходиться кнопка Знайти або Пошук. У пошуковий рядок вводиться запит, після чого потрібно натиснути кнопку пошуку або ж як це частіше буває, натиснути клавішу Enter на клавіатурі і за лічені секунди ви отримуєте результат запиту у вигляді списку.

А ось отримати правильну відповідь на запит пошуку, з першого разу вдається не завжди. Для того, щоб пошуки бажаного не стає болісними, необхідно правильно складати пошуковий запит і слідувати нижчеописаних рекомендацій.

Складаємо пошуковий запит правильно

Далі будуть вказані поради по використанню пошукової системи. Дотримання деяких хитрощів і правилам при здійсненні пошуку інформації в пошуковій системі дасть можливість отримати потрібний результат набагато швидше. Дотримуйтеся таких вказівок:

  1. Грамотне написання слів забезпечує максимальна кількість збігів з шуканим інформаційним об'єктом (Хоч сучасний пошукові системи вже навчилися виправляти орфографічні помилки, але даними радою нехтувати не варто).
  2. Завдяки використанню синонімів в запиті, можна охопити більш широкий пошукової діапазон.
  3. Іноді зміна слова в тексті запиту може принести більший результат здійснюйте переформування запиту.
  4. Привносите в запит конкретність, використовуйте точні входження фраз, які повинні визначати головну суть пошуку.
  5. Експериментуйте з ключовими словами. Використання ключових слів і словосполучень може допомогти визначити головну суть, і пошукова машина видасть більш релевантний результат.

Так що таке пошукова система - це ні що інше, як можливість знайти необхідну інформацію і зазвичай абсолютно безкоштовно їй скористатися, чогось навчитися, щось зрозуміти або зробити правильний для себе висновок. Багато вже не уявляють свого життя без голосового пошуку, При якому текст не доводиться набирати, свій запит потрібно всього лише вимовити, а пристроєм введення інформації тут є мікрофон. Все це свідчить про постійне розвиток пошукових технологій в інтернеті і необхідності в них.

Пошуковики вважають найпопулярнішими сайтами в інтернеті. Це не дивно, адже для знаходження чогось в мережі, спочатку доводиться користуватися сервісами пошуку.


Їх існує досить багато і навіть не досвідчені користувачі інтернету, знають хоча б 2-3 пошукових системи.

Які є пошукові системи? Хтось знає про одне пошуковику, деяким відомо близько 10 сервісів пошуку, але насправді їх набагато більше.

Звичайно, популярність у них різна, так само як і інтерфейс, і якість результатів. Ми представимо вам список з різних пошукових систем, щоб ви могли їх порівняти.

Популярні пошукові системи

Розроблено сервіси пошуку для різних категорій людей. Найбільш відомі охоплюють країни або навіть весь світ, а менш відомі розраховані на регіони або інтереси користувачів.

Нижче представлено 10 пошукових систем, про які ви зобов'язані знати:

  1. - про це пошуковику знають всі, він найпопулярніший в Росії і надає широкий функціонал своїм користувачам (починаючи з електронних платежів, закінчуючи панеллю для вебмайстрів).
  2. - лідер серед всіх сайтів у світі. Ним користуються люди з усіх країн і вважають найякіснішої пошуковою системою. Як і на Yandex, клієнтам пропонують багато додаткових інструментів.
  3. - пошуково-інформаційна система, з урахуванням російськомовної морфології. У сайту є кілька окремих версій, наприклад, XRambler, через який можна проводити пошук відразу в декількох сервісах.
  4. - за кордоном ця система володіє колосальною популярністю. Вона давно переведена на російську мову, але широкої популярності в Рунеті так і не отримала. Користувачам доступний різний пошук (по картинках, відеороликів і т.д.).
  5. - відома в Рунеті компанія, займається розвитком відразу в декількох напрямках. Крім власного пошуковика і популярного сервісу пошти, вони є власниками таких проектів як Однокласники і Вконтакте.
  6. - створювався як державний ресурс в Росії, але не отримав масового поширення. Через нього можна проводити різні формати пошуку, а також отримувати корисну інформацію.
  7. - розроблена для пошуку інформації в китайському сегменті інтернету. Хто знає, можливо і це вам стане в нагоді. Можна отримувати новини, шукати картинки, музику, отримувати карти і багато іншого.
  8. - проект всім відомої компанії Microsoft. За обсягом трафіку, цей сайт займає друге місце в світовому рейтингу пошукових систем. Працює він з 1998 року і за цей час багато разів модернізувався.
  9. - цим сервісом користуються тільки іноземці. Проект американський і крім пошукової системи, компанія володіє масою інших сайтів і сервісів. Варто зазначити, що у них найбільший каталог посилань на сайти світової павутини.

Якщо в одному з пошукових систем не вдається знайти інформацію, то чому б не пошукати її через інший сайт? Тепер у вас є кілька якісних ресурсів, і ви обов'язково знайдете те, що вам потрібно.

Ще зовсім недавно ерудиція була у великій ціні. Але сьогодні знання всіх світових столиць і дрібних історичних подробиць є абсолютно марним. Замість того щоб напихати свій мозок нікому не потрібними фактами, досить лише знати, які є пошуковики в інтернеті. Все інше вирішить геніальний програмний алгоритм.

Короткий опис пошукових систем

Пошукова система - це програмна система, Яка призначена для пошуку інформації у Всесвітній Павутині. Результати запиту, як правило, представлені у вигляді сторінки видачі, що складається з десятка коротких текстових блоків (сніпетів) в поєднанні з мультимедійним контентом.

Сьогодні налічується близько півтора десятка міжнародних інструментів пошуку даних. Всі вони діють за одним і тим же принципам:

  1. За збір інформації відповідає краулер - робот (простіше - спеціальна програма), Який «повзає» з сайту на сайт і заносить в індекс різні типи даних (зміст сторінки, програмні сценарії, мета-теги та ін.);
  2. Після додавання в індекс, інформація стає доступною для пересічного користувача через інтерфейс пошукового рядка;
  3. Видача на сторінці результатів ранжируется особливим чином. Ключовим показником є релевантність - відповідність початкового запиту.

Як користуватися пошуковою системою?

Розробники цих систем зробили все можливе, щоб працювати з ними міг кожен, навіть дитина. І, треба сказати, їм це вдалося:

  1. Для того щоб звернутися до розуму пошукової машини, досить перейти на її офіційний сайт. Дизайн стартових сторінок може відрізнятися, але рядок для введення тексту обов'язково буде на самому видному місці;
  2. Ще більш простий спосіб - завдання запиту через адресний рядок браузера. Більшість сучасних оглядачів підтримують цю функцію;
  3. Якщо набір тексту в конкретній ситуації важко або взагалі неможливо, можна скористатися функцією голосового введення (запускається після натискання іконки з мікрофоном);
  4. Через частки секунди після звернення система видасть результати;
  5. Для прискорення пошуку можна використовувати логічні оператори. Так, додавання знака «мінус» перед словом виключить його з видачі, знака «плюс» - повідомить пошуковій машині, що дане слово обов'язково повинно бути в шуканому тексті, а словосполучення в лапках запускає пошук по точній фразі;
  6. Якщо знайти потрібну інформацію не вдалося - не біда. Ніхто не заважає скористатися іншою службою. Наведемо огляд головних гравців на цьому ринку.

Огляд ключових сервісів

На рубежі століть практично кожне державі мало свій національний пошуковик. Проте після кількох років конкуренція залишила лише декількох глобальних гравців:

  • Google - незаперечний лідер ринку. На нього припадає левова частка світового пошукового трафіку. У розвинених країнах його частка коливається від 80 до 90%. У Росії успіхи машини не настільки вражаючі: лише 40% частка;
  • Yandex - основний конкурент для Google в Росії, на даний момент займає лідируюче місце, по через зміну пошукового алгоритму у 2017 році поступово став втрачати свої позиції;
  • - займає третє місце в рунеті (близько 5%), пошук від відомої російської компанії, Входить до складу Mail.Ru Group, якій належать соціальні мережі «Вконтакте», «Однокласники», пошуковик Nigma (про нього опишемо нижче), платіжна система Qiwi і багато чого іншого.
  • Bing - служба від компанії «Майкрософт». Кращі результати видає насамперед на англійською. Російськомовний сегмент практично не розвинений. Це, однак, не заважає Bing бути пошукачем № 2 в світі (7%);
  • Далі з невеликим відривом слідує китайська компанія «Байду», Яка обслуговує в основному ринки Східної Азії (Китай і Японія). На Заході і в Росії вона мало відома;
  • Yahoo! - стояла біля витоків сучасної сфери високих технологій, але програла в конкурентній боротьбі. Сьогодні використовує рішення від «Майкрософт»;
  • Nigma - колись популярна пошукова система, заснована російськими програмістами в 2005 році, тепер майже втратила частку трафіку;
  • Duckduckgogo - позиціонує себе як сервіс, дбайливо ставиться до персональних даних користувачів (відсутній збір кешу і персоналізація).

Яндекс: «наше все» в рунеті

Розмова про пошук інформації в мережі був би неповним без згадки ключового гравця на російському ринку - Яндекса. Її засновники Аркадій Волож та Ілля Сегалович запустили спільне підприємство задовго до появи на світло бренду Google. За багато десятків років пошуковик вибився в топ найбільших в світі (№4 з 2014 року).

Основна причина такого феномена полягає в найвищій якості сервісу:

  • Яндекс першим запустив пошук з урахуванням російської морфології. Ця новація дозволила йому в 2001 році обскакати тодішнього гіганта IT-індустрії Рамблера;
  • З 2009 року служба стала враховувати регіон проживання користувача. Завдяки цьому регіональні сайти отримали імпульс до розвитку;
  • У тому ж році був запущений алгоритм машинного навчання «Матрикснет», який значно збільшив швидкість і якість роботи сервісу;
  • Паралельно розвивався англомовний сайт, для якого Яндекс орендував офіс в Каліфорнії;
  • У 2012 році результати запиту стали враховувати персональні переваги конкретного користувача.

Популярність системи постійно зростає: з 2001 по 2017 роки обсяг трафіку збільшився в 280 разів. Але, як ми писали раніше, після кардинальної зміни алгоритму в 2017 році, Яндекс став втрачати частку своїх відвідувачів на користь Гугл, подивитися повну статистику трафіку рунету на поточний момент можна за посиланням.

Як видалити інформацію про себе з пошукової системи?

Інтернет є не тільки благом для всього людства, а й потенційним джерелом загроз. Деякі з них створюють значну небезпеку для персональних даних рядових користувачів. Після потрапляння в мережу навіть самі образливі відомості видалити неможливо.

Так, принаймні, було до недавнього часу. З січня 2016 року у Росії діє закон «Про право на забуття». Тепер кожна людина, якого не влаштовує його репутація в віртуальному світі, Може очистити її цілком легальним способом. Для цього необхідно:

  1. Подати відповідну заяву організацію, яка надає пошукові послуги;
  2. Докласти всіх можливих докази хибності і неактуальність даних, які пропонується вилучити з видачі;
  3. Більшість пошукових систем полегшують завдання користувачам. Надіслати відповідне прохання можна через спеціальну форму онлайн (для Яндекса);
  4. Протягом десяти днів компанія буде перевіряти заяву на наявність законних підстав;
  5. При позитивному результаті інформація підлягає видаленню з індексу;
  6. Якщо підстав для видалення не встановлено, організація повідомляє про це заявника.

Незмінний ведучий програми «Розумники і розумники» Юрій Вяземський в одному з інтерв'ю згадав, як виявив незвичайне слово у Булгакова і намагався знайти його значення. Робота в бібліотеці зайняла цілий рік (!). Сьогодні уявити таку ситуацію неможливо: в інтернеті є безліч пошукових систем. Один клік - і кожен може підключитися до світового розуму.

Відеоогляд анонімних пошукових систем

В даному ролику Антон Морозов розкаже, які існують пошукові системи, що зберігають повну конфіденційність користувача:

Пошукові системи (ПС) вже пристойний час є обов'язковою частиною інтернету. Сьогодні вони величезні і складні механізми, які являють собою не тільки інструмент для знаходження будь-якої необхідної інформації, Але і досить захоплюючі сфери для бізнесу.


Багато користувачів пошуку ніколи не думали про принципи їх роботи, про способи обробки запитів користувачів, про те, як побудовані і функціонують дані системи. Даний матеріал допоможе людям, які займаються оптимізацією і, зрозуміти пристрій і основні функції пошукових машин.

Функції і поняття ПС

Пошукова система - це апаратно-програмний комплекс, який призначений для здійснення функції пошуку в інтернеті, і реагує на користувальницький запит який зазвичай задають у вигляді будь-якої текстової фрази (або точніше пошукового запиту), видачею посилального списку на інформаційні джерела, що здійснюється за релевантністю. Найпоширеніші і великі системи пошуку: Google, Bing, Yahoo, Baidu. У Рунеті - Яндекс, Mail.Ru, Рамблер.

Розглянемо детальніше саме значення запиту для пошуку, взявши для прикладу систему Яндекс.

Запит повинен бути сформульований користувачем в повній відповідності з предметом його пошуку, максимально просто і коротко. Наприклад, ми хочемо знайти інформацію в даному пошуковику: «як вибрати автомобіль для себе». Щоб зробити це, відкриваємо головну сторінку і вводимо запит для пошуку «як вибрати авто». Потім наші функції зводяться до того, щоб зайти за наданими посиланнями на інформаційні джерела в мережі.




Але навіть діючи таким чином, можна і не отримати необхідну нам інформацію. Якщо ми отримали подібний негативний результат, потрібно просто переформувати свій запит, або ж в базі пошуку дійсно немає ніякої корисної інформації по даному виду запиту (таке цілком можливо при заданих «вузьких» параметрів запиту, як, наприклад, «як вибрати автомобіль в Анадир»).

Найголовніша задача кожної пошукової системи - доставити людям саме той вид інформації, який їм потрібен. А привчити користувачів створювати «правильний» вигляд запитів до пошукових систем, тобто фрази, які будуть відповідати їх принципам роботи, практично, неможливо.

Саме тому фахівці-розробники пошукових систем роблять такі принципи і алгоритми їх роботи, які б давали користувачам знаходити цікаві для них відомості. Це означає, що система, повинна «думати» так само, як мислить людина при пошуку необхідної інформації в інтернеті.

Коли він вводить свій запит в пошукову машину, він бажає знайти те, що йому треба, як можна простіше і швидше. Отримавши результат, користувач складає свою оцінку роботі системи, керуючись декількома критеріями. Чи вийшло у нього знайти потрібну інформацію? Якщо немає, то скільки разів йому довелося переформатувати текст запиту, щоб знайти її? Наскільки актуальна інформація була їм отримана? Як швидко пошукова система обробила його запит? Наскільки зручно було надано пошукові результати? Чи був потрібний результат першим, або знаходився на 30-му місці? Скільки «сміття» (непотрібної інформації) було знайдено разом з корисними відомостями? Чи знайдеться актуальна для нього інформація, при використанні ПС, через тиждень, або через місяць?




Для того щоб отримати правильні відповіді на подібні питання, розробники пошуку постійно покращують принципи ранжирування і його алгоритми, додають їм нові можливості і функції і будь-якими засобами намагаються зробити швидше роботу системи.

Основні характеристики пошукових систем

Позначимо головні характеристики пошуку:

Повнота.

Повнота є однією з найголовніших характеристик пошуку, вона являє собою відношення цифри знайдених за запитом інформаційних документів до їх загальної кількості в інтернеті, що відносяться до даному запиту. Наприклад, в мережі є 100 сторінок мають словосполучення «як вибрати авто», а за таким же запитом було відібрано лише 60 із загальної кількості, то в даному випадку повнота пошуку складе 0,6. Зрозуміло, що чим повніше сам пошук, тим більша ймовірність, що користувач знайде саме той документ, який йому необхідний, звичайно, якщо він взагалі існує.

Точність.

Ще одна основна функція пошукової системи - точність. Вона визначає ступінь відповідності запиту користувача знайдених сторінок в Мережі. Наприклад, якщо за ключовою фразою «як вибрати автомобіль» знайдеться сотня документів, в половині з них міститься дане словосполучення, а в інших просто є в наявності такі слова (як грамотно вибрати автомагнітолу, і встановити її в автомобіль »), то пошукова точність дорівнює 50/100 \u003d 0,5.

Чим пошук точніше, тим швидше користувач знайде необхідну йому інформацію, тим менше різноманітного «сміття» буде зустрічатися серед результатів, тим менше знайдених документів будуть не відповідати глузду запиту.

Актуальність.

Це значуща складова пошуку, яку характеризує час, що проходить з моменту опублікування інформації в інтернеті до занесення її в індексну базу пошукової системи.

Наприклад, на наступний день після виникнення інформації про вихід нового iPad, Безліч користувачів звернулася до пошуку з відповідними видами запитів. У більшості випадків інформація про цю новину вже доступна в пошуку, хоча часу з моменту її появи минуло дуже мало. Це відбувається завдяки наявності у великих пошукових систем «швидкої бази», яка оновлюється кілька разів за день.

Швидкість пошуку.

Така функція як швидкість пошуку найтіснішим чином пов'язана з так званої «стійкістю до навантажень». Щомиті до пошуку звертається величезна кількість людей, подібна завантаженість вимагає значного скорочення часу для обробки одного запиту. Тут інтереси, як пошукової системи, так і користувача цілком збігаються: відвідувач хоче отримати результати якнайшвидше, а пошукова система повинна відпрацювати його запит теж максимально швидко, щоб не пригальмувати обробку наступних запитів.

Наочність.

Наочне представлення результатів є найважливішим елементом зручності пошуку. За безлічі запитів пошукова система знаходить тисячі, а в деяких випадках і мільйони різних документів. Внаслідок нечіткості складання ключових фраз для пошуку або його НЕ точності, навіть найперші результати запиту не завжди мають тільки потрібні відомості.

Це означає, що людині часто доводиться здійснювати власний пошук серед наданих результатів. Різноманітні компоненти сторінок видачі ПС допомагають орієнтуватися в пошукових результатах.

Історія розвитку пошукових систем

Коли інтернет тільки почав розвиватися, число його постійних користувачів було невеликим, і обсяг інформації для доступу був порівняно невеликим. В основному доступ до цієї мережі мали лише фахівці науково-дослідних сфер. У той час, завдання знаходження інформації не була настільки актуальна як зараз.

Одним з найперших методів організації широкого доступу до ресурсів інформації стало створення каталогів сайтів, причому посилання на них почали групувати по тематиці. Таким першим проектом став ресурс Yahoo.com, який відкрився навесні 1994. ого року. Згодом коли кількість сайтів в Yahoo-каталозі істотно збільшилася, була додана опція пошуку необхідних відомостей по каталогу. Це ще не було в повній мірі пошуковою системою, так як область такого пошуку була обмежена тільки сайтами, що входять в даний каталог, а не абсолютно всіма ресурсами в інтернеті. Каталоги посилань досить широко використовувалися раніше, проте в даний час, практично в повній мірі втратили свою популярність.

Адже навіть сьогоднішні, величезні за своїми обсягами каталоги мають інформацію про незначно частини сайтів в інтернеті. Найвідоміший і великий каталог в світі має інформацію про п'ять мільйонів сайтів, коли база Google містить інформацію про більш ніж 25 мільярдів сторінок.




Найпершою справжньою пошуковою системою стала WebCrawler, що виникла ще в 1994-му році.

Наступного року з'явилися AltaVista і Lycos. Причому перша була лідером з пошуку інформації дуже тривалий час.




У 1997-му році Сергій Брін разом з Ларрі Пейджем створив машину пошукову Google як дослідницький проект в Стенфордському університеті. Сьогодні саме Google, найбільш затребувана і популярна пошукова система в світі.




У вересні 1997-му році була анонсована (офіційно) ПС Yandex, яка в теперішній момент є найпопулярнішою пошуковою системою в Рунеті.




За даними на вересень 2015 року, Частки пошукових систем в світі розподілені наступним чином:
  • Google - 69,24%;
  • Bing - 12,26%;
  • Yahoo! - 9,19%;
  • Baidu - 6,48%;
  • AOL - 1,11%;
  • Ask - 0,23%;
  • Excite - 0,00%


За даними на грудень 2016 року, Частки пошукових систем в Рунеті:

  • Яндекс - 48,40%
  • Google - 45,10%
  • Search.Mail.ru - 5,70%
  • Rambler - 0,40%
  • Bing - 0,30%
  • Yahoo - 0,10%

Принципи роботи пошукової системи

У Росії головною системою пошуку є Яндекс, потім Google, а потім Поиск@Mail.ru. Всі великі системи пошуку мають свою структуру, яка дуже відрізняється від інших. Але все-таки можна виділити загальні для всіх пошукових систем основні елементи.

Модуль індексування.

Даний компонент складається з трьох програм-роботів:

Spider (По англ. Павук) - програма яка призначена для того щоб завантажувати веб-сторінки. «Павук» викачує певну сторінку, одночасно витягуючи з неї всі посилання. скачується код html практично з кожної сторінки. Для цього роботи використовують HTTP-протоколи.




«Павук» функціонує наступним чином. Робот передає запит на сервер "get / path / document" та інші команди запиту HTTP. У відповідь програма-робот отримує потік тексту, який містить інформацію службового виду і, природно, сам документ.
  • URL скачав сторінки;
  • дата, коли здійснювалося скачування сторінки;
  • заголовок http-відповіді сервера;
  • html-код, «тіла» сторінки.
Crawler ( «Мандрівний» павук). Дана програма автоматично заходить на всі посилання, які знайдені на сторінці, а також виділяє їх. Його завдання - визначитися, куди в подальшому повинен заходити павук, грунтуючись на цих посиланнях або виходячи із заданого списку адрес.

Indexer (Робот-індексатор) - це програма, що аналізує сторінки, які скачали павуки.



Індексатор повністю розбирає сторінку на складові елементи і проводить їх аналіз, застосовуючи свої морфологічні та лексичні види алгоритмів.

Аналіз проводиться над різноманітними частинами сторінки, такими як заголовки, текст, посилання, стильові та структурні особливості, теги html та ін.

Таким чином, модуль індексування дає можливість проходити по посиланнях заданої кількості ресурсів, завантажувати сторінки, витягувати кількість посилань на нові сторінки з отриманих документів і робити детальний їх аналіз.

База даних

База даних (Або індекс пошукача) - комплекс зберігання даних, масив інформації в якому зберігаються певним чином перероблені параметри кожного обробленого модулем індексації та завантаженого документа.

Пошуковий сервер

Це найважливіший елемент всієї системи, тому що від алгоритмів, що лежать в основі її функціональності, прямо залежить швидкість і, звичайно ж, якість пошуку.

Пошуковий сервер працює наступним чином:

  • Запит, який йде від користувача піддається морфологічному аналізу. Інформаційне оточення будь-якого документа, що є в базі, генерується (воно і буде надалі відображатися як сниппет, тобто інформаційне поле тексту відповідного даному запиту).
  • Отримані дані передають як вхідні параметри спеціалізованому модулю ранжирування. Вони обробляються по всіх документах, і в підсумку для кожного такого документа розраховується свій рейтинг, який характеризує релевантність такого документа запиту користувача, і інших складових.
  • Залежно від умов заданих користувачем цей рейтинг цілком може бути відкорегований додатковими.
  • Потім генерується сам сниппет, тобто для будь-якого знайденого документа з відповідної таблиці витягають заголовок, анотацію, найбільш відповідає запиту, і посилання на цей документ, при цьому знайдені словоформи і слова підсвічують.
  • Результати отриманого пошуку передаються яка здійснила його людині у вигляді сторінки, на яку видають пошукові результати (SERP).
Всі ці елементи тісно пов'язані між собою і функціонують, взаємодіючи, утворюючи виразний, але досить непростий механізм функціонування ПС, що вимагає величезних витрат ресурсів.