internet pencereler Android

Yandex, arama motorunun yeni bir sürümünü piyasaya sürdü. Yandex aramanın yeni bir sürümünün lansmanı: nasıldı Yandex'de yeni bir arama türü

Yandex, bilgi arama kalitesini artırmak için kullanıcıları yine yeniliklerle memnun ediyor. Bugün, değişiklikler snippet'leri etkiledi - bir "Daha fazlasını okuyun" düğmesi ve şirketle bir sohbet belirdi. Gelin bu güncellemelere daha yakından bakalım.

Yandex aramanın masaüstü sürümünde, kullanıcının sitenin genişletilmiş bir snippet'ini görmesine yardımcı olan yeni bir “Daha fazla oku” düğmesi belirdi. Butona tıkladığınızda, istekle ilgili açıklayıcı metin görünür.

Daha önce, bu özellik yalnızca mobil cihazlar, şimdi masaüstü sürümünün işlevselliğine dahil edildi Arama Sonuçları devamlılık arzeden bir biçimde.

Yakın geçmişte, bir Yandex parçacığı sınırlı miktarda bilgi gösteriyordu - boşluklu 240 karakter, yaklaşık 3 satır. Çoğu zaman, kullanıcı bu bilgilere yeterince sahip değildi ve ilgilenilen bilgileri aramak için siteye gitme ihtiyacı vardı.

Artık bu butonun eklenmesi ile kullanıcı için bilgi arama süreci birkaç kat daha hızlı hale getirilebilir.

Yeni Yandex snippet'inin görünümü

Yandex snippet'inin daha önce nasıl göründüğü:

Şimdi daraltılmış durumdaki Yandex snippet'i şöyle görünüyor

Bu tür snippet'te mobil versiyon

Mobil düzenlemede uygun görünüm.

Yandex genişletilmiş snippet'inin artıları ve eksileri

Bu bilgilere dayanarak, kullanıcı kaynağın kullanışlılığı hakkında daha bilinçli bir seçim yapabilir. Ve site sahibi için zengin bir snippet, daha fazla hedeflenmiş trafik elde etmek için bir fırsattır. davranışsal faktörler- örneğin, hemen çıkma oranını azaltın ve dönüşüm trafiğini artırın.

Ancak bu fonksiyonun devreye girmesi sitenin arama trafiğini de olumsuz etkileyebilir çünkü bu açıklama kullanıcının siteye gitmeden aradığı bilgiye ulaşması için oldukça yeterli olacaktır.

Öne çıkan snippet'in uzunluğuna gelince, Yandex uzmanları şunları söylüyor:

"İlke şudur: Öne çıkan snippet, mevcut olandan 3 kat daha uzun olamaz". yani maksimum uzunluk Bir snippet şu anda en fazla 9 satır veya 650-700 karakter uzunluğunda olabilir.

Yandex uzmanları, "Genişletilmiş açıklamaların nereden geldiğiyle ilgili olarak, burada normal snippet'lerle aynı kurallar geçerlidir" diye açıklıyor. Arama motoru, kullanıcının isteği doğrultusunda bir snippet oluşturur ve açıklama meta etiketindeki bilgiler yeterli değilse Yandex, bilgileri site sayfasından alır.

Bu makalede Yandex parçacıkları için kurallar hakkında daha fazla bilgi edinebilirsiniz.

Dikkatli olmalısınız, hizmet bilgilerinin genişletilmiş snippet'e girme olasılığı vardır: sayfalandırma düğmelerinden gelen metin, filtreler, sıralama ve daha fazlası, bu nedenle kodda etiketlerle kapatmalısınız..

Yandex arama sonuçlarında jivosite sohbeti

Ayrıca, Yandex snippet'inde bir sohbet belirdi. Yandex, Jivosite ile birlikte arama sonuçları sayfasına bir sohbet ekledi. 26 Nisan 2018'den itibaren müşteriler, Jivosite Chat'in yüklü olduğu bir site için siteye gitmeden desteğe başvurabilir.

Sohbeti bağladıktan sonra şunları yapabileceksiniz:

  • aramada sohbeti etkinleştirin veya devre dışı bırakın;
  • otomatik yanıt ekle;
  • ipuçları ekleyin;
  • simge ekle;
  • kuruluşun çalışma saatlerini belirtin ve sohbetin görüntüleneceği sayfa sayısını sınırlayın.

Sitenize sohbet ekleme talimatları Jivosite hizmetinin resmi web sitesinde sunulmaktadır.

Arama sonuçlarında sohbet görünümü

"Şirketle Sohbet Et" snippet'i masaüstü sürümünde nasıl görünür:

Masaüstü ve mobil sürümler için sohbet başlatmak için farklı simgeler olduğunu lütfen unutmayın.

"Şirketle sohbet et" düğmesine tıkladıktan sonra, doğrudan arama sonuçları sayfasında sitenin desteğiyle iletişim kurmak için bir form görünür.

Aramanın mobil versiyonunda, sohbet penceresi mevcut pencerenin üstünde açılır, ancak yeni bir sekmede açılmaz.

Sohbetin ilginç bir özelliği, Jivosite'nin diğer ucunda sitenin desteğiyle yetkili bir kullanıcının yazışma geçmişinin korunmasıdır.

Mektubu gönderdikten sonra, kullanıcı sohbeti en aza indirme ve ilgilenilen bilgileri aramaya devam etme fırsatına sahiptir:

Site desteği kullanıcıya yanıt verdikten sonra sağda yeni bir mesaj bildirimi görünecektir:

Sohbetin artıları ve eksileri

Bu snippet, kullanıcının kuruluşla iletişimini daha erişilebilir hale getirmenize olanak tanır. Kullanıcı siteye gitmeden alışveriş yapabilecek veya merak ettiği bir soruyu sorabilecek.

Dezavantajı, operatör çevrimiçi değilse ve müşteri bir mesaj gönderdiyse, operatörün mesajı yalnızca müşteri bir dahaki sefere çevrimiçi olduğunda almasıdır.

Ayrıca dezavantajı, arama sonuçları sayfasındaki sohbetin sitenin kendisindeki sohbetle senkronize olmamasıdır. Bir durum düşünün: birkaç gün önce bir kullanıcı siteyi desteklemek için doğrudan arama sonuçlarından yazdı ve bir hafta sonra siteye gitmeye ve sorunuyla ilgili bilgileri sitenin kendisinde netleştirmeye karar verdi. Sonuç olarak, operatör ne olduğunu ve sorunun ne olduğunu anlayamayabilir. Tuhaf bir durum değil mi? Müşteri, sorunu yeniden açıklamak için zaman harcamak zorunda kalacak veya itirazı tekrarlamak istemeyerek iletişimi tamamen sonlandıracaktır. Şu anda bu duruma bir çözüm yok, umalım ki gelecekte Yandex uzmanları Jivosite ile birlikte bir çıkış yolu bulacaktır.

Çözüm

Yandex durmuyor ve sürekli ilginç bir şey buluyor. Bu sefer ekledik kullanışlı özellikler, Yandex'deki snippet'ler yeni bir görünüm ve yeni özellikler kazandı. Bu, arama sonuçlarındaki bilgilerin kalitesini artırmaya yardımcı olacaktır.

Zamanınız yoksa, bu aracı yükleme konusunda yardım için her zaman bizimle iletişime geçebilirsiniz.

Bu hafta, 22 Ağustos, yandex aramanın yeni bir sürümünü başlattı "Korolev" algoritması ile. Bir istek ve bir web sayfasının anlamını eşleştirmesine ve karmaşık ve belirsiz isteklere çok daha doğru bir şekilde yanıt vermesine izin veren bir sinir ağına dayanmaktadır. Öğrenmek için Yeni sürüm milyonlarca kişinin arama, arama istatistikleri ve tahminleri kullanılıyor: sadece geliştiricilerin değil, genel olarak tüm kullanıcıların da sistemin gelişimine katkıda bulunduğu ortaya çıkıyor.
Moskova Planetaryumu'nda sembolik olan "Korolyov" un sunumu gerçekleşti. Sahnede Yandex.Search Başkanı Andrey Styskin, Yandex.Search İlgililik Servisi Başkanı Alexander Safronov ve Yandex.Search Bilgi İşlem Dairesi Başkanı Olga Megorskaya sahne aldı.

Matrixnet'ten sinir ağlarına

Arama motorları, İnternet'in çok küçük olduğu geçen yüzyılın 90'lı yılların ortalarında ortaya çıktı - sadece birkaç bin site. İlk başta, arama motorları, sorguyla eşleşme derecesine göre sıralanmış, sorunsuz bir şekilde belirtilen kelimelerin bulunduğu sayfaların bir listesini derledi. Sorgudaki kelimeler belgede ne kadar sık ​​görünürse o kadar iyidir. Küresel ağın mevcut durumu ile bunun artık işe yaramayacağı açıktır.

Yandex, istekleri işlemek için Matrixnet'i buldu - yazarın sıralama formülünü oluşturmak için kullanılan bir makine öğrenme yöntemi. Ancak, arama kelimelere dayanmaya devam etti. Peki ya kullanıcıların alegorik veya çağrışımsal olarak formüle ettiği sorgular? O zaman aradığınız web sayfasının kesinlikle sorgudaki tüm kelimeleri içermesi gerekmez. Ama bunu bir makineye nasıl açıklarsınız? Keşke bizi insan olarak anlasaydı...




Sonunda, bilim adamları teknoloji ve biyolojinin kesiştiği noktada bir şey buldular - yapay sinir ağı(INS). Wikipedia'nın ifadesine göre, bu "biyolojik sinir ağlarının - canlı bir organizmanın sinir hücrelerinin ağlarının - organizasyonu ve işleyişi ilkesine dayanan bir matematiksel model ve bunun yazılım veya donanım uygulamasıdır." Sinir ağları, bizim yaptığımız gibi bilgiyi işleyebilir ve en önemlisi, canlılar gibi becerileri öğrenip geliştirebilir. Aslında, görünümü zaman meselesi olan tam teşekküllü bir yapay zekanın temelidir.

Geçen yıl Yandex, bir sinir ağına dayalı Palekh arama algoritmasını tanıttı. Genellikle sadece insanlar için mümkün olan problemleri çözmede mükemmel sonuçlar gösterdi: konuşmaları ve görüntülerdeki nesneleri tanıma konusunda mükemmel bir iş çıkardı. "Palekh", arama sorgularını ve web sayfası başlıklarını sayı gruplarına - anlamsal vektörlere dönüştürmeyi öğrendi. Önemli özellikleri, vektörlerin birbirleriyle karşılaştırılabilmesidir: benzerlik ne kadar güçlü olursa, sorgu ve başlık anlam bakımından o kadar yakın olur.




"Krallar". kim anlar

Sinir ağlarına dayalı bir arama motorunun geliştirilmesindeki bir sonraki adım, yalnızca başlığı değil tüm sayfayı analiz eden Korolev algoritmasıydı! Aramanın sorgu ile anlam olarak karşılaştırdığı sayfa sayısı 150'den 200.000'e çıktı. Korolev, diğer şeylerin yanı sıra, insanların aradıkları sayfaya gittikleri diğer isteklerin anlamını da dikkate almaya başladı.

Sinir ağı bir çocuk gibi öğrenir. Bunda ustalaşmak için çok sayıda örneğe ihtiyacı vardı. Aslında, hizmetin tüm kullanıcıları bir şekilde Korolev'in spontan eğitimiyle meşguldü: arama istatistikleri ve milyonlarca insanın tahminleri kullanıldı. Yandex, giderek anlamsal bağlantıları giderek daha doğru bir şekilde tanımayı öğreniyor, örneğin: [gökyüzünün kıvrıldığı bir resim] bir Van Gogh tablosu hakkında, [tembel bir kedi]
Moğolistan'dan] - manul.


Arama çok karmaşık bir sistemdir. Binlerce mühendis, bir insanı anlaması ve sorunlarının çözülmesine yardımcı olması için çalışıyor. Korolyov'da makine zekası ile milyonlarca insanın çabalarını birleştirdik. Kullanıcılarımız, sorular sorarak ve algoritmalarımızı eğitmeye yardımcı olarak bizimle aramayı iyileştiriyor.
Andrey Styskin, Yandex Arama Başkanı.
Günlük rutini analiz etmenin yanı sıra, arama motorunu eğitmek, yanıtların kalitesinin değerlendirilmesini gerektirir. Sistem ne kadar karmaşıksa, o kadar fazla değerlendirme gerekir. Daha önce nispeten küçük bir uzman değerlendirici grubu olan Yandex ekibinin üyeleri arama kalitesini değerlendirmekle meşgulse, şimdi hacmi ciddi şekilde artırmak gerekiyordu. Hizmet böyle ortaya çıktı. Yandex.Toloki(toloka, bir zamanlar köylüler tarafından uygulanan bir karşılıklı yardım şeklidir). Küçük bir ödülle ve elbette önemli bir şeye ait olma duygusuyla ilgilenen herhangi bir meraklı, basit görevleri yerine getirebilir. Şimdi bu tür toloker'lara sahip bir milyondan fazla insan var ve verdikleri puan sayısı 2 milyarı aştı.




"Dayalı modern arama karmaşık algoritmalardır. Algoritmalar geliştiriciler tarafından icat edilir ve milyonlarca Yandex kullanıcısı tarafından öğretilir. Herhangi bir istek, makinenin insanları daha iyi anlamasına yardımcı olan anonim bir sinyaldir. Bu nedenle, yeni arama birlikte yaptığımız aramadır dersek yanılmış olmayız.

Yandex.Toloka'nın iki yılı aşkın geçmişinde en üretken ve çalışkan katılımcı belirlendi. Chelyabinsk'ten Ilya Mikhalenko oldular. Adam, arama motoru ekibinin elinden hak edilmiş bir ödül almak için Moskova'daki "Korolev" sunumuna geldi.




Eylemde yeni arama

Yandex'imizin çalışmasını iyileştirmenin pratik yolu nedir? Artık onunla neredeyse zeki ve bilgili bir arkadaş gibi konuşabilirsiniz. (Bir sesle bile olsa.) Mesela bir pasajını hatırladığınız bir filmin adını hatırlamanız gerekse de oyuncu ve yönetmen isimleri kafanızdan uçup gitse ne yaparsınız? Bazı tematik forumlarda arkadaşlarınıza dönebilir veya yardım isteyebilirsiniz. Ve "Kraliçe" ye sorabilirsiniz!

Görsel arama büyük ölçüde iyileştirildi. Onlarla, kural olarak, her zaman bir tür “cehennem” vardır: arama motoru, ya sorgudaki kelimelerin kullanıldığı tüm görüntüleri düşüncesizce verir ya da makalenin metnini dikkate alır. resim anlatmaktadır. Ruhun belirsiz ihtiyaçlarını karşılayacak bir şey arıyorsanız, hayal kırıklığına uğramaya hazır olun. "Korolev", resimde gösterilenleri tam olarak analiz eder, bu nedenle önemsiz olmayan bir yaklaşımla memnun edebilir.






Örnek olarak, testler en belirgin istek değildi - [uzayda bir kedi]. Köpekler oldukça sık yörüngedeydiler, ancak bıyıklı çizgili disiplinli uzay fatihleri ​​işe yaramadı. Kesin olarak bilinen tek bir girişim var: 1963'te Fransızlar kedi Felicette'i yörünge altı uçuşa fırlattı. Romantik, ama miyop, - bilim adamları iniş kapsülünün kapağını açar açmaz, karanlık böyleydi. Fotoğraf oturumu gerçekleşmedi.

Talep üzerine, arama motoru sadece uzay giysili küçük hayvanları ve gerçeküstü foto-kurbağaları değil, aynı zamanda bir kedinin fotoğrafını da verir. çamaşır makinesi bir uzay gemisinin kapağına oldukça benzer. Ama bu açıklamada belirtilmemiş.

Yeni arama motorunun ciddi lansmanı için tüm Yandex.Search ekibi sahne aldı. Küçük geri sayım ve... Hadi gidelim! Artık herkes anlayışlı "Kraliçe"nin yeteneklerini deneyimleyebilir. Ana şey, mevcut yeteneklerinin statik olmaması, ancak sürekli gelişme halinde olmasıdır.

Akşamı bitirmek için organizatörler tamamen beklenmedik bir şey hazırladılar - yörüngeden gerçek astronotlarla bir iletişim oturumu. Uzayla ilgili popüler arama motoru kullanıcı sorgularından bazılarına kişisel olarak yanıt verdiler ve orada bulunanlardan gelen soruları yanıtladılar.

Yandex blogunda ve Habre'de yeni algoritmanın yararları ve zararları hakkında yüzlerce yorum ortaya çıkarken, asıl şey hakkında konuşacağız: kullanıcılar için ne anlama geldiği, yeni aramanın nasıl etkinleştirileceği ve aslında neyin değiştiği.

Yeni bir arama olarak "Korolev"

Konuya fazla dalmayan kullanıcıların Korolev algoritması hakkında bilmesi gereken en önemli şey akıllı olmasıdır. Şöyle tanıtıldı: "Korolev, sizi anlayan bir makine zekasıdır." Arama, özel olarak eğitilmiş bir sinir ağı üzerine inşa edildi. Artık kelime değil, anlam arıyor. Geliştiriciler, "Bu sayede arama, kullanıcının tam olarak neye ihtiyacı olduğunu anlıyor ve zor soruları daha da doğru bir şekilde yanıtlıyor" diyor.

Örneğin, "Darth Vader bu müziğe görünüyor" sorgusunu girerseniz - arama önce "Imperial March"ı dinlemenizi önerir. Ve aynı zamanda Star Wars karakteri hakkında bilgi verecek. mantıklı mı? Epeyce. “Yaşlı bir adamın iş bulmak için çalışmaya geldiği bir film” sorulduğunda, ilk yanıt The Intern filminin incelemesine bir bağlantıdır. O ima edildi. Ne de olsa, ne yılı ne de oyuncuları hatırlamak, hatta istek için kelimeleri ve sıralarını seçmek zorunda değildim.

Aynı şey görsel arama için de geçerlidir. Daha önce tarafından gerçekleştirildiyse anahtar kelimeler Açıklamadan resimlere, şimdi algoritma görüntünün kendisini analiz ediyor. Bu nedenle, "uzayda kedi" sorgusunu girerseniz - sadece bu konuyla ilgili komik yaratıcı çalışmalar değil, aynı zamanda örneğin bir kedi de gösterilecektir. çamaşır makinesi. Sırf anlam olarak benzer tüm bileşenler olduğu için: kedi mevcut, kapı bir lomboz gibi görünüyor ve gövde bir roket gibi görünüyor.

Geçen yıl Yandex, Palekh algoritmasını tanıtarak anlam arama yolunda ilk adımı attı. İsteğin anlamını ve web sayfasının başlığını eşleştirebildi. Korolev sadece başlığı değil, tüm sayfayı analiz ediyor. Aramanın sorguyla anlam olarak karşılaştırdığı sayfa sayısı 150 belgeden 200.000 sayfaya çıktı. "Kraliçe" nin bir başka özelliği: İnsanların sayfaya gittiği diğer isteklerin anlamını da dikkate alır.

Yandex neden benim yardımımla yaptığını söylüyor?

Yandex'de yaptığımız her şey: hangi istekleri sorduğumuz, hangi sayfalara gittiğimiz, oyalandığımız veya ayrıldığımız (çünkü doğru olanı bulamadığımız için) - şu anda dikkate alınır. arama istatistikleri. Bir istek girdiyseniz, arama sonuçlarındaki bağlantıyı takip ettiyseniz ve sayfada bir süre oyalandıysanız, muhtemelen ihtiyacınız olan bilgiyi buldunuz ve okudunuz. Milyonlarca kullanıcının davranışına ilişkin veriler, sinir ağının, istek ve bulunan sayfanın anlamsal yakınlığını anlamayı öğrenmesine yardımcı olur.

Tepkilerin kalitesini dikkate almayı öğrenmek de önemlidir. Daha önce, "Yandex", uzmanların - değerlendiricilerin yardımıyla aramanın kalitesini değerlendiriyordu. Artık gönüllülerin değerlendirmeleri - Yandex.Toloka kullanıcıları da dikkate alınmaktadır. Bu, herkesin görevleri tamamlayabileceği, aramayı iyileştirmeye yardımcı olabileceği ve bunun için bir ödül alabileceği bir hizmettir.

Yeni aramayı kullanmaya nasıl başlarım?

Sizden özel bir şey gerekmiyor. Yeni arama bir şekilde kendi kendine çalışacaktır. Ancak neler olup bittiğini araştırmak istiyorsanız - ana "Yandex" e gidin, "yıldızlı gökyüzüne" gidin ve "Başlat" a tıklayın. Bu şekilde kendi arama davranışınızı öğrenirsiniz ve her şeyin nasıl çalıştığını açıklayan "Korolev" hakkında bir video izleyebilirsiniz. Ayrıca arama çubuğunun solundaki Yandex logosuna tıklayarak güzel ve anlaşılır bir sunum görebilirsiniz.

Neden "anlamsal" sorgular her zaman çalışmıyor?

Doğal olarak, her şeyden önce, sinir ağı popüler istekleri algılamayı öğrenir - örneğin filmler veya müzik hakkında. Arama motorunun en fazla veriye sahip olduğu bu tür isteklerle ilgilidir, bunlar tarafından belirlenir. Büyük sayı insanların. “Korolev” ayrıca belirli bir şey öğrenebilecek, ancak bu biraz sonra olacak - analiz için gerekli bilgiler toplandığında.

Tam sunum


Yandex, aramanın yeni bir sürümünü başlattı. "Korolev" arama algoritmasına dayanmaktadır. Algoritma, isteklerin ve web sayfalarının anlamını eşleştirmek için bir sinir ağı kullanır - bu, Yandex'in daha doğru yanıt vermesini sağlar. karmaşık sorgular. Aramanın yeni sürümünü eğitmek için milyonlarca kişiden gelen arama istatistikleri ve derecelendirmeleri kullanılır. Böylece sadece geliştiriciler değil, tüm Yandex kullanıcıları da aramanın geliştirilmesine katkıda bulunur.

kelimeler ve anlamları

Aramanın bugünü ve geleceği hakkında konuşmadan önce geçmişini hatırlayalım. Birinci arama motorları 1990'ların ortalarında, İnternet çok küçükken ortaya çıktı - sitelerin sayısı binleri aştı. Bir kişinin doğru olanı bulmasına yardımcı olmak için, arama sorgusundan kelimelerin bulunduğu web sayfalarının bir listesini yapmak yeterliydi. Karmaşık sıralamadan söz edilmedi - yani, sayfaları talebe uygunluk derecesine göre sıralamak. Sorgudaki kelimeler belgede ne kadar sık ​​​​bulunursa, o kadar iyi uyduğuna inanılıyordu.

İnternet hızla büyüdü ve ek seçim kriterlerine ihtiyaç duyuldu. Arama motorları, belgelere verilen bağlantıları dikkate almaya başladı, talebin geldiği bölgeyi belirlemeyi öğrendi ve kullanıcı davranışlarına dikkat etmeye başladı.

Bir noktada, o kadar çok sıralama faktörü vardı - bir sayfanın bir isteğe ne kadar iyi yanıt verdiğini belirleyebileceğiniz işaretler - hepsini talimat biçiminde yazmanın imkansız olduğu ortaya çıktı. Makineye kendi başına karar vermeyi öğretmek daha iyidir: hangi özelliklerin kullanılacağı ve bunların nasıl birleştirileceği. Yandex bu amaçlar için Matrixnet'i ortaya çıkarmıştır. Bu, sıralama formülümüzü oluşturan makine öğrenimi yöntemidir.

Ancak arama yine de kelimelere dayanır. Karmaşık bir sıralama formülünü başlatmadan önce, arama motorları, sorgudaki kelimeleri içeren "önceden nitelikli" web sayfalarının bir listesini derler. Biz insanlar, aynı anlamın farklı kelimelerle ifade edilebileceğini anlıyoruz. Bir web sayfası, bir sorgudaki tüm kelimeleri içermeyebilir, ancak yine de ona çok iyi yanıt verir. Ancak bunu bir makineye açıklamak oldukça zordur.

Yandex, geçen yıl şirketin Palekh arama algoritmasını tanıtmasıyla anlam arama yolunda ilk adımı atmıştı. Bir sinir ağına dayanır. Sinir ağları, insanların geleneksel olarak üstesinden geldiği görevlerde mükemmel sonuçlar gösteriyor. daha iyi arabalar: diyelim ki, görüntülerdeki konuşmayı veya nesneleri tanımak.

Şirket, Palekh'i piyasaya sürerek, sinir ağına arama sorgularını ve web sayfası başlıklarını sayı gruplarına - anlamsal vektörlere dönüştürmeyi öğretti. Bu tür vektörlerin önemli bir özelliği, birbirleriyle karşılaştırılabilmeleridir: benzerlik ne kadar güçlü olursa, istek ve başlık birbirine anlam olarak o kadar yakındır.

Korolev algoritması nasıl çalışır?

Korolev arama algoritması, yalnızca başlıklarını değil, arama sorgularının anlam vektörlerini ve tüm web sayfalarını karşılaştırır. Bu, yeni bir anlam anlayışı düzeyine erişmenizi sağlar. Leo Tolstoy'un Savaş ve Barış romanını ilk duyduğunuzu hayal edin. Tabii ki, başlığı anlamlandırabilirsiniz - örneğin, kitapta birçok savaş sahnesi olduğunu önerin. Ancak arsanın tüm inceliklerini öğrenmek ve romanla ilgili sorulara kapsamlı cevaplar vermek için tamamını okumanız gerekecek.

Palekh örneğinde olduğu gibi, web sayfalarının metinleri bir sinir ağı tarafından anlamsal vektörlere dönüştürülür. Bu işlem çok fazla bilgi işlem kaynağı gerektirir. Karşılaştırın: Bir kitabın başlığını okumanız birkaç saniyenizi alacaktır, ancak baştan sona okumanız saatler, günler hatta haftalar alacaktır. Bu nedenle, Korolev sayfa vektörlerini gerçek zamanlı olarak değil, önceden indeksleme aşamasında hesaplar. Bir kişi bir istekte bulunduğunda, algoritma istek vektörünü zaten bildiği sayfa vektörleriyle karşılaştırır.

Böyle bir şema, sıralamanın ilk aşamalarında sorguyla anlam bakımından eşleşen web sayfalarının seçimine başlamanıza olanak tanır. Palekh'te semantik analiz son aşamalardan biridir: sadece 150 belge geçer. Korolev'de 200 bin belge için üretildi - yani bin kattan fazla. Ek olarak, yeni algoritma yalnızca bir web sayfasının metnini metinle karşılaştırmakla kalmaz. arama sorgusu, aynı zamanda insanların bu sayfaya geldiği diğer isteklere de dikkat çekiyor. Bu şekilde ek anlamsal bağlantılar kurulabilir.

İnsanlar makineleri öğretiyor

Yandex, makine öğreniminin ve özellikle sinir ağlarının kullanımının er ya da geç aramayı insan düzeyinde anlamlarla çalışmayı öğreteceğine inanıyor. Ancak insanların yardımı olmadan bu mümkün değildir. Bir makinenin belirli bir sorunu nasıl çözeceğini anlaması için, ona çok sayıda örnek göstermesi gerekir: olumlu ve olumsuz. Bu tür örnekler Yandex kullanıcıları tarafından verilmektedir.

Korolev algoritması tarafından kullanılan sinir ağı, kişisel olmayan arama istatistikleri konusunda eğitilmiştir. İstatistik toplama sistemleri, kullanıcıların belirli sorgular için hangi sayfalara gittiklerini ve orada ne kadar zaman harcadıklarını dikkate alır. Bir kişi bir web sayfası açtıysa ve orada uzun süre "takıldıysa", muhtemelen aradığını bulmuştur - yani, sayfa isteğine iyi yanıt verir. Bu olumlu bir örnek. Olumsuz örnekleri toplamak çok daha kolaydır: sadece bir istek ve herhangi bir rastgele web sayfası alın.

Sıralama formülü oluşturan Matrixnet'in de insanların yardımına ihtiyacı var. Aramanın gelişmesi için, insanların çalışmalarını sürekli olarak değerlendirmesi gerekir. Bir zamanlar, yalnızca değerlendiriciler olarak adlandırılan Yandex çalışanları derecelendirme ile meşguldü. Ancak ne kadar çok puan o kadar iyi - bu yüzden herkesi buna dahil etmeye karar verdik ve Yandex.Toloka hizmetini başlattık. Şimdi orada bir milyondan fazla kullanıcı kayıtlı: arama kalitesini analiz ediyorlar ve diğer Yandex hizmetlerinin iyileştirilmesine katılıyorlar. Toloka'daki görevler ödenir - kazanılabilecek miktar, görevin yanında belirtilir. Hizmetin varlığının iki yıldan fazla bir süredir, tolokers yaklaşık iki milyar puan verdi.

Modern arama, karmaşık algoritmalara dayanmaktadır. Algoritmalar geliştiriciler tarafından icat edilir ve milyonlarca Yandex kullanıcısı tarafından öğretilir. Herhangi bir istek, makinenin insanları daha iyi anlamasına yardımcı olan anonim bir sinyaldir. Bu nedenle Yandex, yeni bir arama, birlikte yaptığımız bir aramadır derse yanılmaz.