SEO

Bir arama motoru sıralama sinyalinin değerini tahmin etme

Google kısa bir süre önce çok çeşitli pratik uygulamalara sahip bir patent aldı. Patent, makine öğrenimi ile, değerin bilinmediği sırada bir sıralama sinyal değerini nasıl tahmin edebildiklerini kapsamaktadır.

İnternet'teki büyük miktarda içerik ve günlük olarak daha fazla gelir elde edildiğinde, Google'ın sayfalara değer atamanın bir yolunu bulması gerekir. taranıp dizine alınmamış olsalar bile. Google’ın taramaması durumunda sayfa nasıl sıralanabilir? Google, gelen bağlantılar içermeyen yeni bir içerik parçasını nasıl kullanabilir?

Bu patentteki yöntemler, Google algoritmasının bilinmeyen faktörleri nasıl ele alıp hesaplayabileceğini ve bir sayfanın nerede olduğunu belirlemek için bunları nasıl kullanabileceğini ele almaktadır.

Google'ın kullanabileceği olası uygulamaları ve arama motoru optimizasyonu uzmanları için çözdüğü sorunların bir kısmını (SEO'lar) tartışacağız. Ama başlamadan önce, standart yasal uyarı teklifimi sunmak zorunda hissediyorum.

Bir şey patentli olduğu için, bunun bir algoritmaya dahil olduğu anlamına gelmez. Patentin ya da bölümlerinin, çevremizde gördüklerimizle ve neyin mantıklı olduğuyla kullanılma olasılığını tartmamız gerekir. Başka bir şey yoksa, Google'ın üzerinde çalıştığı konusunda bize bir fikir verir.

Bu patentte belirtilen konu ve yöntemler göz önünde bulundurulduğunda, en azından bazı yinelemelerin kullanımda olduğu ve büyük olasılıkla genişlemesinin muhtemel olduğu söylenebilir. Makine öğrenim sistemleri gelişir.

Patent 20180157758

Şimdi somun ve civataları kazarak başlayalım. Kaynağa ilgi duyuyorsanız, buradaki patentin tamamını bulabilirsiniz, ancak uygulamaları patentten, ne anlama geldiklerini ve nasıl kullanılabileceğini ele alacağım.

Bir patentin resmiyle başlayalım. Bu şimdi mantıklı olmayacak, ancak açıklamalara yardımcı olacaktır:

Yukarıdaki resimde 150 ve 160. maddelere bakın. Bu iki faktör önemlidir ve bu konu hakkında konuşacağız, çünkü makine öğrenimi, SEO'ların yıllardır şikayet ettiği önemli arama sorunlarını çözmek için kullanılır.

Sorun

Tartışacağımız sistem bir çeşitli uygulamalar, patent bölüm 0008'de bir ana konuyu özetlemektedir:

Arama sistemi, kaynakları için arama motoru sıralama sinyallerinin oluşturulmuş değerleri ile kaynakları endeksleyen bir arama motoru dizinini güncelleyebilir ve oluşturulan değerler daha sonra kullanılabilir arama motoru tarafından kaynakları sıralamak. Böylece, arama motoru dizininin eksiksizliği ve sonuç olarak, arama motorunun doğruluğu ve verimliliği artırılabilir.

Temel olarak, önemli bir problem belirlediler: Bilinen bir sıralama sinyali değerinin yokluğunda, orada içerik belirli bir sorgu için en uygun olsa bile içeriği sıralamanın bir yolu değildir.

Bağlantı yokken

Yeni bir içerik parçasının bağlantıları için aşağıdaki basit hesaplamayı düşünelim:

Bağlantı sayısı (sinyal a) = bilinmiyor veya kullanılamıyor
İçeriğin “mavi widget'larla” ilişkisi (sinyal b) = 9.8 / 10
Etki alanı değeri geçti / Dahili PageRank (sinyal c) = 9.2 / 10

Hesaplamaya dayanarak, sayfanın alaka düzeyini biliyoruz ve alan adının sayfaya geçme gücünü biliyoruz; Ancak, bağlantıların sayısını veya ağırlığını bilmeden, Google sayfayı düzgün bir şekilde nasıl sıralayabilir? Google, bir sayfanın kaç tane veya ne tür gelen bağlantılarını bilmediklerini bilseler, herhangi bir sayfayı nasıl sıralayabilir? Link sayısı çarpan olarak kullanan herhangi bir formül veya algoritma sıfırlanır.

Bilinmeyen bir sinyal değeriyle, hiçbir hesaplama doğru olmayabilir ve Google en iyi sonuçları üretemez. SEO'lar olarak, benzer bir sorunumuz var: Bağlantılar olmadan sıralama yapamazsınız ve sorgu için en iyi içeriğe sahip bile olsa, sıralamada olmayan içerikler için bağlantı almak zordur.

Bu patentteki yöntemler, algoritma, onaylanana kadar bir değer öngörme kabiliyetine sahiptir. Bu tahmin faktörü, hızlı test yapılmasını kolaylaştırdığı ve makinede öğrenilen düzeltmelerin uygulanmasını hızlandırdığı için en heyecan verici özellik olabilir.

Patentte çeşitli permütasyonlar tartışılırken, özünde, bir makine öğreniminin eğitimi söz konusu olur. bir sıralama sınaması için olası bir değer üretmek için sistem.

İki indek öyküsü

Patentte belirtilen yöntem iki dizin gerektirir. Bunlar her gün kullandığımız arama dizini ile karıştırılmamalıdır. Niyet, genel dizine uygulanacak olsa da, Google, genel arama dizininden ayrı olarak iki kapalı dizin kullanacaktır.

Örnekleme amacıyla, onlara A endeksi ve B endeksi adını vereceğiz. [19659002] A indeksi için, sıralama sinyalleri değeri, başlangıç ​​noktasını anlamada algoritmayı eğitmek için bilinir ve uygulanır. Algoritma ayrıca sayfalar ve geri bağlantılar verilmiştir. Bir web sayfasının nasıl yapılandırıldığını anlamak için algoritma eğitildikten ve geri bağlantılar gibi ilgili elemanlara uyarlanmışsa, bir değer atanır ve sinyal değerleri daha sonra ikinci indise uygulanır.

B endeksinde sinyal değerleri algoritma tarafından bilinir, fakat makine öğrenim sistemine dahil edilmez. İndeks B, bir faktörün doğru ağırlığını verdikten sonra ve indeks A'nın bilgisine dayanmadığı bir yerde öğrenerek kendini eğitir.

Đşlemin daha da ilginç hale geldiği ikinci indekstedir. sıralama sinyallerine uygulanabilir. B dizinindeki algoritma tek bir sonucu tahmin etmeye çalıştığında, muhtemelen her zaman biraz kapalı olacaktır, ancak birçok sonucu tahmin ederken, tahminler daha doğru olur. “Kalabalığın bilgeliği” fenomeni nedeniyle, B indeksinin kendini düzeltmesine izin verilir (bu, oyundaki öğrenme öğesidir) ve ek sorguları ve öğrendiklerini birleştirerek yapar.

B dizini sistemde ise bir dizi ilgili sorgu için bir sinyal değeri belirleyebilir, bu da ilk sorgu için bilinmeyen değer oluşturulmasına yardımcı olabilir.

Bu neden önemli?

Arama motorlarının nasıl çalıştığını anlamak daha doğru, ama daha doğrudan. Yeni sitelerin ve yeni kaynakların hızla sıralanmasını sağlayacak sistemi anlamak değerlidir.

Yukarıda açıklanan iki endeksli sistem kodlayıcı ve kod çözücülere sahiptir. Kodlayıcılar bir web sayfasını ziyaret eder ve kodlanmış bir temsil oluşturur. Açık bir şekilde, bu durumun arka uçta tam olarak neye benzeyeceğine açık olmamakla birlikte, patentteki varlıklar için yapılan çoklu referanslara dayanarak, muhtemelen sayfa içindeki varlıkların ve dizin içindeki diğer varlıklar ile bilinen ilişkilerin bir haritalaması olabilir. Diğer kaynaklar.

Google, olası sıralama sinyallerini kullanarak yeni kaynakların (sayfalar) sıralanmasına olanak tanıyan bir patent aldı. Aynı patent aynı zamanda diğer mühendisler veya makine öğrenim sistemleri tarafından yeni sinyallerin oluşturulmasını kolaylaştıracak ve genel algoritmanın henüz bir değer atanmamış sayfaları sıralamasına olanak verecektir.

Yeni içerik veya kaynaklara bağlantılara dayalı değerler atanabilir. kullanıcı davranış metrikleri ve elde edecekleri içerik kalitesi. Ya da temel olarak, arama geleceğini tahmin etmenin bir yolunu bulmuşlardır.

Bununla birlikte, daha da çığır açan şey, sistemin makine öğrenim sistemlerine kendi başlarına sinyal üretme yeteneği vermesi için bir yöntem sunmasıdır. İnsanlar artık algoritmaya neyin önemli olduğunu söylememelidir: Makine öğrenimi, sinyallere bir değer bulmak, tanımlamak ve atamak için algoritmayı öğretir.

Bu patenti nasıl kullanabilirsiniz?

Çok azken doğrudan etki etmek için yapabileceğiniz çok az şey vardır. makine öğrenimi, harika içerikler üretmeye ve iyi bağlantıların geliştirilmesini teşvik ederek dolaylı olarak bir fark yaratabilirsiniz.

Sitenizdeki içeriğe bakın ve içerik oluşturan trafik türlerini ve bunların metrikler olduğunu anlayın. Analitik ve arama konsolu araçlarıyla ölçün. IMO, bunlar bir makine öğrenme sisteminin kullanacağı sinyallerdir.

Mevcut içeriğiniz iyi sıralama, bağlantı oluşturma, tıklama ve paylaşımlar içeriyorsa, yeni içeriklerin aynı şeyi yapması beklenebilir.

Analizlerinizi ve geri bağlantılarınızı gözden geçirin. Ne yaptığınızı not edin ve gelecekteki içerik ve bağlantı kurma çabalarına ilham verin. Tersine, neyin iyi gitmediğine dikkat edin. Algoritmanın başarıları not ettiği gibi, başarısızlıklara da dikkat çeker. Sitenizdeki eğilim olumluysa, muhtemelen ödüllendirileceksiniz ve olumsuz ise, bunun tersi doğru olabilir.

Özellikle zamana duyarlı içerikler için hızlı bir şekilde sıralama yapmazsanız, muhtemelen kazanmış olursunuz. Bir sonraki parçayı sıralamak için ihtiyacınız olan sinyalleri almayın.


Bu makalede dile getirilen görüşler, konuk yazarın ve Arama Motoru Arazi’nin değil. Yazarlar burada listelenmiştir.


关于作者

Dave Davies, 2004 yılında Beanstalk İnternet Pazarlama A.Ş.'yi kurdu ve 3 yıldır sektörde çalıştıktan sonra aktif CEO'su oldu. İyi yayınlanmış bir yazardır ve organik SEO konusunda bir favori SMX Advanced de dahil olmak üzere bir dizi konferansta konuşmuştur. Dave düzenli olarak Beanstalk'un blogu üzerine yazıyor ve Arama Motoru Arazisinde aylık katkı sağlıyor.