Top Menü

25 Mayıs 2015 Pazartesi

Google Nasıl Çalışır?

Hiç merak ettiniz mi bilmiyorum, bize uzun zamandır hizmet veren Google arama motoru nasıl çalışır, bu hizmeti verebilmek için ne gibi kaynaklar kullanır?

Şahsen benim konuyla ilgili az çok bir fikrim vardı, ama bu yazıyı hazırlarken bilgilerimi de güncelleme şansım oldu.

Google nasıl çalışır?

Google sistemi dünya üzerinde belli noktalarda bulunan onbinlerce demek eksik olur,  bir kaç milyon düşük maliyetli bilgisayar üzerinde çalışır. Google üç farklı kısımdan oluşur:

* Googlebot diye adlandırılan web sayfalarını bulup getiren web gezgini.
* Her sayfanın üzerindeki her kelimeyi sınıflandıran ve sonucu muazzam bir veritabanına saklıyan dizinleyici (indexer).
* Son olarak da sizin arama sorgunuzu dizinle karşılaştırıp sonucunda en ilgili dokümanları öneren sorgu işlemcisi (query processor).

Şimdi tüm bu kısımları daha yakından inceleyelim.

1. Googlebot, Google'ın web gezgini.

Googlebot Google'ın sayfaları bulup dizinleyiciye ileten web gezginidir. Googlebot'u oradan oraya koşuşturan minik bir örümcek olarak da hayal edebilirsiniz, ama gerçekte öyle dolaşmaz. Sizin web tarayıcınız gibi çalışır, bir sunucuya ulaşır ve önüne gelen web sayfalarını Google dizinleyicisine aktarır. Fakat tarayıcınızdan çok daha hızlı ve etkin biçimde binlerce değişik sayfayı aynı anda işleyebilir.

Googlebot sayfaları iki şekilde bulabilir: ya https://www.google.com/webmasters/tools/submit-url buradan web sayfanızı bildireceksiniz yada diğer web sitelerindeki bağlantıları takip ederek web sayfanıza ulaşacak.

2. Google'ın dizinleyicisi (Indexer)

Googlebot dizinleyiciye bulduğu sayfalardaki tüm metni aktarır. Bu sayfalar Google'ın dizin veritabanında saklanır. Arama teriminin görüntülendiği dokümanların (web sayfalarının) saklandığı her bir dizin girişi arama terimine göre alfabetik olarak sınıflandırılır. Bu veri yapısı sorgulama terimlerini barındıran dokümanlara çok hızlı biçimde erişilmesini sağlar.

3. Google'ın Sorgu İşlemcisi (Query Processor)

Sorgu işlemcisi, kullanıcı ara yüzü (arama kutusu), sorgulamaları değerlendirip ilgili sayfalara yönlendiren "motor" ve sonuç biçimlendiricisi kısımlarından oluşur.

Google'ın sayfaları derecelendirdiği sisteme PageRank denilir. PageRank değeri yüksek olan sayfa daha diğerlerine göre daha önemli kabul edilip daha yüksek sıralama verilir.

PageRank hesaplamasında Google yüzden fazla faktörü değerlendirip  hangi dokümanın sorgulamayla ilgili en uygun olduğuna karar verir.

Google bir sorgulamayı nasıl işler?

1. Önce www.google.com da arama kutusuna sorgulayacağınız terimi yazarsınız.
2. Sorgunuz web sunucusundan dizin sunucusuna iletilir. Index sunucusunun içeriği bir kitabın "İçindekiler" sayfalarındaki dizin gibidir ve hangi sayfaların sorguyla eşleşen kelimeleri bulundurduğunu söyler.
3. Sorgu buradan doküman (sayfa) sunucularına gider ve orada kayıtlı dokümanları alır arama sonuçlarında sıralanan snippet dediğimiz tarifleri oluşturur
4. Neredeyse milisaniye ile açıklanacak bir süratle sonuçlar kullanıcının ekranına iletilir.

Google Veri Merkezlerinden birini tanıtan kısa videoyu aşağıda izleyebilirsiniz.



25.05.2015, İzmit


Hiç yorum yok: