Arama Motorları | SuAygırı.Com

Arama Motorları Nasıl Çalışır

Yazan: Sinan Taga

Arama MotorlarıInternet’te çoğu zaman her konuda son derece güzel içerikler mevcut. Ama problem bunları bulmak. Dolayısı ile Internet’tebir şey aradığımız zaman hemen arama motorlarına dönüyoruz. Peki ama bu arama motorları nasıl çaılışıyorlar. Bende bunu merak ettim. Daha sonra öğrendiklerimi paylaşmak iyi br fikir olabilir diyerek bir yazı halinde buraya yazdım.

İlk önce belirtmek lazım ki başlıca iki tür arama motoru var. Bunlardan ilk grup insanlar tarafından oluşturulanlar. Bunların başında DMOZ geliyor (Wikia’da başka bir örnek). Belki de bunlara bir arama motoru demektense birer dizin demek daha doğru olabilir.

Diğer kısım ise bizi asıl ilgilendiren arama motorlarının olduğu kısım. Yani başını Google’ın çektiği otomatik arama motorları. Dolayısı ile bu yazıda bundan sonra arama motoru kelimeleri kullanıldığı zaman bunlardan bahsediyor olacağım.

Devamı için tıklayın

Wordpress Arama Motoru Robotlarını İzleme Eklentisi

Yazan: Sinan Taga

Crawl Rate Tracker Plugin GraphBir web sitesi olanlar için sitelerinin ne durumda olduğunu merak etmek çok doğal. Son zamanlarda özellikle arama motorları ve arama motorlarının robotlarının (veya örümceklerinin) daha çok yerde çıkması ile bu robotları takip etmek ve ona göre işlemler yapmak çok moda oldu. Özellikle blog sahipleri arasında SEO dediğimiz, Arama Motoru Optimizasyonu çok popüler bir konu. Bunun en büyük sebeplerinden biri de blogların ve özellikle Wordpress gibi yayın araçlarını bu konulara çok uygun tasarlanmış olması.

Crawl Rate Tracker PluginArama motoru örümceklerine gelince, bu konu ile ilgili herkes bilir ki, bu küçük otomatik programlar İnternet’te o site senin bu site benim diyerek hiç yorulmadan bir bağlantıdan diğerine her yeri gezerler. Bu gezdikleri sayfaları da arama motorları indesklerler. Bir sayfanın bir örümcek tarafından ne kadar sıklıkla ziyaret edildiği genel olarak o bağlantıya arama motorunun ne kadar önem verdiğini gösterir.

Crawl Rate Tracker Plugin detayEğer bu bot denen robot programcıkların blogunuzu ne kadar sıklıkla ve nerelerini ziyaret ettiklerini görmek istiyorsanız. Crawl Rate Tracker adlı Wordpress eklentisini kurarak tek bir adımla güzel bir grafiğe ve ayrıntılı bir rapora sahip olabilirsiniz. Bu tarama oranlarını takip etmek şunun için yararlı, genel olarak bir sayfa bir örümcek tarafından ne kadar sık olarak ziyaret ediliyorsa arama motoru bu sayfaya o kadar güveniyor demektir.

Crawl Rate Tracker şu an için sadece üç büyük arama motoruna ait örümcekleri raporluyor. Google’ın Googlebot’u, MSN Live’ın MSNbot’u ve Yahoo!’nun Slurp’ü bu eklenti ile takip edilen üç örümcek. Eklenti sayesinde hangi örümceğin hangi sayfayı kaç kez ve ne zamanlarda ziyaret ettiğini görebiliyorsunuz.

Buradan indirebilirsiniz.

Örümcekleri yakalamak

Yazan: Sinan Taga

Internet ÖrümcekleriBir blogunuz varsa ve/veya içerik üreten herhangi bir siteye sahipseniz bu siteniz büyük ihtimalle örümcekler (bot) tarafından ziyaret ediliyordur. Özellikle arama motorları sayfalarınız indekslemek için bu yöntemi kullanıyorlar. Örnek olarak Google’ın örümceği Googlebot periyodik olarak sitenizi ziyaret ediyordur. Bu aslında iyi bir şey. Bu örümceklere yardımcı olmak amacı ile de robots.txt adlı bir dosya kullanılır. Bu dosya kısaca hangi örümceklerin sitede nerelere girmeye ve neleri okumaya veya indekslemeye izinleri olduğunu belirtir. Genelde örümcekler bu sınırlamalara saygı gösterirler. Bütün büyük arama motorlarının örümcekleride bunlara dahil. (Sonradan öğrendim ki MSN hariç. Büyük süpriz!)

Fakat bir örümcek yazmanın çok da zor olmadığı bu zamanlarda etrafta bir sürü kötü huylu örümcek de dolaşıyor. Sitenize gelen bu kötü huylu örümceklerin nedeni büyük ihtimalle ya spam yorumlar ya da içeriğinizi çalmaktır. Ve tahmin edersiniz ki bu kötü örümcekler robots.txt dosyanızı pek takmazlar. Bu benim de başıma geldi hem suaygiri.com’da hem de kişisel sitemde yayınladığım içerikler başka yerlerde ortaya çıkıyordu. İlk önce bunun bir kopyala yapıştır sorunu olduğunu düşündüm. Olabilir de. Ama bazı siteler o kadar fazla çalıntı içeriğe sahip ki bunun sadece kopyala - yapıştır ile olması çok zor gibi gözüküyor. Daha sonra Internet’te content scraping (içerik kazımak) ilgili bir yazı ile karşılaştım. O zaman dank etti. :)

Ufak bir betik ile bu örümcekleri yakalayıp IP veya “user-agent” sınırlaması ile uzak tutmak mümkün olabilir. Burada bir örneği mevcut.

Çözümün devamı için tıklayın.

Google Knol. Acaba Google fazla mı ileri gidiyor?

Yazan: Sinan Taga

Google Knol’dan bir ekran görüntüsüGoogle geçtiğimiz günlerde yeni projesi olan Knol kod adlı bilgi portalını açıkladı. Knol ismi İngilizce “knowlegde” dan geliyor. Google bu bilgi portalını yetkili ve ilgili bir içerik ile doldurmayı planlıyor. Şu an için Knol sadece davetli kapalı beta aşamasında. Yani sadece davetli kişiler Google’ın yeni ürününü deniyebiliyorlar.

Knol’un amacı bilimden, tarihe, basit gerçeklerden tıbbi konulara kadar insanın aklına gelebilecek her türlü konuda bilgi sağlmak. Yani Wikipedia‘nın yaptığından çok da farklı bir şey değil.

Yani kısacası Knol herkesin girip kendi yazılarını yazabileği bir platform. Fakat Google yazılan yazılara hiç bir şekilde karışmayacağını söylüyor. Peki bu yazıların yetkili ve güvenilir olmasını nasıl sağlayacak? Bu konuda Google’ın düşüncesi yazıyı yazanların kendi itibarlarını ortaya koydukları için kaliteyi artıracakları yönünde. Bu yüzden de anonim girdiler olmayacağı söyleniyor.

Örnek verecek olursak ben kutup ayıları hakkında bir yazı yazıyorum. Yazının popülaritesini ve doğruluğunu ise kullanıcar belirliyor. Ama bir başkası da gelip kutup ayıları hakkında kendi yazısını yazıyor. Bu şekilde iki yazar aynı içerik için rekabet halindeler. Ama bir kontrol mekanizmasının olmaması bunun saçma sapan ve güvenilmez yazılarla dolu bir portal haline gelme tehlikesini de arttırıyor. Google’ın bu stratejisinin işe yarayıp yaramayacağını zaman gösterecek.

Burada asıl problem Google’ın el attığı başka iş alanı olmasında yatıyor. Google içerikleri indeksleyen ve bunları bir şekilde sıralayarak kullanıcılara sunan bir servis. Ama yavaş yavaş içerikleri de üreten bir firma haline geliyor. Gösterilen içeriği kontrol eden bir firmanın içerik üretmesinde yatan sorunlar yeterince açık.

İlk başlarda Google çok doğru ve hızlı arama sonuçları ile herkesi cezbetti. Daha sonra sponsorlu bağlantılar ve devamı geldi. Google bu şekilde kendi içeriğini üreterek güven kaybedebilir. Tekel denilen şey böyle birşey.

Wikipedia’nın trafiği Kasım ayı için 107 milyon. Aynı ay için ise Google’ın trafiği 260 milyon. Dolayısı ile Google’ın neredeyse kendisinin yarısı kadar trafiği olan bir alana göz dikmesi pek de anlaşılmaz değil.

Bu arada Knol her ne kadar Wikipedia’ya benzese de önemli farklar var. Örneğin Wikipedia yazarlar arasında işbirliğini teşvik ediyor. Oysa Knol’un ana fikri rekabet üstüne kurulu. Knol’a katkı yapanlar birbirlerinin makalelerini değişteremiyorlar. Yani aynı konu hakkında bir çok makale olabilir.

Buna ek olarak Knol’a katkı yapanlar yaptıkları katkıların telif hakkına sahipler. Oysa Wikipedia tamamen özgür, yaptığınız katkılar kamuya ait.

Bir diğer problem de hem arama motoru optimizasyonu yapanları ilgilendiriyor. Wikipedia’nın sonuçları şu anda zaten arama sonuçlarında genelde bir yere sahip. Bu da ilk sayfa da 9 tane yer bırakıyor. Buna Google’ın Knol’u da eklenince ilk sayfadaki değerli yerlerin sayısı 8 düştü bile. Bu kullnıcılar açısından da kötü bir deneyim olabilir.

Google genelde bir çok alana rekabet getirerek bu alanları gelişmeye zorlayan bir yapıdaydı. Ancak bu son hareketi bu anlayışın tam tersinde Google zaten rekabetin çok olduğu bir alana giriyor. Asıl tehlike ise bu alandaki çok büyük etkisini kendi lehine kullanması.

Peki siz Google Knol hakkında ne düşünüyorsunuz? Sizce de Knol fazla ileri gitmek mi?

MSN Live yönlendirmeleri takip etmiyor

Yazan: Sinan Taga

Msn LiveMSN Live‘ın hatalarından bir tane daha. MSN botu 301 yönlendirmelerini (301 redirect) takip etmiyor. Internette dolaşırken bulduğum bir SEO sitesinde bu garip hatayı öğrendim.

Örneğin ana sayfanızı bir başka URL‘ye yönlendirdiyseniz arama robotları bu yönlendirmeyi takip ederler ve yönlendirilen adresteki sayfaları indekslerler. Fakat MSN Live öyle yapmıyor. Okuduğum yerde anlatılan hikayeye göre Live aramalarında birinci sırada olan bir site bu yönlendirmeyi yaptıktan sonra bir anda sonuçlardan kaybolmuş. Daha sonra farketmişler ki MSN Live’ın arka sayfalarında bir yerde tek bir sonuç ile çıkmaktalar, yani yönlendirme sayfası ile.

Görünüşe göre bu hatanın varlığı 2004 yılına kadar dayanıyor. Microsoft hala bir düzeltme yapmamış.

Dolayısı ile eğer böyle bir yönlendirme yaptıysanız ve MSN Live’da ki aramalarda çıkmıyorsanız, böyle bir hatanın kurbanı olabilirsiniz.

Arama Pazarlamalarında ve SEO Dünyasında Kullanılan Kısaltmalar

Yazan: Sinan Taga

Bu Amerikalılar’ın kısaltmalara ne kadar meraklı oldukları ortada. Bazen bu kısaltmaların hepsi birbirine giriyor. Biz de bu işle ilgilenen kişiler olarak bunları ne olduklarını bilme durumundayız. Bende bir yerde gördüğüm liste üzere bu kısaltmalar için benzer bir liste yaratmaya karar verdim.

  • BL = Backlink - Geri bağlantı
  • CPC = Cost Per Click - Tıklama Ücreti
  • CSE = Comparison Shopping Engine or Custom Search Engine (Google) - Karşılaştırmalı Alışveriş Motoru veya Özelleştirilmiş Arama Motoru
  • CSS = Cascading Style Sheet
  • DC = Data Center - Veri Merkezi
  • DMOZ = Directory - Mozilla - Dizin - Mozilla
  • HTML = HyperText Markup Language
  • IBL = Inbound Link - Gelen link
  • IPB9 = Internet Business Promoter - Internet
  • LSA = Latent semantic analysis - gizli anlamsal analiz
  • LSI = Latent Semantic Indexing - gizli anlamsal analiz indeksleme
  • OBL = Outbound Link - Dışarı giden link
  • ODP = Open Direcrory Project, See DMOZ - Açık Dizin Projesi
  • OWBL = One way back link - Tek yönlü geri link
  • PPA = Pay Per Action - hareket başına ödeme
  • PPC = Pay Per Click - tıklama başına ödeme
  • PR = PageRank
  • RI = Regular index - Sıradan indeks
  • RSS = RDF Site Summary, Rich Site Summary, Really Simple Syndication - RDF Site Özeti, Zengin Site Özeti, Gerçekten Basit Yayımlama
  • SE = Search Engine - Arama Motoru
  • SEM = Search Engine Marketing - Arama Motoru Pazarlaması
  • SEO = Search Engine Optimization (Optimisation) - Arama Motoru Optimizasyonu (İyileştirme)
  • SERP = Search Engine Results Page - Arama Motoru Sonuçlar Sayfası
  • SI = Supplemental Index - Ek İndeks
  • SSE = Yahoo! Search Submit Express - Yahoo! Hızlı Arama Ekleme
  • SSP = Yahoo! Search Submit Pro
  • SWL = SiteWide Link - Sitesel link
  • TBPR = Toolbar PageRank - Araç çubuğu Pagerank
  • TR = Trust Rank - Güven Sırası
  • VIPS = Visual-block Page Segmentation - Görsel-blok Sayfa Kesimlemesi
  • WP/WP4 = Web Position/Web Position 4 - Web konumu
  • XML = Extensible Markup Language

Sonradan eklenenler:
TLA -
(Sitedeki belli anahtar kelimeler üzerine reklam alabileceğiniz bir reklam sistemi)
SMM - Social Media Marketing (Facebook, My Space gibi yerler için pazarlama)
SMO - Social Media Optimization
LPO: Landing Page Optimization - İniş Sayfası iyileştirmesi (Kullanıcının siteye ilk girdiği sayfa)
GWT: Google Webmaster Tools - Google Webmaster araçları
CMS: Content Management System - içerik yönetim sistemi (Ör: Joomla)

Google’dan arama sonuçlarında yeni deneme

Yazan: Sinan Taga

Google Deneysel AramaGoogle arama sonuçlarında digg benzeri bir oylama sistemini deniyor. Buna göre kullanıcılar arama sonuçları sayfasında çıkan sonuçlara pozitif veya negatif oy verebilecekler. Bu oylamalara göre bir daha aynı arama yaparsanız Google bu değişiklikleri göz önünde bulunduruyor. Ayrıca çıkan arama sonuçlarına siz alternatif bir sayfa ekleyebiliyorsunuz ve bu sonuç hep en üstte kalıyor.

Şu an için bu etkiler kullanıcı başına sayılıyor ve genel arama sonuçlarını etkilemiyor. Yani bir arama sonucunu beğenmedim olarak işretlerseniz bu sonuç ile bir sonrakş aramalarda karşılaşmıyorsunuz. Aynı şekilde olumlu oy kullanılan sonuçlar tepede kalıyorlar.

Google bunun sadece deneysel olduğunu ve sadece birkaç hafta varolacağını belirtiyor. Dolayısı ile deneysel aramalar sayfasına gittiğiniz zaman bunu göremiyebilirsiniz.

Deneysel Google Aramaları için tıklayın.

Bu yazıdaki deneysel özelliğin Google görüntüsü için tıklayın.




Site Mozilla ve Opera gibi standartları destekleyen tarayıcılar için tasarlanmıştır. Eğer IE kullanıyorsanız şikayet etmeyin. kendi düşen ağlamaz.