13.07.2015 Views

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Google Arama Motorunda İndekslenmiş Sayfaların ArtırılmasıAli Çaylı, Adil Akyüz, Ercan Efe, Sait ÜstünArama motorları üzerinde kayıtlı olan (indekslenmiş)web sayfaları sayısı, sayfa sahibi olankurumun bilgilerine erişimi artırmaktadır. Aramamotorlarından aranan anahtar kelimelerleulaşılabilen sayfa sayısını artırmak için öncelikliolarak bilgilerin web ortamına taşınması vesonra da arama motorları robotlarının bu sayfalaraerişiminin kolaylaştırılması gerekmektedir.2. Arama MotorlarıArama motoru kısaca bilgiye erişme sistemiolarak tanımlanabilir [1]. Başlıca üç bileşendenoluşur. Bunlar web robotu, arama indeksi vekullanıcı arabirimidir. Internetteki sayfalar birbirinebağlantılar (linkler) vasıtasıyla bağlıdır.Bu sayede bir sayfadan diğerine geçmek mümkündür.Şu anda en çok bilinen ve kullanılanarama motorları google.com, yahoo.com, msn.com’dur. Bunların yanında Internet üzerindehizmet veren birçok arama motorları da aynı işlevleriyerine getirmektedir. Arama motorları,web robotu (crawler) yazılımlarla web sayfalarınıincelerler ve içerisinde bulunan kelimeleri,cümleleri, resimleri vb diğer içeriği kendi veritabanlarıüzerine kaydederek bunlardan indeksoluştururlar. Bu işlemi belli aralıklarla sürekliyaparak güncel bir indekse sahip olurlar. Kullanıcılarise istemci web arabirimini kullanarakveya izin verilen başka erişim yöntemleriile arama motorlarının indekslerinden anahtarkelimeleri veya bir cümleyi girerek aradıklarıbilgilerin nerede olduğu tespit ederler.478Arama motoru ilk olarak Montreal’dekiMcGill Üniversitesinde öğrenci olan AlanEmtage tarafından 1990 yılında yapılmıştır.Bu arama motoru FTP sitelerindeki dosya listelerinidownload ederek bunları aranabilir birveritabanına kaydediyordu. Bu sistemde dosyaiçeriklerinde arama yapmak mümkün değildi.1991 yılında University of Minnesota’danMark McCahill tarafından geliştirilen Gopherhizmeti kullanılmaya başlandı. Bu sistemledosya içeriklerinde de tarama yapılabiliyordu.1993 yılında MIT’den Matthew Gray tarafındanilk web arama motoru olan Wandex geliştirilmiştir.Bu dönemde hizmet veren ilk aramamotorlarından bir diğeri olan Aliweb halen günümüzdede hizmet vermeyi sürdürmektedir.Tam metin arama yapabilen ilk arama motoruWebcrawler’da 1994’de hizmete girmiştir vekullanıcıya web sayfası içeriğinde herhangi birkelimeyi arayabilme imkânı vermiştir. Dahasonraları bu sistem Excite, InfoSeek, Inktomi,Northen Light ve Altavista gibi arama motorlarındada standart hale gelmiştir. 1990’lı yıllardansonra en parlak yatırımlar arama motorlarıiçin yapılanlar olmuştur.3. MetotBu araştırmada üniversitelerin Google aramamotorunda indekslenmiş web sayfası sayısınıtespit etmek amacıyla php tabanlı bir yazılımgeliştirilmiştir. Yüksek Öğretim Kurulu websitesinden alınan Türkiye Üniversiteleri webadresleri Mysql veritabanı sunucusu üzerinegirilmiştir. Ayrıca Shanghai Jiao Tong Universitytarafından her yıl yapılan üniversite derecelendirmelistesinde (Academic Ranking ofWorld Universities) ilk 100 sırayı alan üniversitelerinweb sayfaları da Mysql veritabanınaaktarılmıştır [2]. Php tabanlı script programlabu üniversitelere ait web sayfası sayıları oy-oy.eu sitesinin XML formatlı sonuç çıktıları ayrıştırılarakyine Mysql veritabanına kaydedilmiştir.Her üniversitenin ana etki alanındaki websayfası sayısı 3 farklı zamanda 43 farklı verimerkezi taranarak alınmıştır. Sonuçlar hesaplanırkenelde edilen 43 farklı sistemden alınansonucun aritmetik ortalaması alınmıştır.4. Üniversitelerde Mevcut DurumYapılan bu taramalar sonucunda Türkiye’de enfazla indeksli web sayfası sayısına sahip üniversite253,476 sayfa ile Bilkent Üniversitesi olduğugörülmüştür. Bilkent Üniversitesini OrtaDoğu Teknik Üniversitesi (139,429) ve AnkaraÜniversitesi (118,786) izlemektedir. Sayfa sayılarıbakımından ilk ve son sıradaki 10’ar üniversiteÇizelge 1 ve Çizelge 2’de verilmiştir.Türkiye’de tüm üniversitelere ait toplam web

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!