02.12.2012 Views

Sayi9kasimaralik

Sayi9kasimaralik

Sayi9kasimaralik

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Kasım-Aralık 2012 Yıl : 2 Sayı : 9<br />

ödemişken, yenisinin eskisinden daha üstün olduğu<br />

gösterilmemiş bir başka rakip paketi pek yakın bir<br />

tarihte satın alması ihtimali düşüktür. Varolan bazı<br />

VM ürünlerinin örnekleri şunlardır (Mayıs 1997 itibariyle):<br />

IBM: "IntelligentMiner"<br />

Tandem: "Relational Data Miner"<br />

Angoss Software: "KnowledgeSEEKER"<br />

ThinkingMachines Corporation: "DarwinTM"<br />

NeoVista Software: "ASIC"<br />

ISL DecisionSystemsInc: "Clementine"<br />

DataMind Corporation: "DataMind Data Cruncher"<br />

Silicon Graphics: "MineSet"<br />

California Scientific Software: "BrainMaker"<br />

WizSoft Corporation: "WizWhy"<br />

Lockheed Corporation: "Recon"<br />

SAS Corporation: "SAS Enterprise Miner "<br />

Bu az ya da çok “kapsayıcı” paketlerin yanında tek<br />

amaç için uzmanlaşmış çok çeşitli ürünler de mevcuttur.<br />

Bunun yanında birçok danışmanlık firması<br />

VM’de uzmanlaşmıştır. Bu alanda istatistikçiler ve<br />

bilgisayar bilimciler arasındaki farklardan biri şudur:<br />

İstatistikçinin bir fikri olduğunda o bir makale yazar,<br />

ama bilgisayarcının bir fikri varsa, o bir şirket kurar.<br />

Var olan VM ürünleri şöyle vasıflandırılabilir:<br />

- Aşağıdakileri için “çekici” bir grafik kullanıcı ara<br />

yüzü:<br />

l Veri Tabanları (sorgu dili),<br />

l Veri çözümleme prosedürleri seti.<br />

- Windows Tipi Arayüz<br />

l Esnek uygun girdi<br />

n Tıklama ikonları ve menüler,<br />

n Girdi için iletişim kutuları,<br />

n Çözümlemeleri betimleyecek diyagramlar,<br />

n Çıktıların çok yönlü grafik gösterimi,<br />

n Çeşitli veri grafiklemeleri,<br />

AKADEMİK<br />

n Hızlı grafik yöntemleri: ağaçlar, ağlar, uçuş simü<br />

lasyonları vb.<br />

- Sonuçların uygun manipülasyonu imkanı.<br />

Bu paketler genellikle VM uzmanları kadar karar alıcılar<br />

için de üretilmektedir.<br />

Güncel VM paketlerinin hemen hepsi her zaman şu<br />

istatistikî çözümleme yöntemlerini barındırır:<br />

- Karar ağacı tümevarımı (C4.5, CART, CHAID)<br />

- Kural Tümevarımı (AQ, CN2, Recon, vb.)<br />

- Kümeleme yöntemleri (olay bazlı karar alma)<br />

- İlişkilendirme kuralları (piyasa bazlı çözümleme)<br />

- Özellik çıkarımı,<br />

- Görselleştirme.<br />

Buna ek olarak, bazılarında şunlar bulunur:<br />

- Sinir ağları,<br />

- Bayezyen inanç ağları (grafik modeller)<br />

- Genetik algoritma,<br />

- Kendini örgütleyen haritalar,<br />

- Sinir-bulanık sistemler (Neuro-fuzzysystems)<br />

Bu paketlerin neredeyse hiçbirinde şunlar sunulmaz:<br />

- Hipotez testleri,<br />

- Deneysel tasarım,<br />

- Tepki düzeyi modelleme,<br />

- ANOVA, MANOVA vb.,<br />

- Doğrusal regresyon,<br />

- Diskriminant analizi,<br />

- Lojistik regresyon,<br />

26 27<br />

- GLM,<br />

- Kanonik korelasyon,<br />

- Temel bileşenler analizi,<br />

- Faktör analizi.<br />

Bu son yöntemler, tabii ki, standart istatistik paketlerinin<br />

payandalarıdır. Demek ki, şu anda pazarlanmakta<br />

olan (ve kullanılan) neredeyse bütün VM paketleri<br />

istatistik alanı dışında geliştirilmiştir. Temel yöntemimiz<br />

büyük oranda göz ardı edilmiştir.<br />

3. Neden şimdi? Ne bu acele?<br />

Veriden öğrenme fikri uzun süredir masadaydı. O zaman<br />

şu soru sorulabilir: Neden VM bir anda bu kadar<br />

ilgi gördü? Temel neden Veri Tabanı Yöntemi alanının<br />

daha yeni işin içine girmesi. Veri Tabanı Yöntem<br />

Sistemler (VTYS), özellikle büyük boyutlarda, veri<br />

barındırır. Geleneksel VTYSleri, veri örgütlemesine<br />

yarayan bireysel kayıtların depolanması ve hızlı geri<br />

çağrılması olan, Çevrimiçi Hareket İşleme (Online<br />

Transaction Process, OLTP) üzerine yoğunlaşmış idi.<br />

Bordro, depo, fatura kayıtları vbgkayıtları tutmaktaydı.<br />

Veri Tabanı Yönetimi ile uğraşanlar, yenilerde “Karar<br />

desteği” için VTYS kullanmak ile ilgilenmeye başladılar.<br />

Karar Destek Sistemleri (KDS), OLTP uygulamaları<br />

için, toplanmış veri için istatistikî sorgulara<br />

(query) izin vermektedir. Örneğin, “Zincirimizdeki<br />

mağazalarda geçen ay kaç tane bebek bezi satıldı?”<br />

gibi. KDS “Veri Deposu” kurmayı gerektirir. Veri depoları<br />

bir kurumun farklı departmanlarında dağılmış<br />

veriyi, tek ve merkezî veri tabanına (çoğu zaman çok<br />

büyük, 100 GB) ortak bir biçimde birleştirir. Bazı durumlarda<br />

daha küçük alt-veri tabanları özel çözümlemeler<br />

için üretilir. Bunlara “Veri Pazarı (Data Marts)<br />

ismi verilir.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!