Sayi9kasimaralik
Sayi9kasimaralik
Sayi9kasimaralik
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Kasım-Aralık 2012 Yıl : 2 Sayı : 9<br />
ödemişken, yenisinin eskisinden daha üstün olduğu<br />
gösterilmemiş bir başka rakip paketi pek yakın bir<br />
tarihte satın alması ihtimali düşüktür. Varolan bazı<br />
VM ürünlerinin örnekleri şunlardır (Mayıs 1997 itibariyle):<br />
IBM: "IntelligentMiner"<br />
Tandem: "Relational Data Miner"<br />
Angoss Software: "KnowledgeSEEKER"<br />
ThinkingMachines Corporation: "DarwinTM"<br />
NeoVista Software: "ASIC"<br />
ISL DecisionSystemsInc: "Clementine"<br />
DataMind Corporation: "DataMind Data Cruncher"<br />
Silicon Graphics: "MineSet"<br />
California Scientific Software: "BrainMaker"<br />
WizSoft Corporation: "WizWhy"<br />
Lockheed Corporation: "Recon"<br />
SAS Corporation: "SAS Enterprise Miner "<br />
Bu az ya da çok “kapsayıcı” paketlerin yanında tek<br />
amaç için uzmanlaşmış çok çeşitli ürünler de mevcuttur.<br />
Bunun yanında birçok danışmanlık firması<br />
VM’de uzmanlaşmıştır. Bu alanda istatistikçiler ve<br />
bilgisayar bilimciler arasındaki farklardan biri şudur:<br />
İstatistikçinin bir fikri olduğunda o bir makale yazar,<br />
ama bilgisayarcının bir fikri varsa, o bir şirket kurar.<br />
Var olan VM ürünleri şöyle vasıflandırılabilir:<br />
- Aşağıdakileri için “çekici” bir grafik kullanıcı ara<br />
yüzü:<br />
l Veri Tabanları (sorgu dili),<br />
l Veri çözümleme prosedürleri seti.<br />
- Windows Tipi Arayüz<br />
l Esnek uygun girdi<br />
n Tıklama ikonları ve menüler,<br />
n Girdi için iletişim kutuları,<br />
n Çözümlemeleri betimleyecek diyagramlar,<br />
n Çıktıların çok yönlü grafik gösterimi,<br />
n Çeşitli veri grafiklemeleri,<br />
AKADEMİK<br />
n Hızlı grafik yöntemleri: ağaçlar, ağlar, uçuş simü<br />
lasyonları vb.<br />
- Sonuçların uygun manipülasyonu imkanı.<br />
Bu paketler genellikle VM uzmanları kadar karar alıcılar<br />
için de üretilmektedir.<br />
Güncel VM paketlerinin hemen hepsi her zaman şu<br />
istatistikî çözümleme yöntemlerini barındırır:<br />
- Karar ağacı tümevarımı (C4.5, CART, CHAID)<br />
- Kural Tümevarımı (AQ, CN2, Recon, vb.)<br />
- Kümeleme yöntemleri (olay bazlı karar alma)<br />
- İlişkilendirme kuralları (piyasa bazlı çözümleme)<br />
- Özellik çıkarımı,<br />
- Görselleştirme.<br />
Buna ek olarak, bazılarında şunlar bulunur:<br />
- Sinir ağları,<br />
- Bayezyen inanç ağları (grafik modeller)<br />
- Genetik algoritma,<br />
- Kendini örgütleyen haritalar,<br />
- Sinir-bulanık sistemler (Neuro-fuzzysystems)<br />
Bu paketlerin neredeyse hiçbirinde şunlar sunulmaz:<br />
- Hipotez testleri,<br />
- Deneysel tasarım,<br />
- Tepki düzeyi modelleme,<br />
- ANOVA, MANOVA vb.,<br />
- Doğrusal regresyon,<br />
- Diskriminant analizi,<br />
- Lojistik regresyon,<br />
26 27<br />
- GLM,<br />
- Kanonik korelasyon,<br />
- Temel bileşenler analizi,<br />
- Faktör analizi.<br />
Bu son yöntemler, tabii ki, standart istatistik paketlerinin<br />
payandalarıdır. Demek ki, şu anda pazarlanmakta<br />
olan (ve kullanılan) neredeyse bütün VM paketleri<br />
istatistik alanı dışında geliştirilmiştir. Temel yöntemimiz<br />
büyük oranda göz ardı edilmiştir.<br />
3. Neden şimdi? Ne bu acele?<br />
Veriden öğrenme fikri uzun süredir masadaydı. O zaman<br />
şu soru sorulabilir: Neden VM bir anda bu kadar<br />
ilgi gördü? Temel neden Veri Tabanı Yöntemi alanının<br />
daha yeni işin içine girmesi. Veri Tabanı Yöntem<br />
Sistemler (VTYS), özellikle büyük boyutlarda, veri<br />
barındırır. Geleneksel VTYSleri, veri örgütlemesine<br />
yarayan bireysel kayıtların depolanması ve hızlı geri<br />
çağrılması olan, Çevrimiçi Hareket İşleme (Online<br />
Transaction Process, OLTP) üzerine yoğunlaşmış idi.<br />
Bordro, depo, fatura kayıtları vbgkayıtları tutmaktaydı.<br />
Veri Tabanı Yönetimi ile uğraşanlar, yenilerde “Karar<br />
desteği” için VTYS kullanmak ile ilgilenmeye başladılar.<br />
Karar Destek Sistemleri (KDS), OLTP uygulamaları<br />
için, toplanmış veri için istatistikî sorgulara<br />
(query) izin vermektedir. Örneğin, “Zincirimizdeki<br />
mağazalarda geçen ay kaç tane bebek bezi satıldı?”<br />
gibi. KDS “Veri Deposu” kurmayı gerektirir. Veri depoları<br />
bir kurumun farklı departmanlarında dağılmış<br />
veriyi, tek ve merkezî veri tabanına (çoğu zaman çok<br />
büyük, 100 GB) ortak bir biçimde birleştirir. Bazı durumlarda<br />
daha küçük alt-veri tabanları özel çözümlemeler<br />
için üretilir. Bunlara “Veri Pazarı (Data Marts)<br />
ismi verilir.