Günümüzde bilgisayarlar ucuzlamakta ve günden güne daha yaygın kullanılmaktadır. Bunun sonucu olarak da bilgisayarlarla işlenen verilerin büyüklüğü her geçen gün artmaktadır. Bu veri yığınlarından anlamlı bilgilerin çıkartılması bu noktada önem kazanan bir olgudur. İçinden bizim için anlam ifade eden bilgiyi çıkartmadığımız sürece büyük data yığınları bizim için anlam ifade etmezler. Bu iş günümüzde veri madenciliği ile yapılmaktadır.
VERİ MADENCİLİĞİ NEDİR?
Büyük veritabanlarından gizli kalmış örüntüleri çıkarma sürecine veri madenciliği adı verilmektedir. Geleneksel yöntemler kullanılarak çözülmesi çok zaman olan problemlere veri madenciliği süreci kullanılarak daha hızlı bir şekilde çözüm bulunabilir. Veri madenciliğinin ana amacı elimizde bulunan veriden gizli kalmış örüntüleri (patterns) çıkarmak, elimizdeki verinin değerini arttırmak ve veriyi bilgiye dönüştürmektir.
VERİ MADENCİLİĞİ UYGULAMA ALANLARI
• Bankacılık:
· Risk analizleri ve usulsüzlük tespiti,
· Farklı finansal göstergeler arasında gizli korelasyonların bulunması,
· Kredi kartı dolandırıcılıklarının tespiti,
· Kredi kartı harcamalarına göre müşteri gruplarının belirlenmesi,
· Kredi taleplerinin değerlendirilmesi.
• Pazarlama:
- Çapraz satış analizleri,
- -Müşteri segmentasyonu,
- Pazar Araştırması;
o Hedef pazar araştırması,
o Müşteriler arası benzerliklerin bulunması.
- Müşterilerin satın alma örüntülerinin belirlenmesi;
o - Müşterilerin demografik özellikleri arasındaki bağlantıların bulunması,
o - Posta kampanyalarında cevap verme oranının artırılması,
o - Mevcut müşterilerin elde tutulması, yeni müşterilerin kazanılması,
o - Pazar sepeti analizi (Market Basket Analysis),
o - Müşteri ilişkileri yönetimi (Customer Relationship Management),
o - Müşteri değerlendirme (Customer Value Analysis),
o - Satış tahmini (Sales Forecasting).
• Sigortacılık:
- Müşteri kaybı sebeplerinin belirlenmesi,
- Usulsüzlüklerin önlenmesi,
- Yeni poliçe talep edecek müşterilerin tahmin edilmesi,
- Sigorta dolandırıcılıklarının tespiti,
- Riskli müşteri örüntülerinin belirlenmesi.
• Telekomünikasyon:
- Hile tespiti,
- Hatların yoğunluk tahminleri.
• Borsa:
- Hisse senedi fiyat tahmini,
- Genel piyasa analizleri.
• Tıp:
· Tıbbi teşhis,
· Uygun tedavi sürecinin belirlenmesi.
• Bilim ve Mühendislik:
- Amprik veriler üzerinde modeller kurularak bilimsel ve teknik problemlerin çözümlenmesi,
- DGA(dissolved gas analysis),
- Trafik analizi
- DNA analizi[4]
• Endüstri:
- Kalite kontrol
- Lojistik.
- Veri tabanı analizi ve karar verme desteği
- Risk Analizi : Kalite kontrol, rekabet analizi, öngörü, sahtekarlıkların saptanması
- Belgeler arası benzerlik : haber kümeleri, e-posta
- Müşteri kredi risk araştırmaları
- Kurum kaynaklarının en optimal biçimde kullanımı
- Geçmiş ve mevcut yapı analiz edilerek geleceğe yönelik tahminlerde bulunma.