Veri Madenciliği (data mining) Nedir?
Dijital verinin toplanması ve saklanmasındaki gelişmeler, saklanan verilerin üstel bir şekilde büyümesine sebep olmuştur. Diğer yandan hayatın hızla elektronikleşiyor olması, internetin günlük yaşamın ayrılmaz bir parçası haline gelmesi ve teknolojinin alınabilir bir meta olarak toplum nezdinde yaygınlaşması toplanan veri artışını hızlandırmıştır.
Toplanan verilerin çeşidi her gün artmaktadır. Kısaca bir kaç örnek vermek gerekirse; kredi kartı verileri, banka kayıtları, süper market satış verileri, web sitesi kayıtları, e-posta içerikleri, güvenlik amaçlı kullanılan retina ve parmak izi verileri, meteorolojik ve jeofizik veriler ve tıbbi kayıtlar dijital veri toplamanın ve saklamanın ne kadar yaygın olduğunu göstermektedir.
Farklı bilim insanlarının veri madenciliği hakkındaki tanımlamalarına bakıldığında veri madenciliğinin ne olduğu konusunda evrensel bir fikir birliği olmadığını söyleyebiliriz..Veri madenciliği (data mining) konusunda en çok kesişilen tanımı bir kaç kaynaktan toparlamak gerekirse; büyük miktarda verinin anlamlı örüntüler bulmak amacıyla otomatik veya yarı otomatik yöntemler ile işlenmesi olduğunu söyleyebiliriz., Veri madenciliğinin en çok beslendiği bilimsel disiplinlerin istatistik ve makina öğrenmesi olduğunu söyleyebiliriz. Ayrıca yapay zeka alanında yapılan çalışmaların da veri madenciliğine katkıları olmaktadır. Çoğu zaman veri madenciliği, makina öğrenmesi ve yapay zeka birbiri yerine kullanılmakla birlikte, aslında farklı amaçları olan fakat ortak araçları kullanabilen bilimsel disiplinlerdir.