İnternet aracılığıyla birçok verinin bir araya getirilmesi ve toplanması mümkündür. Ancak son zamanlarda artan bilgi kirliliğinden kaynaklı olarak bu bilgilerin içinden doğru bilgilerin seçiminin çok zor olduğu düşünülse de doğru bilgiye elde etmek imkânsız değildir. Halen bu bilgilerin ayrıştırılmasıyla ilgili birçok çalışma yapılmaktadır. Günümüzde veriler makineler ve cihazlar aracılığıyla üretilmekte olup bulut alt yapılı sistemler içerisinde depolanmaktadır. İhtiyaç duyulduğunda işletme yönetimleri ya da bireyler bu verilere ulaşabilmektedir. Şu an var olan ağlarda 1000 Exabyte veri bulunduğu tahmin edilmekle beraber ilerleyen 10 yıl içerisinde bu miktarın 20 katına çıkacağı varsayılmaktadır. İmalat sektörü diğer sektörlere oranla daha fazla veri kullanmaktadır.
Örneğin ambalajlı ürünler sektöründe bir kişisel bakım ürünü için 1 makine 33 milisaniyede 5000 veri üretmekte olup bu da yılda dört trilyon veri yapmaktadır. Bu açıdan bakıldığında, büyük verinin Endüstri 4.0 için önemli bir rol oynayacağı düşünülmektedir. Alman hükümetine göre Endüstri 4.0’ın yakıtı büyük veriler olacaktır. Neticede siber-fiziksel sistemlerde akıllı makineler ile sürekli olarak bilgi üretimi ve bilgi depolaması yapılacağı için bu bilgilerin belli bir zaman sonra analiz edilmesi, ölçülmesi ve yapılandırılması ihtiyacı tam da bu noktada büyük veri analizi bir başka isimle veri madenciliğini ön plana çıkartmaktadır. Büyük veri analizinin ve kullanımın temel amacı hata yapma oranını azaltmak, etkinliği arttırmak ve esnekliği sağlamaktır. Klasik istatistik mantığını düşünürsek, ana kütleden alınan örnek miktarı ne kadar çoksa elde edilen bilgi o kadar doğru ve güvenilirdir. Şirketlerin büyük veriler kullanarak üretim geliştirme masraflarını %50 azaltabileceği öngörülmektedir.
Kaynak: https://meslegimhayatim.meb.gov.tr/dijital/buyuk-veri