Benford Yasası

İlk Rakamlar Yasası veya Önemli Rakamlar Fenomeni olarak da bilinen Benford Yasası, çok çeşitli kaynakların kayıt serilerinde bulunan sayıların ilk rakamlarının tek tip göstermediğinin bulunmasıdır. Dağılımı eşit değil, “1” rakamı en sık olacak şekilde, ardından “2”, “3” gelecek ve böylece “9” a kadar art arda azalacak şekilde düzenlenmiştir.

Konuyla ilgili ilk kayıt, 1881’de Amerikalı-Kanadalı astronom ve matematikçi Simon Newcomb’un çalışmasına aittir. Newcomb, logaritmik tablolardan oluşan bir kitabın sayfalarını çevirirken, kitabın başındaki sayfaların sondaki sayfalardan daha kirli olduğunu fark etti. 1938’de Amerikalı fizikçi Frank Benford, derlenen 20.000’den fazla deneysel veri gözlemiyle yaptığı bir ankette “Anormal Sayılar Yasası” adını verdiği düzeni yeniden ele aldı. Nehir alanlarından, kimyasal bileşiklerin moleküler ağırlıklarına, maliyet verilerine, adres numaralarına, nüfus büyüklüklerine ve fiziksel sabitlere kadar çeşitli kaynaklardan. Hepsi, az ya da çok, üstel olarak azalan bir dağılım izledi.1995’te kural, nihayet Hill tarafından kanıtlandı. Kanıtı, Benford Yasasını izleyen veri serilerindeki sayıların aslında “ikinci nesil” dağılımlar, yani diğer dağılımların kombinasyonları olduğu gerçeğine dayanıyordu

Peki, günlük hayatta mesela veri bilimi ve analitikte nasıl yardımcı olur? Normal dağılımın bir referans aracı ve standart olarak kullanımına benzer şekilde, bu yasa doğal olarak oluşan veri kümelerindeki kalıpları ve içlerindeki eksiklikleri tespit etmek için kullanılabilir. Bu, veri biliminde anormallikleri yakalama veya dolandırıcılık tespiti gibi önemli uygulamalara yol açabilir. Sayılar, nüfusu kontrol etmenin kolay bir yolu haline geldi. Her türlü kontrol mekanizmasını desteklemek için istatistikler yayınlanabilir. Bu istatistiklerin bazıları yanıltıcı, bazıları iyi niyetli olabilir, ancak yayıncıların görüşleriyle belirlenen yönde önyargılıdır. İklim değişikliği tartışması bunun en bariz örneklerinden biridir. Her iki taraf da şüphe duyanları ikna etmek veya kafalarını karıştırmak için sayıları kullanır.

Geleceği tahmin etmek bir bilim değildir; hiçbir gerçek bilimsel araştırmacı istatistiksel tahminlerinin olduğundan daha fazla olduğunu iddia etmez. Bir dizi geçmiş olay hakkında doğrulanabilir gerçeklere sahip olduğunuzdan eminseniz, bu modelin gelecekte de devam etme olasılığının olduğunu iddia etmek için kullanabileceğiniz bir model oluşturabilirsiniz, ancak kesinlik olamaz. Şafağın geceyi takip edeceğini tahmin edebileceğimiz doğrudur, ancak hiçbir bilim adamı bunun sonsuza kadar her zaman olacağını iddia edemez. Gerçekten ciddi bilim adamları her zaman belirsizliğin olduğu konusunda hemfikir olacaklardır, her zaman henüz bilmediğimiz şeyler vardır; bugün doğru olarak kabul edilen bir şeyin yanlışlığı 100 yıl sonra ispatlanabilir. Bir görüşün diğerine dayatılmasını haklı çıkarmak için sayıları kullanmak tehlikeli bir yoldur.

Gelecekteki bazı durumların kanıtı olduğunu iddia eden sayılara her zaman şüpheyle yaklaşılmalıdır. Bir hipotezin bir teoriye dönüştürülmesi gerekir, ancak bu, onu kanıtlayan bir olay sonrasına kadar yerleşik bir bilimsel gerçek haline gelmez. Sayılar hayatımızın her alanını kontrol etmek için kullanılır. Ne zaman okula gideceğimizi, ne zaman işe gideceğimizi,  ne zaman oy kullanmaya başlayacağımızı; hayatlarımızı kontrol eden sonsuz bir sayı listesi ama yine de kimse insanlar arasındaki devasa bireysel farklılıkları hesaba katmıyor.

(Visited 33 times, 1 visits today)