idea worker - fikir işçisi


BENFORD YASASI İLK BASAMAK TESTİ ve Kİ KARE

28.02.2019 14:14

Bu yazımızda oynanmış veriyi Benford Yasası ile analiz edelim ve ek olaraktan, Ki Kare testi uygulayalım.  Sol tarafta oynanmış veri, sağ tarafta ise oynanmış veri için soldan ilk basamak değerleri bulunmaktadır.

 

Hileli Veri

Hileli Veri Soldan İlk Basamak

1

1

2

2

3

3

4

4

5

5

6

6

7

7

8

8

9

9

2

2

4

4

6

6

8

8

10

1

12

1

14

1

16

1

18

1

3

3

6

6

9

9

12

1

15

1

18

1

21

2

24

2

27

2

4

4

8

8

12

1

16

1

20

2

24

2

28

2

32

3

36

3

5

5

10

1

15

1

20

2

25

2

30

3

35

3

40

4

45

4

6

6

12

1

18

1

24

2

30

3

36

3

42

4

48

4

49

4

7

7

14

1

21

2

28

2

35

3

42

4

49

4

49

4

49

4

8

8

16

1

24

2

32

3

40

4

48

4

49

4

49

4

49

4

9

9

18

1

27

2

36

3

45

4

49

4

49

4

49

4

49

4

 

Şimdi, soldan ilk basamak değerlerini analiz için hazır hale getirelim. Excel/Veri/Alt Toplam/Say seçeneklerini kullanıyoruz. Özet veri aşağıdadır.

 

Hileli Veri

Hileli Veri Soldan İlk Basamak

Say 1

18

Say 2

15

Say 3

11

Say 4

22

Say 5

2

Say 6

4

Say 7

2

Say 8

4

Say 9

3

Genel Sayı

81

 

Benford Yasası ilk basamak beklenen oranları Log(1+1/k) formülü ile elde ettiğimizi hatırlayalım. Sonuçlar şunlardı:

 

Rakam

Benford Yasası Oranları

1

0.301029996

2

0.176091259

3

0.124938737

4

0.096910013

5

0.079181246

6

0.06694679

7

0.057991947

8

0.051152522

9

0.045757491

 

Hileli veriyi ve Benford Yasası beklenen oranları Ki Kare testine tabi tutabilmek için, Benford oranlarını 81 ile çarpıyoruz. Neden mi? Oynanmış verimiz 81 adetti. Aslında bir nevi normalizasyon yapıyoruz desek, hatalı olur muyum? Olmam gibi.

 

Benford Yasası Oranları * 81

24.38342965

14.26339198

10.12003767

7.849711054

6.41368093

5.42268996

4.697347705

4.143354318

3.706356735

 

Ki Kare testini şu iki veri grubuyla yapacağız: “Hileli Veri Soldan İlk Basamak” ve “Benford Yasası Oranları * 81”

 

Hipotez testlerimiz temel olarak şunlar olacak: (İstatistik mantığını kısaltıp, pratik olarak ifade ediyorum.)

 

H0: (Benford Yasası’na uyum var)

H1: (Benford Yasası’na uyum yok)

 

Ki kare testi neticesinde elde ettiğimiz p değeri 0.05’den küçükse, H0 hipotezini kabul etmeyeceğiz. Yani şüphe işaretleri belirlenecek. Elde ettiğimiz p değeri “0.00008”. Veri setinin ilk basamak testinin neticesinde, Benford Yasası’na uyum olmadığını tespit ettik. Yeterli mi? Hayır. Ek testler gerekli.

 

—————

Geri