idea worker - fikir işçisi


BENFORD YASASI İLK İKİ BASAMAK TESTİ ANALİZİ ÇALIŞMASI

05.03.2019 15:39

Bu yazımızda Benford Yasası ilk 2 basamak testini uygulamalı olarak ele alacağız. (ABD 2009 nüfus sayımı verilerini kullanacağız.) İlk iki basamak testinde yine logaritmik analizden yararlanıyoruz. Örneğin bir sayı setinin ilk iki basamağının 98 olma ihtimali şu şekilde hesaplanmaktadır. LOG (1+1/98). Örnek kombinasyonlar şunlardır: 989, 986, 9878475 vs.

 

ABD 2009 nüfus sayımı özet verileri ve Benford Yasası ilk 2 basamak beklenen oranlar aşağıya eklenmiştir.

 

İlk 2 Basamak Kombinasyonları

Nüfus Sayımı Verileri Soldan İlk 2 Basamak Oranlar

BenfordYasası Beklenen İlk 2 Basamak Oranları

10

0.041166

0.041393

11

0.036136

0.037789

12

0.035109

0.034762

13

0.030952

0.032185

14

0.030387

0.029963

15

0.025716

0.028029

16

0.026127

0.026329

17

0.024381

0.024824

18

0.022688

0.023481

19

0.021661

0.022276

20

0.022328

0.021189

21

0.020891

0.020203

22

0.020326

0.019305

23

0.019505

0.018483

24

0.018171

0.017729

25

0.017093

0.017033

26

0.016887

0.016390

27

0.015655

0.015794

28

0.016631

0.015240

29

0.014116

0.014723

30

0.013294

0.014240

31

0.013038

0.013788

32

0.015245

0.013364

33

0.013192

0.012965

34

0.011446

0.012589

35

0.012114

0.012234

36

0.011087

0.011899

37

0.010625

0.011582

38

0.010471

0.011281

39

0.009650

0.010995

40

0.009855

0.010724

41

0.009137

0.010465

42

0.011292

0.010219

43

0.010215

0.009984

44

0.009855

0.009760

45

0.009342

0.009545

46

0.009137

0.009340

47

0.008469

0.009143

48

0.009701

0.008955

49

0.007699

0.008774

50

0.007956

0.008600

51

0.008675

0.008433

52

0.008367

0.008273

53

0.007597

0.008118

54

0.008521

0.007969

55

0.008521

0.007825

56

0.008880

0.007687

57

0.007443

0.007553

58

0.007083

0.007424

59

0.006878

0.007299

60

0.008726

0.007179

61

0.006981

0.007062

62

0.007083

0.006949

63

0.008161

0.006839

64

0.006570

0.006733

65

0.006878

0.006631

66

0.006570

0.006531

67

0.005544

0.006434

68

0.007032

0.006340

69

0.006570

0.006249

70

0.005338

0.006160

71

0.007083

0.006074

72

0.005903

0.005990

73

0.006416

0.005909

74

0.006006

0.005830

75

0.004876

0.005752

76

0.006775

0.005677

77

0.005698

0.005604

78

0.005338

0.005532

79

0.006314

0.005463

80

0.004979

0.005395

81

0.006160

0.005329

82

0.005184

0.005264

83

0.005544

0.005201

84

0.006365

0.005140

85

0.004928

0.005080

86

0.006006

0.005021

87

0.005338

0.004963

88

0.004363

0.004907

89

0.004466

0.004853

90

0.004260

0.004799

91

0.005698

0.004746

92

0.004671

0.004695

93

0.004004

0.004645

94

0.004825

0.004596

95

0.004774

0.004548

96

0.004517

0.004501

97

0.004158

0.004454

98

0.005082

0.004409

99

0.004106

0.004365

 

Özet verileri grafik haline getirdiğimizde, ilk 2 basamak testinin Benford Yasası oranlarıyla uyum içinde olduğu görünmektedir. Tek başına bu çıkarım yeterli değildir. Ek testlerin yapılması ve istatiksel testlerin uygulanması gerekmektedir.

 

Bildiğiniz üzere, nüfus sayımları sonuçlarına çeşitli itirazlar gelmektedir. Belediyelerin daha fazla yardım alabilmesi adına, nüfus sayımlarında mezar taşlarının vs. sayıldığı iddia edilebilmektedir. Nüfus sayımı sonuçlarının Benford Yasası ile test edilmesinde fayda mülahaza edilmektedir. Elbette reel sektör verileri için de Benford Yasası kullanılmalıdır.

—————

Geri