idea worker - fikir işçisi


VERİYİ ANLAMA YOLCULUĞU 1: PYTHON PANDAS MELT İŞLEVİ

23.01.2020 23:31

İç denetçilerin ve hile inceleme uzmanlarının veriyi anlama yolculuğunda birkaç satır ifade etmeye karar verdim. Herkesin bildiği konuları paylaşmayacağım ve yazdıklarım çok ayrıntılı olmayacak. Çok fazla ayrıntıya karşıyım; çünkü hazır bilgi beyne yüktür.

 

 

Yığınla veri önümüze geldiğinde, veri tablosu istediğimiz şekilde olmayabilir. Veriyi hazırlayana kızmak elbette fayda sağlamayacaktır. O zaman veri tablosunun yapısıyla oynamamız gerekmektedir. Bütün bunları Excel'le yapabilir miyiz? Yaparız, ama Excel yavaştır ve bu yavaşlık insanı üzer. Excel yerine Pandas kullandığımızda, emin olun ki mutlu olacaksınız.

 

Örnek veri tablomuzun birkaç satırını aşağıya ekliyorum:

 

sicilkodu

sinav1

sinav2

sinav3

sl006524

75

52

90

ck003257

45

 

68

au004296

87

73

65

 

Örnek veriden görüleceği üzere, personele sınavlar yapılmış ve her bir sınav için ayrı bir sütun tanımlamış. Peki, bütün sınavlar için tek bir sütun kullansak, daha mantıklı olmayacak mıdır? İşte, Pandas Melt işlevi bize yardımcı olacaktır. Gerekli kodları aşağıya ekliyorum.

 

import pandas as pd

 

hamVeri = pd.read_csv('personel_veri.csv')

 

sonVeri = pd.melt(frame=hamVeri, id_vars='sicilkodu'

                  value_vars=['sinav1','sinav2','sinav3'], 

                  var_name='sinavlar', value_name='sonuclar')

 

sonVeri.head(9)

 

Kodları çalıştırdığımızda ne elde etmiş oluyoruz, aşağıda görebiliriz.

 

Yukarıda göreceğimiz üzere, bütün sınavları ve sonuçlarını birer sütuna indirdik ve veriyi daha anlamlı hale getirdik.

 

İç denetçinin ve hile inceleme uzmanının veriyle dans etmesi önem arz etmektedir.

—————

Geri