idea worker - fikir işçisi
VERİYİ ANLAMA YOLCULUĞU 1: PYTHON PANDAS MELT İŞLEVİ
23.01.2020 23:31İç denetçilerin ve hile inceleme uzmanlarının veriyi anlama yolculuğunda birkaç satır ifade etmeye karar verdim. Herkesin bildiği konuları paylaşmayacağım ve yazdıklarım çok ayrıntılı olmayacak. Çok fazla ayrıntıya karşıyım; çünkü hazır bilgi beyne yüktür.
Yığınla veri önümüze geldiğinde, veri tablosu istediğimiz şekilde olmayabilir. Veriyi hazırlayana kızmak elbette fayda sağlamayacaktır. O zaman veri tablosunun yapısıyla oynamamız gerekmektedir. Bütün bunları Excel'le yapabilir miyiz? Yaparız, ama Excel yavaştır ve bu yavaşlık insanı üzer. Excel yerine Pandas kullandığımızda, emin olun ki mutlu olacaksınız.
Örnek veri tablomuzun birkaç satırını aşağıya ekliyorum:
sicilkodu |
sinav1 |
sinav2 |
sinav3 |
sl006524 |
75 |
52 |
90 |
ck003257 |
45 |
|
68 |
au004296 |
87 |
73 |
65 |
Örnek veriden görüleceği üzere, personele sınavlar yapılmış ve her bir sınav için ayrı bir sütun tanımlamış. Peki, bütün sınavlar için tek bir sütun kullansak, daha mantıklı olmayacak mıdır? İşte, Pandas Melt işlevi bize yardımcı olacaktır. Gerekli kodları aşağıya ekliyorum.
import pandas as pd
hamVeri = pd.read_csv('personel_veri.csv')
sonVeri = pd.melt(frame=hamVeri, id_vars='sicilkodu',
value_vars=['sinav1','sinav2','sinav3'],
var_name='sinavlar', value_name='sonuclar')
sonVeri.head(9)
Kodları çalıştırdığımızda ne elde etmiş oluyoruz, aşağıda görebiliriz.
Yukarıda göreceğimiz üzere, bütün sınavları ve sonuçlarını birer sütuna indirdik ve veriyi daha anlamlı hale getirdik.
İç denetçinin ve hile inceleme uzmanının veriyle dans etmesi önem arz etmektedir.
—————