idea worker - fikir işçisi


ÇOK TEKRARLAYAN İFADELER, PYTHON ve HİLE DENETİMİ ile METİN ANALİZİ

08.11.2019 00:14

Bir metinde çok tekrarlayan ifadeler olduğunu ve bu ifadelerin çok tekrarlanmasının kırmızı bayrak olarak değerlendirilebileceğini düşünelim. Örneğin bir soruşturmaya ait savunma ifadelerini okuyoruz ve "zaafiyet" ifadesinin sık kullanımı dikkatimizi çekiyor. Bu ve benzeri çıkarımları yapmamız için Python bize yardımcı olacaktır. 

 

Aşağıya eklediğim metinde "para" ifadesi bizim için ölçüt olsun. "para" yerine başka harfler, heceler veya kelimeler de gelebilir,unutmayalım.

 

paraciklar = "Para para para diye diye beynimi yediniz. 
                        PARA personelden kıymetliymiş, öğrendim. 
                        Değer verdiğiniz paraları ben çalmadım. Parayla ne işim olacak ki... Ben parayı hiç sevmem!"

 
if (paraciklar.lower().count("para") >3):
  print("Bu personelin ifadeleri şüpheli! ve 'para' ifadesinin kullanım sayısı: " 
            str(paraciklar.lower().count("para")))
 

 

 

Tarihle ilgili bir metini alalım ve "a" harfleriyle ilgilenelim.

 

arkadaslar = "Mustafa Kemal ATATÜRK ve Kazım KARABEKİR silah arkadaşıydılar. 
                        Bu gerçeği bilip, onlar arasındaki ihtilafları aramızda TARTIŞMA konusu yapmamamız önemlidir."



if (arkadaslar.lower().count("a") > 10):
  print("Metin içerisinde çok fazla sayıda 'a' harfi var ve toplam 'a' harfi sayısı: " 
            str(arkadaslar.lower().count("a")) )

 

—————

Geri