Merhaba herkese,
Önceki postlarda değişik kaynaklardan Power BI’a veri aktarımı yapmıştık. Şimdi bu verileri istediğimiz gibi değiştirip kullanmayı göstereceğim. Bunun için wikipedia’dan indirdiğim kimyasal element listesini kullanacağım. Web sitesinden içeri veri aktarımı için ilgili postuma bakabilirsiniz.
Gördüğünüz gibi tuvalde Veri sekmesine gittim ve verilerimi buradan görebiliyorum ancak veri dönüştürme işlemlerini bu pencereden yapmıyorum. Bu tuval bana görselleştirmede yardımcı olacak. Her türlü veri dönüştürme işini sorgu düzenleden yapıyorum. Bu ekran benim verilerimi istediğim gibi editleyip başka veri kaynaklarıyla birleştirmemi sağlıyor. Bizim bütün işimiz sorgu düzenleyicide olacak.
Power BI Desktop Tab Menü> Giriş> Sorguları Düzenle
Bu ekrana geldiyseniz önce burayı biraz tanıyalım. Sorgu tuvalinde Power BI’a aktardığım tüm dataları “Sorgular” panelinden görebilirim. Tuvalin ortası seçtiğim datanın içindeki verileri göstermekte. Burada gördüğüm datalara istediğim gibi müdahale edebilirim. Ekranın sağ tarafında ise “Sorgu Ayarları” paneli mevcut.
Sorgu ayarları panelinde içeri aldığınız her veri için yaptığınız her işlemi burdan takip edebilirsiniz. Ben henüz herhangi bir işlem yapmadığım için adımlarda sadece Source (Kaynak), Navigation (Gezinti) ve Changed Type (Değiştirilen Tür) var. Hemen kısaca bunlardan bahsedeyim.
Source: Bu adım bana dataları nereden aldığımı gösteriyor. Yukarıda da söylediğim gibi bu verileri wikipediadan aldığım için adres çubuğunda wikipedia’nın URL’ini ve dosya tipinde de HTML sayfasını görüyorum. Ayrıca buraya panelde yer alan source’un yanındaki dişliyi tıklayarak da gelebilirim.
Navigation: Wikipediadan aldığım tüm tabloları gösteriyor. Hangi tabloyu tıklarsam bana sadece o tabloyu getiriyor.
Changed Type: Verileri alırken yapılan veri tipinin değişiminden bahsediyor. Mesela metinlerin sayıya ya da sayıların metine dönüştürülmesi gibi.
Şimdi dataları biraz düzenleyelim. Önce satır silmeyle başlayalım çünkü ilk 2 satır benim işime yaramayacak. Bunun için tab menüdeki satır kaldır’a geliyorum ve satırı nasıl kaldırma istediğimi seçip satır sayısını giriyorum. Ben üstten 2 satır gitsin istediğim için boxa 2 yazıyorum. Bunun gibi alttan ya da seçtiğim satırlar dışındakileri ya da yenilenen satırları ya da boş satırları sil de diyebilirim. Size kalmış..
Tamam dedikten sonra ekranın sol altında 14 sütun, 118 satır kaldığını görebiliyorum. Aynı zamanda Sorgu ayarı panelinden “Removed Top Rows” adımından bu işlemi gerçekleştirdiğini takip edebilirim. Eğer yaptığım işlemi geri almak istersem de uygulanan adımlar’dan ilgili adımın yanındaki X‘e basmam yeterli. Yaptığım herhangi bir işlemi buradan geri alabilirim.
Benzer şekilde sütun silme eylemine bakalım. İşime yaramayacak olan “Header” kolonunu kaldırmak için sağ tık ile gelen menüden “kaldır”ı tıklıyorum ve header’ı uçuruyorum. Satırda olduğu gibi sütun için de değişik silme tipleri mevcut. Seçtiğim sütun dışındakileri silmek için “diğer sütunları kaldır”ı seçebilirsiniz.
Hemen Sorgu alanında “Removed Columns”ın gelmesiyle tablomdan kolonun kalktığını görüyorum.
Z[I] kolonunun adını ve veri tipini değiştirmek istiyorum. Görüldüğü gibi hücrelerdeki değerler rakam ama veri tipi metin. Sağ klick ile “tam sayı”ya çeviriyorum. Yeri gelmişken Power BI’daki 3 çeşit sayı tipinden kısaca bahsedeyim.
- 1.2 Ondalık Sayı: Görselden de anlaşılacağı gibi ondalık sayıları ifade eder.
- $ Sabit Ondalık Sayı: Para birimidir.
- 123 Tamsayı: Tam sayılar için kullanılır.
Power BI sayı çeşitliliği bakımından SSIS kadar zengin değil. SSIS’de 29 çeşit evet yanlış okumadınız 29 çeşit sayı tipi var. Sadece integer için bile 8 tip mevcut. Ama Power BI’ın da date tiplerinde hakkını vermeliyim. Yeri gelince onlardan da bahsedeceğim. Konuyu dağıtmadan kolon ismi değiştirmeye dönüyorum ve kolonda sağ klick ile “yeniden adlandır” diyorum ve “ElementID yapıyorum. Dikkat ettiyseniz veri tipi metinden rakama değiştirilince hücre içindeki veriler sağa kaydı. Tıpkı excelde olduğu gibi.
Veri dönüştürmede en çok kullanılan bir diğer işlem sütun bölmeden bahsedeyim. Sütun bölme verileri birleştirmede oldukça işimize yarayan bir özellik. Özellikle sütunların doğru şekilde bölünmesi başka sütunlarla birleştirilirken önem arz ediyor. Wikipedia’dan aldığımız kimyasal elementler tablosunda “Atomic Weigth” kolonu hem rakam hem de metin içeriyor. Ben sadece rakam içersin istiyorum. Dolayısıyla amacım parantez içlerini hücreden ayıklamak.
Sorgu Düzenleyicisi > Giriş > Sütunu Böl ya da Kolon üzerinde sağ klick ile de aynı pencereyi açabilirsiniz.
Sütunu bölmebileceğimiz seçenekler bize sunuluyor, benim örneğim için “Sınırlayıcıya göre böl”ü kullanacağım. Microsoftun bana sunduğu sınırlayıcılara göre değil de özel olarak parantez istediğim için Özel’i seçip sol parantez olarak belirtiyorum ve bölme konumunu en soldaki sınırlayıcı olarak değiştiriyorum.
Benzer şekilde köşeli parantez için de aynı işlemi tekrarlarsam elde edeceğim görüntü;
olacak. Parantezlerden tamamen kurtulduğumda PowerBI artık bu kolonun sayılardan oluştuğunu gördüğü için veri tipini direkt tam sayıya çevirdi. Ayrıca böldüğüm kolonları da ana kolonla ilişkilendirmek için suffix (alt takı) verdi. Ana kolonum “Atomic Weight 1.1” olurken diğerleri de 1.2 ve .2 oldu. Böylece bu kolonların split edildiğini anlayabiliyorum.
En sık işimize yarayacak olan veri dönüştürmeleri göstermeye çalıştım.