Power BI’ da Farklı Veri Kaynaklarının Birleşimi Üzerine Uygulama

Herkese merhaba,

Hatırlarsanız daha önceden Wikipedia’dan kimyasal element listesini Power BI’a aktarmıştım. Hatırlamıyorsanız da ilgili postuma bakabilirsiniz. Bugün yine wikipediadan kiyasalların gözlenme ve keşif yıllarını excel dosyası olarak bilgisayarıma kaydedip ardından Power BI’da iki farklı veri kaynağından aldığım dataları kullanarak rapor oluşturacağım ama öncesinde mevcut Data kümem ListOfElements’de yaptıklarımı sıralıyorum;

  • Bazı kolonların türlerini düzenledim. Meselam Atomic Weigth metin tipinde gözüküyor ancak içeriğindeki bilgi ondalık sayı. Dolayısıyla önce tüm “.” işaretini “,”e çevirdim ve veri türünü ondalık yaptım gibi..
  • Error (hata)’lara henüz dokunmadım. Bunlarla daha sonra ilgileneceğiz. Yaptığım değişiklikleri tek tek yapmak yerine direkt indirmek isterseniz GitHub‘ımda bulabilirsiniz.
  • Wikipedia’dan kimyasalların keşif yılları tablosunu (ancient discoveries) bilgisayarımda excele kopyaladım ve düzenledim. İsteyenler benim hazırladığım excel dosyasını GitHub ‘dan indirebilirler. Herşeyi düzenleyip dosyayı içeri aktardığımda modelleme alanında tablolarım ve kolonlarım aşağıdaki gibi gelmiş olmalı.

Adsız

Power BI’a data aktarımının ardından tuvaldeki Alanlar panelinde iki farklı kaynaktan-wikipedia ve excel-içeri aktardığım iki data kümesini yukarıdaki gibi görüyorum. Burada dikkat etmeniz gereken nokta iki farklı kaynaktan gelen dataları aynı raporda kullanabilmem için bu tablolar arasında ilişki olması gerekir. İki tablo arasında ilişki kurabilmek için de ortak kolon olması gerekmektedir. Daha detaylı bilgi için şu postuma bakabilirsiniz. Yukarıdaki tablolara baktığımda Element ID kolonlarının aynı olduğunu görüyorum. Dolayısıyla iki tabloyu birbiriyle eşleştirebilir ve datalarını kullanabilirm-merak etmeyin Power BI ortak kolon görünce tablolar arası ilişkiyi kendisi kuruyor ama yinede kontrol etmekte fayda var.

Önce aynı tablo içindeki kolonlarla Sembollere göre grup numaraları pasta grafik (pie chart) yapalım. Yani hangi element hangi gruba ait ya da grupsuz olan kaç element var bunları görelim. Bunun tuvaldeki rapor ekranına geliyorum. Görsel ögeler panelinden tabloyu seçip Alanlar‘dan Symbol ve Group’u seçiyorum. Gelen tabloyu kopyalıyorum çünkü kopyaladığım tablonun şeklini piechart (pasta grafiği)’a çevirip hem tabloyu hem de chartı göreceğim.

Adsız

Siz Açıklama kısmından istediğiniz şekilde modelleme yapabilirsiniz. Grafiğin biçimiyle de oynayabilirsiniz. Bunun için Biçim‘i kullanabilirsiniz. Benim istediğim hangi gruptan kaç element olduğuydu, grafikten görüyorum ki boş ile beraber 13 grup kategorisi var ve meselam grubu olmayan 28 element var.

Bir başka analiz yapalım. Bu sefer de gruplara ait elementlerin ortalama kaynama noktalarına (Boiling Point) bakalım. Bunun için yeni sayfa açıyorum, hatta sağ klick ile sayfaların isimlerini de değiştirebilirim. Aşağıdaki resimde gördüğünüz gibi Tablomda symbol, group ve Boiling Point var. Benzer şekilde tabloyu kopyalayıp yapıştırıyorum ve görselini huni olarak seçiyorum. Siz istediğinizi seçebilirsiniz. X ve Y Eksenini düzenledim.

Adsız

Sadece şuna dikkat etmeniz gerekir, Değerler kısmında Boiling Point’in ortalamasını istediğim için sağ klick ile açılan pencereden X eksenindeki değerin ortalamasını seçiyorum. İsterseniz değerlere başka parametreler de ekleyebilirsiniz. Sizin hayal gücünüze kalmış.

Adsız

En son olarak da iki farklı kaynaktan aldığımız dataları kullanarak rapor oluşturalım kabaca. Görmek istediğim şey gruplara ait elementler ortalama hangi yıllarda keşfedilmiş. Biliyorsunuz yıl kolonum ObservationDate tablosunda-ki bunu excelden almıştık ama group kolonum ListofChemicals‘da-ki bunu da wikipediadan almıştım. İlgili kolonları modelleme alanından seçiyorum ve önce tablomu oluşturup ardından kümelenmiş sütun grafiğine kolonları yerleştiriyorum ve aşağıdaki grafik çıkıyor karşıma. Görüyorum ki 11.grup elementler 1950’lerden sonra altın çağını yaşamış..

Adsız

Belirtmek istediğim en öncemli nokta iki tablo arasındaki ortak kolon, Element ID. Eğer bu kolon olmasaydı iki tabloyu ilişkilendiremeyeceğim için hangi hücreye hangi hücre karşılık geleceğini bilinemeyeceği için görsel çizilemeyecek ya da tablo oluşturulamayacaktı.

Grafikleri çeşitlendirmek tamamen size kalmış.  Ayrıca bu örneklerin yer aldığı PowerBI dosyasını GitHub‘ımdan indirebilirsiniz.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s