Brand Name

LinkPlus Blog

Öngörülü Modelleme İşlevleriyle Tableau'da Tahminler Oluşturun

Son birkaç ay içinde birçok müşteri ile Tableau'nun öngörücü işlevselliğinde daha fazla esneklik ve güç ihtiyacı hakkında konuştuk. İnsanlar bir zaman eksenine dayanmayan tahminler yapmaya, seyrek verileri doldurmaya, aykırı değerleri belirlemeye, tahminlerini ek hesaplamalarda kullanmaya ve veri dosyalarına aktarmaya istekli. Tableau 2020.3'ün, müşterilerimize tanıdık tablo hesaplama altyapısını kullanarak Tableau içinde tahminler oluşturmak için esnek ve yeni bir yol sunacağını duyurmaktan heyecan duyuyoruz.

Bu yazıda, Dünya Göstergeleri veri kümesinde kişi başına sağlık harcaması ile kadın yaşam beklentisi arasındaki ilişkiyi araştırarak yeni öngörülü modelleme işlevlerini tanıtacağız.

Akıllı modelleme işlevleri nelerdir?

Öngörülü modelleme işlevleri, analistlerinizin ellerine güçlü istatistiksel modelleme araçları yerleştirerek, tahmin modellerini hızlı bir şekilde oluşturmalarını ve güncellemelerini sağlar. Tableau'dan hiç ayrılmadan verilerinizdeki ilişkileri anlamak, eksik verileri tahmin etmek ve gelecekteki verileri yansıtmak için bu işlevleri kullanabilirsiniz.

Öngörülü modelleme işlevleri, kendi öngörücülerinizi seçme, model sonuçlarını diğer tablo hesaplamalarında kullanma ve tahminlerinizi dışa aktarma konusunda tam esneklik sağlar. Tahminler, görüntülenen verilere göre yeniden değerlendirilerek gereksiz işaretlere filtre uygulamanızı ve seçilen verilerden modeller oluşturmanızı sağlar. Ayrıntı düzeyini değiştirdiğinizde, işaretleri ekleyip kaldırdığınızda ve ek özelliklere göre alt bölümlere ayırdıkça modeller ve tahminler yeniden değerlendirilir. R veya Python'da analiz uzantılarına erişmenize veya kod yazmanıza gerek yoktur. Öngörülü modelleme işlevleri tablo hesaplamaları olduğundan, görselleştirmeleri paylaşma ve verileri dışa aktarma da dahil olmak üzere mevcut tüm tablo hesaplama işlevlerine erişebilirsiniz.

Bu iki yeni tablo hesaplaması, MODEL_PERCENTILE ve MODEL_QUANTILE, verileriniz içinde tahminler ve yüzey ilişkileri oluşturmak için Tableau'nun benzersiz istatistik motorunu kullanır. Bunları Tableau'daki örnek çalışma kitaplarına dahil olan tanıdık Dünya Göstergeleri veri kümesiyle nasıl kullanacağımıza dair örneklere bakalım, bu hesaplamaları nasıl oluşturacağınız ve bu hesaplarla nasıl çalışacağınız hakkında daha fazla ayrıntıya girelim.

Tahminli modelleme fonksiyonları nasıl kullanılır?

Her ülkenin sağlık harcamalarını kadın ömrüne kıyasla karşılaştıran, 2012 yılına göre filtrelenen bir görselleştirmeyle başlayın. Bu çok çarpık bir veri seti olduğundan, sağlık harcama ekseninde logaritmik bir dönüşüm kullanmanın yanısıra sağlık giderleri için öngörücü olarak logaritmik bir dönüşüm kullanacağız.

https://cdnl.tblsft.com/sites/default/files/blog/image1_43.png

Sağlık harcamalarını ve kadın yaşam beklentisini MODEL_PERCENTILE ile modelleme

Öncelikle, medyan sağlık harcamalarını kadın yaşam beklentisi için bir belirteç olarak kullanarak MODEL_PERCENTILE tablo hesaplamamızı oluşturalım:

Percentile_LifeExpFemale_HealthExpend


MODEL_PERCENTILE(AVG([Life Expectancy Female]),
LOG(MEDIAN([Health Exp/Capita])))

MODEL_PERCENTILE nedir?

MODEL_PERCENTILE, gözlemlenmeyen bir değerin, target_expression tarafından tanımlanan ve kullanıcının seçebileceği diğer öngörücülere dayanan gözlemlenen işaretten küçük veya ona eşit olma olasılığını döndürür. Bu, Kümülatif Yoğunluk Fonksiyonu (CDF) olarak da bilinen Posterior Predictive Distribution Fonksiyonudur. Bu hesaplama 0 ile 1 arasında bir değer döndürür.

46 inç beş yaşında bir kız çocuğunun uzunluk olarak 95inci yüzdelikte olduğu çocuk gelişim çizelgelerindeki yüzdeliklere aşinasınızdır: Aynı yaşta kız çocuklarının %95’i onun olduğundan daha kısa.

Syntax
MODEL_PERCENTILE(
target_expression,
predictor_expression(s)
)

target_expression: target_expression, model tarafından değerlendirilen ölçüdür. MODEL_PERCENTILE için model, hedef ifade tarafından tanımlanan işareti değerlendirecektir.

prediktör_ifadesi / ifadeleri: İkinci ve ek argümanlar, modeli tanımlamak için kullanılan öngörücülerdir. Müşteriler boyutları, hesaplamaları veya her ikisini de belirleyici olarak kullanabilir.

MODEL_PERCENTILE komutunu veritabanınızdaki korelasyonları ve ilişkileri ortaya çıkarmak ve aynı zamanda çok değişkenli girişler verilemeyen işaretleri belirlemek için kullanabilirsiniz. MODEL_PERCENTILE tarafından döndürülen değer 0,5'e ne kadar yakınsa, seçtiğiniz diğer öngörücüler göz önüne alındığında, modellenen değer aralığının medyanına o kadar yakın olur. MODEL_PERCENTILE, 0 veya 1'e yakın bir değer döndürürse, seçtiğiniz diğer öngörücüler göz önüne alındığında, gözlenen işaret, modelin beklediğinin alt veya üst aralığına yakındır.

MODEL_PERCENTILE kullanımı

Percentile_LifeExpFemale_Health'e renk sürükleme ve Hesaplama Kullanımı ayarını yapma: Ülke / Bölge, tüm görünür işaretler için yaşam beklentisini ve sağlık harcamalarını değerlendirerek Tableau'nun bu işaretlerden bir model oluşturmasına ve bu modeldeki her biri için yüzdeliği döndürmesine izin verir. Sağlanan finansman düzeyi için sağlık beklentisinin beklenenden daha yüksek ve düşük olduğu ülkelerin dağılımını görebiliriz. Koyu kırmızı işaretler sağlık harcamalarına göre yaşam beklentisinin yüksek olduğunu gösterir; koyu mavi, sağlık harcamalarına göre yaşam beklentisinin düşük olduğu anlamına gelir; ve gri, yaşam beklentisinin sağlık hizmeti harcama düzeyine bağlı olarak modellenen değer aralığının ortasına yakın olduğu anlamına gelir.

https://cdns.tblsft.com/sites/default/files/blog/image4_17.png

Görsel analizi daha da basitleştirmek için, sonuçları gruplandırmak için Percentile_LifeExpFemale_HealthExpend öğesini yeni bir hesaplamada kullanabiliriz. Gruplar oluşturacağız, böylece 90. yüzdelik dilimin üstündeki veya 10. yüzdelik dilimin altındaki işaretler birlikte gruplandırılacak; 80. ve 90. yüzdelik dilimler arasındaki işaretler veya 10. ve 20. yüzdelik dilimler arasındaki işaretler birlikte gruplanır, vb. İşaretleri boş bir yüzdelik değerle vurgulayacağız. Bu konuya daha sonra geri döneceğiz.

Color_Percentile_LifeExpFemale_HealthExpend
IF
ISNULL([Percentile_LifeExpFemale_HealthExpend])
THEN "Null"
ELSEIF [Percentile_LifeExpFemale_HealthExpend] >= 0.9 OR [Percentile_LifeExpFemale_HealthExpend] THEN "90th percentile"
ELSEIF [Percentile_LifeExpFemale_HealthExpend] >= 0.8 OR [Percentile_LifeExpFemale_HealthExpend] THEN "80th percentile"
ELSEIF [Percentile_LifeExpFemale_HealthExpend] >= 0.7 OR [Percentile_LifeExpFemale_HealthExpend] THEN "70th percentile"
ELSEIF [Percentile_LifeExpFemale_HealthExpend] >= 0.6 OR [Percentile_LifeExpFemale_HealthExpend] >= 0.4
THEN "60th percentile"
ELSE "50th percentile +-10"
END

Bunu rengin üzerine sürükleme, Hesaplama Kullanımını ayarlama: Ülke / Bölge ayarlamak ve renk paletimizi ayarlamak, kadın yaşam beklentisinin ülkenin sağlık harcamalarına göre üst veya alt sınırlarda olduğu ülkelerin dağılımını görmemize yardımcı olur. Artık sağlık harcamalarının kadın yaşam beklentisinin daha doğru bir öngörücüsü olduğu yeşil bandı ve bu korelasyonun zayıf olduğu kırmızı, turuncu ve sarı işaretleri açıkça görebiliyoruz.

https://cdns.tblsft.com/sites/default/files/blog/image6_9.png

Sağ üst köşedeki turuncu işarete bir göz atalım. Amerika Birleşik Devletleri, kadın yaşam beklentisi 81 olarak elde etmek için 8895 dolar harcıyor. Yatay olarak hareket edersek, kadın yaşam beklentisi 81 olan diğer ülkelerin harcama düzeylerini görebilirsiniz: Çek Cumhuriyeti 1432 dolar, Polonya 854 dolar harcıyor ve Küba sadece 558 dolar harcıyor. Modelin, ABD'nin modelin beklenen değerlerinin en üstünde ve Küba'nın modelin beklenen değerlerinin daha düşük olduğu her noktada ilişkinin gücünü nasıl değerlendirdiğini de görebilirsiniz.

Şimdi, bu modeli kadın yaşam beklentisini ve doğum oranını karşılaştıran bir vizeye eklediğimizde ne olacağını görelim. Temel veriler bize doğum oranları arttıkça, kadınların yaşam beklentisi azalması ile bir ilişki olduğunu göstermektedir1; bu arada, Color_Percentile_LifeExpFemale_HealthExpend to renge uygulamak, modelin kadın yaşam beklentisinin sağlık harcamaları açısından nerede daha yüksek veya daha düşük olacağını beklediğini görmemizi sağlar.

https://cdnl.tblsft.com/sites/default/files/blog/image5_9.png

Burada veriler çok daha dağılmış durumda. Sağ alt köşede yaşam beklentisinin en düşük, doğum oranının en yüksek ve sağlık harcamalarının yaşam beklentisine göre düşük olduğu kırmızı bir bölge görebilirsiniz. Ancak sol üst çeyreğin iki kırmızı işaretine daha yakından bakalım.

https://cdns.tblsft.com/sites/default/files/blog/image9_2.png

Arnavutluk ve Ermenistan'da kadınların yaşam beklentisi oldukça yüksek, nispeten düşük doğum oranları var ve kişi başına sağlık hizmetlerine çok az harcanmaktadır. Arnavutluk sadece 228 dolar ve Ermenistan sadece 150 dolar harcıyor. MODEL_PERCENTILE'ı, bu iki ülkenin yüksek kadın yaşam beklentisiyle eşleştirilmiş düşük sağlık harcamaları açısından aykırı olduğunu tespit etmek ve bu anlayışı doğum oranları bağlamına yerleştirmek için kullanabildik.

https://cdns.tblsft.com/sites/default/files/blog/image7_6.png

MODEL_QUANTILE ile eksik değerleri tahmin etme

Her iki görselleştirmemizde de, MODEL_PERCENTILE işlevi için "boş" sonuçlara sahip ülkelerin dağıldığını görebiliriz: bu ülkelerde sağlık harcamaları için veriler eksik. İşte bu eksik değerleri tahmin etmek için MODEL_QUANTILE kullanabilirsiniz.

MODEL QUANTILE Nedir?

MODEL_QUANTILE, kullanıcının seçebileceği diğer öngörücülere dayanarak, belirtilen bir yüzdelik değerde bir hedef değer döndüren bir tablo hesaplamasıdır. Bu Posterior Predictive Quantile. Hesaplama, hedef ifade ve öngörücüler tarafından tanımlanan olası aralık dahilinde sayısal bir değer döndürür ve MODEL_PERCENTILE öğesinin tersidir.

Syntax
MODEL_QUANTILE(
percentile,
target_expression,
predictor_expression(s)
)

Yüzdelik (Percentile): İlk argüman, 0 ile 1 arasında bir ondalık sayı olmalı ve hangi yüzdelik değerin tahmin edilmesi gerektiğini belirtir; örneğin, yüzdelik dilim 0.5, tahmin edilen medyanı üretecektir. Biri yüzdelik olarak 0.05, diğeri yüzdelik olarak 0.95 kullanan iki MODEL_QUANTILE hesaplaması oluşturmak, % 90 güven aralığının alt ve üst sınırlarını döndürür.

target_expression (Hedef ifade): İkinci argüman tahmin edilecek ölçü veya "hedef" tir.

predictor_expression (Öngörücü ifade/ ifadeleri): Üçüncü ve ek argümanlar, modeli tanımlamak için kullanılan öngörücülerdir. Boyutları, hesaplamaları veya her ikisini de öngörücü olarak kullanabilirsiniz.

Belirttiğiniz öngörücüler ve hedef yüzdelik değer göz önüne alındığında, sayısal tahminler oluşturmak için MODEL_QUANTILE kullanabilirsiniz. MODEL_QUANTILE eksik değerleri tahmin edebilir, gelecek tarihler için izdüşümler yapabilir ve görünmeyen boyut kombinasyonları için tahminleri üretebilir. Ayrıca, bu tahminler için belirsizlik düzeyini ölçmek üzere güven aralıkları oluşturmak için kullanabilirsiniz.

MODEL_QUANTILE Kullanımı

Percentile_LifeExpFemale_HealthExpend ile çalışıyoruz:


MODEL_PERCENTILE(AVG([Life Expectancy Female]),
LOG(MEDIAN([Health Exp/Capita])))

Ancak şimdi kadın yaşam beklentisine dayalı sağlık harcamaları için bir tahmin elde etmek amacıyla bu işlevi tersine çevirmek istiyoruz. Bu bir MODEL_QUANTILE işlevi oluşturarak başlar:

MODEL_QUANTILE(0.5,LOG(MEDIAN([Health Exp/Capital)),AVG([Life Expectancy Female]))

Bu durumda, yaşam beklentisini bir öngörücü olarak kullanarak, ortalama Sağlık Harcamaları için potansiyel log-transformed2 değerleri aralığının medyanını (0.5) tahmin edeceğiz. Bununla birlikte, bu işlev harcamaların günlük dönüşümünü döndürdüğü için, yine de dolara geri çevirmemiz gerekiyor. Bu nedenle, her şeyi aşağıda gösterildiği gibi bir POWER ifadesine sarmamız gerekiyor:

Quantile_HealthExpend_LifeExpFemale:


POWER(10,MODEL_QUANTILE(0.5,LOG(MEDIAN([Health Exp/Capita])),
AVG([Life Expectancy Female])))

Araç ipucuna Quantile_HealthExpend_LifeExpFemale ekleme ve Hesaplama Kullanımı: Ülke / Bölge, modelin sağlık harcamalarının kadın yaşam beklentisine dayanarak ne tahmin etmesi gerektiğini görmemizi sağlar.

https://cdnl.tblsft.com/sites/default/files/blog/image2_36.png

Ancak, bu sonuçlara biraz daha yakından bakalım. Yatay olarak hareket etmek ve tüm veri noktalarını belirli bir yaşam beklentisiyle incelemek, modelin her bir işaret için aynı tahmini harcamayı sağladığını gösterir. Yalnızca bir öngörücü (kadın yaşam beklentisi) kullandığımız için model, öngörücünün aynı değere sahip olduğu tüm işaretler için aynı sonuçları döndürüyor. Bölge'yi başka bir yordayıcı olarak ekleyerek modele daha fazla nüans ekleyebiliriz.

Quantile_HealthExpend_LifeExpFemale,Region:


POWER(10,MODEL_QUANTILE(0.5,LOG(MEDIAN([Health Exp/Capita])),
AVG([Life Expectancy Female])),
ATTR([Region]))

Bunu araç ipucuna eklemek, şimdi modelin her yaşam beklentisi ve bölge için farklı sağlık harcama tahminleri ürettiğini gösteriyor. Bu hesaplamaları oluştururken, hedef değeriniz için iyi bir öngörücü olacak alanları düşünün ve hesaplamaya ekleyin. Tahmincilerinizde istediğiniz sayıda boyutu ve ölçüyü birleştirebilirsiniz; burada, tahminlerinizi iyileştirmek için GDP, nüfus veya diğer önlemleri ve boyutları da ekleyebilirsiniz.

https://cdns.tblsft.com/sites/default/files/blog/image3_24.png

Görüşümüzü daha da basitleştirmek için, fiili ve öngörülen değerleri birleştiren hesaplamalar da yapabiliriz, mevcutsa fiili sağlık harcamalarını ve mümkün olmayan yerlerde tahmini harcamaları gösterebiliriz.

HealthExpend Actual+Predict (value)
ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)

HealthExpend Actual+Predict (tag)
STR(IF ISNULL(AVG([Health Exp/Capita]))
THEN "(Estimate)"
ELSE "(Actual)"
END
)

https://cdns.tblsft.com/sites/default/files/blog/image8_4.png

LinkPlus, 1995 yılında kurulmuş ve bilgi teknolojileri alanında faaliyet gösteren bir firmadır.

All Rights Reserved - LINKPLUS.COM.TR 2020 - Website and CRO Optimization: Popupsmart