Distribuicão Kumaraswamy

E suas aplicações

Alisson Rosa
Vítor Pereira
João Inácio

Universidade Federal de Santa Maria

Sumário


  • Características Básicas


  • Aplicações


  • Bibliografia

Motivação



  • Foi introduzida em Kumaraswamy (1980) como uma alternativa ao modelo beta para aplicações na área de hidrologia;

  • Como a distribuição tem atraído atenção e recente, inclusive por parte da comunidade da UFSM, resolvemos buscar outras modelagens por parte da Kumaraswamy;

  • O desfloramento é uma questão central para os próximos anos em políticas públicas, então um modelo estatístico para previsão e inferência, torna-se essencial para as tomadas de decisões.

  • Em virtude deste fato, grande parte dos trabalhos empíricos desta distribuição concentra-se nessa área Nadarajah (2008).


Quantidades básicas


  • Seja X uma variável aleatória que segue uma distribuição Kumaraswamy, então sua Função de distribuição acumulada é dada por:

\[\begin{align} F(x;\alpha, \beta) = 1 - (1 - x^\alpha)^\beta, \quad 0 < x< 1 \end{align}\]

  • E sua Função densidade de probabilidade (pdf) por consequência fica dada por: \[f(x;\alpha, \beta) = \dfrac{dF}{dx} =\alpha\beta x^{\alpha - 1}(1 - x^\alpha)^{\beta - 1}, \quad 0<x<1\]

  • Onde \(\alpha, \beta > 0\)

Quantidades Básicas

Sua qf, que é a função inversa da cdf, fica definida como:

\[\begin{align} Q(u;\alpha, \beta) = \bigg(1 - (1 - u)^{1/\beta}\bigg)^{\dfrac{1}{\alpha}}, \quad 0<u<1 \end{align}\]

É FÁCIL ver que que a esperança da distribuição Kumaraswamy é dada por

\[\begin{align} \text{E}(X) = \dfrac{\beta\Gamma\bigg(1 + \dfrac{1}{\alpha}\bigg)\Gamma(\beta)}{\Gamma\bigg(1 + \dfrac{1}{\alpha} + \beta\bigg)} \end{align}\]

Quantidades Básicas

A função de verossimilhança é dada por:

\[\begin{align} L(\alpha, \beta; x) = \prod_{i=1}^{n}f(x;\alpha, \beta) = \alpha^n \beta^n \prod_{i=1}^{n}x_i^{\alpha - 1}\prod_{i=1}^{n}(1-x_i^{\alpha})^{\beta-1} \end{align}\]


  • Dessa maneira, os estimadores dos parâmetros são encontrados tais quais maximizam a função \(L\)


  • Nesse caso, a solução para o máximo de \(L\) para os dados observados é encontrado usando a biblioteca scipy da linguagem Python

Densidade para alguns valores de parâmetros

Aplicações (ão)

Banco de dados

Nosso banco é proveniente do projeto PRODES do INPE disponilizado aqui. Sendo transformado por nós ficando com apenas três variáveis:



  • Taxa de desflorestamento: Área desmatada até 2021 sobre Área do município;
  • Estado;
  • Município.

Medidas Básicas

prop
count 760.000000
mean 0.375088
std 0.337627
min 0.000000
25% 0.026827
50% 0.317664
75% 0.683185
max 1.004082

Média de desmatamento por estados

Ajuste do modelo

Métricas para cada distribuição

Kumaraswamy Beta Normal Vencedor
0 -440.933936 -443.086140 -154637.091792 Normal
1 -440.918084 -433.819504 -154627.825155 Normal
2 -431.667299 -443.070288 -154637.075940 Normal
3 18.106283 9.736648 767.892814 Normal
4 9.691977 1.251566 64.378061 Normal
5 0.088746 0.089166 0.537076 Normal

Nem tudo tem um fim


  • Perdeu em todas as métricas para Normal, mas teve um ajuste razoável em comparação com a Beta;


  • Distribuição Kumaraswamy teve um ajuste razoável com \(\hat{\alpha}=0.5\) e \(\hat{\beta}=1\);


  • Um competidora com as distribuições no (0,1) que com covariáveis pode ter melhor desempenho.

Bibliografia

Kumaraswamy, Ponnambalam. 1980. “A Generalized Probability Density Function for Double-Bounded Random Processes.” Journal of Hydrology 46 (1-2): 79–88.
Nadarajah, Saralees. 2008. “On the Distribution of Kumaraswamy.” Journal of Hydrology 348 (3): 568–69.
R Core Team. 2022. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.