Aplicação de modelos lineares de efeitos mistos para análise e previsão das vendas da empresa Doce Mel, 2019 - 2022

TRABALHO DE LICENCIATURA EM ESTATÍSTICA

(Autor) Rivaldo Carlos Boa

UNIVERSIDADE EDUARDO MONDLANE

(Supervisor) Adelino Juga, PhD

2023-11-03

1 Introdução

  • A análise e previsão de vendas é parte fundamental de uma estratégia de operação de qualquer organização. Assim através da estatística pode-se:
    • Analisar vendas através de técnicas estatísticas;
    • Prever as demandas de vendas.

1.1 Contextualização

  • A analise e previsão de vendas é parte importante de qualquer organização para entender a participação de mercado (Melo and Alcântara 2011).

    • Os dados de vendas típicos têm uma estrutura hierárquica. São longitudinais, como cortes transversais e séries temporais (Carvalho 2016).
    • Portanto, a analise e previsão de vendas é de extrema importância, pois possibilita:

      • Planear os processos de produção e distribuição das vendas;

      • Adequar modelos estatísticos que acomodam dados longitudinais.

  • A empresa Doce Mel actua colecta dados desde 2019, dedicando-se a compra e revenda de açúcar.

    • Localizada na província de Maputo distrito da Manhiça;
      • Sendo a transformação dos sacos de 50 kg para 1 kg é feita pela empresa com auxilio dos seguintes matérias:

        • Plástico;

        • Balança e;

        • Uma maquina de selar o plástico.

    • Durante o processo de empacotamento o grande foco é a redução da variabilidade dos pesos em kg das unidades,
      • Garantindo a qualidade e satisfação do cliente em relação ao peso do produto.
    • Produto vendido
  • 1.2 Definição do problema

    • A empresa Doce Mel actua no mercado em quase todos os meses do ano, menos nos meses de Janeiro, Fevereiro, Março e Abril.
    • A empresa Doce Mel definiu uma estratégia que garantiu como fornecedor a empresa multinacional Maragra.

      • A multinacional Maragra vende o açúcar durante o período de campanha (período de produção do açúcar pela empresa Maragra).

        • Durante os meses escassez, a empresa Doce Mel fica sem açúcar para vender.

          • Analisando o período de escassez de açúcar surge a seguinte questão:
            • Qual é a quantidade ideal a comprar a cada interrupção de produção do fornecedor para que a empresa Doce Mel continue com as vendas?
  • 1.3 Objectivos

    • 1.3.1 Objectivo geral

      • Aplicar os modelos lineares de efeitos mistos para analisar e prever as vendas da empresa Doce Mel entre 2019 e 2022.
  • 1.3.1.1 Objectivos específicos

    • Usar os gráficos de controle de qualidade \(\bar{x}\) e R para calcular o número médio de unidades vendidas que não satisfazem as especificações pré-estabelecidas;

    • Comparar as vendas semanais das lojas no início e ao longo do tempo;

    • Prever as vendas das lojas da empresa para os meses de escassez;

    • Construir um aplicativo web (Dashboard) para facilitar a visualização dos dados e auxiliar na tomada de decisão para empresa Doce Mel.

1.4 Relevância do estudo

  • O (MIC 2016), está a levar a cabo desde 2016 uma campanha denominada “Quero Ser Formal” cujo seu principal objectivo consiste em:

    • Capacitar os vendedores informais em ferramentas de contabilidade e gestão.
  • Mais de 80% do sector informal da economia é realizado por mulheres (Osório 2021). Portanto

    • Estudos relacionados a esta área são de extrema importância, pois, podem fornecer informações que permitem

      • Ao governo definir politicas que favoreçam empreendedores Moçambicanos a investir e prosperar em território nacional.
  • Por outro lado, o presente trabalho pode ser considerado como um espelho do domínio de tecnologias de informação e;

    • Técnicas de análise e previsão que empresas do sector informal possuem;

      • Pois se o governo identificar tais empresas praticantes de variadas actividades

      • Criando um ambiente agradável de negócio trazendo-as ao sector formal.

      • Garantiria emprego e desenvolvimento para a população e consequentemente a melhoria de vida da mesma.

2 Revisão da Literatura

2.1 Breves conceitos sobre empresas

  • O sector das Micro Pequenas e Médias Empresas (MPME’s) tem um importante contributo para o desenvolvimento económico e social.

  • Nos países em desenvolvimento, estas empresas também são vistas como um instrumento importante para a erradicação da pobreza (Mulzer et al. 2019).

  • A definição de empresas é feita de acordo com o nível de desenvolvimento de um país e seus objectivos políticos.

  • Como mostram as tabelas abaixo:

  • Empresa por trabalhador.
    Pais Pequena empresa Media empresa
    Austrália 1\(\leq\) Trabalhadores\(\leq\) 9 20\(\leq\) Trabalhadores \(\leq\) 200
    México 1\(\leq\) Trabalhadores \(\leq\) 30 20\(\leq\) Trabalhadores \(\leq\) 100
    Suiça 1\(\leq\) Trabalhadores \(\leq\) 39 10 \(\leq\) Trabalhadores \(\leq\) 249
    Ruanda 1\(\leq\) Trabalhadores \(\leq\) 30 5 \(\leq\) Trabalhadores \(\leq\) 100
    Tanzânia 5\(\leq\) Trabalhadores \(\leq\) 49 50\(\leq\) Trabalhadores \(\leq\) 99
    Classificação das empresas segundo o volume de negócios em Moçambique.
    Classificação Número de trabalhadores Volume de negócios (Mt’s)
    Micro-Empresa 1\(\leq\) Trabalhadores \(\leq\) 4 até 1200000 (V_N\(\leq\) 1200000 )
    Pequena-Empresa 5\(\leq\) Trabalhadores \(\leq\) 49 1200000 \(\leq\) V_N \(\leq\) 14700000
    Media-Empresa 50\(\leq\) Trabalhadores \(\leq\) 99 14700000 \(\leq\) V_N \(\leq\) 29970000
  • 2.1.1 Perfil das MPME’s em Moçambique

    • A distribuição das MPME’s por sectores de actividade apontam que maior número de empresas encontra-se:
      • No sector do comércio a grosso e a retalho, e em serviços como reparação de veículos automóveis e motociclos.
  • 2.1.2 Controle estatístico do processo de qualidade

  • Garvin introduziu o conceito das oito dimensões da gestão da qualidade do produto.

  • Existem 8 dimensões da qualidade (Garvin 1987).

  • A mencionar

    • Desempenho;

    • Características;

    • Conformidade;

    • Conformidade com as especificações.

    • Durabilidade;

    • Serviço pós-venda e manutenção;

    • Estética;

    • Qualidade percebida.

  • 2.1.3 Características da qualidade

    • Características de qualidade é qualquer aspecto de um produto necessário para se conseguir a propriedade de ser adequado ao uso.

    • Tais características podem ser agrupadas em:

      • Físicas

      • Sensoriais

      • Temporal

      • E estas características podem ser agrupadas em dois grandes grupos a mencionar:

        • Atributos;

        • Variáveis.

      • O valor mais alto permissível para uma característica de qualidade é chamado limite superior de especificação (LSE).
      • E o menor valor permissível é chamado limite inferior de especificação (LIE).
  • 2.1.3.1 Gráfico de controle \(\overline{x}\) e R

  • Dois gráficos de controle comuns para análise de qualidade produtos ou serviços são os gráficos da média \(\overline{x}\) e o gráfico da amplitude R.

  • Gráfico de controle \(\overline{x}\)

    \[\begin{eqnarray} LSC&=&\overline{\bar{x}} + A_2\overline{R}\nonumber\\ LC&=&\overline{\bar{x}}\\ LIC&=&\overline{\bar{x}} - A_2\overline{R}\nonumber \end{eqnarray}\]

    Gráfico de controle R

    \begin{eqnarray} LSC&=&D_4\overline{R}\nonumber\\ LC&=&\overline{R}\\ LIC&=&D_3\overline{R}\nonumber \end{eqnarray}

  • Sendo \(A_2\,,\,D_3\,\,e\,\,D_4\) valores tabelados.

  • 2.1.3.1.1 Estimação da proporção de não conformidade
  • Com o objectivo de estimar a probabilidade de não conformidade com as especificações, é definido o Limite Inferior de Especificação (LIE)

  • E Limite Superior de Especificação (LSE), se a variável de controle segue distribuição normal com \(\mu=\overline{\bar{x}}\) tem-se que:

  • \[\begin{eqnarray} \hat{p}&=&P(x<LIE) + P(x>LSE) \\ &=& P (x<LIE)+[1-P(x<LSE)]\\ &=&\phi(\frac{LIE-\mu}{\hat{\sigma}}) + 1 - \phi(\frac{LSE-\mu}{\hat{\sigma}}) \end{eqnarray}\]
    • O valor \(\hat{p}\) estima a probabilidade de não conformidade com as especificações, com normalidade da variável de controle.

      • Portanto, o número estimado de produtos não conformes é dado por \(\hat{p}\times N_T\), onde \(N_T\) é o total de unidades produzidas.
  • 2.1.4 Modelos lineares generalizados

  • Com foco em contornar a suposição de normalidade (Nelder and Wedderburn 1972) introduziram os modelos lineares generalizados (MLG) em 1972 para acomodar não só variáveis resposta que seguem distribuição normal.

  • O MLG é dado pela equação abaixo, que é uma extensão do modelo linear clássico

    • \[\begin{eqnarray}\label{1000} Y=X\beta +\varepsilon \end{eqnarray}\]
  • 2.1.5 Modelos lineares mistos

  • Em estudos longitudinal, cada unidade experimental é observada pelo menos duas vezes, pode ocorrer uma dependência entre as respostas (Laird and Ware 1982).

  • O estudo longitudinal envolve a mensuração de duas ou mais observações da variável resposta em cada unidade amostral (Pinho, Nobre, and Singer 2015).

    • Um modelo misto geral pode ser formulado em dois estágios (Verbeke, Molenberghs, and Rizopoulos 2010), a mencionar:

    • \(1^\circ\) e \(2^\circ\) estágio

      1. \[ Y_i=Z_i\beta + \varepsilon_i \]
      2. \[ \beta_i= K_{i}\beta + b_i \]
      • Combinando as duas fases obtém-se o seguinte modelo: \[ Y_i= X_{i}\beta + Z_{i}b_i + \varepsilon_i \]
  • 2.1.5.1 Estruturas de matriz de co-variância

      • As co-variâncias entre as observações feitas na mesma unidade experimental pode ser modelado indirectamente através dos efeitos aleatórios (Singer, Nobre, and Rocha 2015).

      • A co-variância entre as observações no mesmo individuo podem ser modeladas pela combinação das matrizes de co-variância (Vonesh and Chinchilli 1997).

  • As estruturas são divididas em estrutura de co-variância de padrão homogéneo e heterogéneo (Singer, Nobre, and Rocha 2015), à mencionar:

  • Componentes de variância não correlacionado: \[\begin{equation} V=\begin{bmatrix} \sigma^2 & 0 & 0 & 0\\ 0 & \sigma^2 & 0 &0\\ 0 &0 & \sigma^2 & 0\\ 0&0&0&\sigma^2 \end{bmatrix}=\sigma^2\begin{bmatrix} 1 & 0 & 0 & 0\\ 0 & 1 & 0 &0\\ 0 &0 & 1 & 0\\ 0&0&0&1 \end{bmatrix} \end{equation}\]

    Auto regressivo: \[\begin{equation} V=\sigma^2\begin{bmatrix} 1&p&p^2&p^3\\ p&1&p^2&p^3\\ p^2&p&1&p^3\\ p^3&p^2&p&1 \end{bmatrix} \end{equation}\]

    Simetria composta: \[\begin{equation}\label{SCh} V=\sigma^2\begin{bmatrix} 1&p&p&p\\ p&1&p&p\\ p&p&1&p\\ p&p&p&1 \end{bmatrix} \end{equation}\]

    Não correlacionado: \[\begin{equation} V=\begin{bmatrix} \sigma^2_1 & 0 & 0 & 0\\ 0 & \sigma^2_2 & 0 &0\\ 0 &0 & \sigma^2_3 & 0\\ 0&0&0&\sigma^2_4 \end{bmatrix} \end{equation}\]

    Não estruturada geral: \[\begin{equation}\label{NEHE} V=\begin{bmatrix} \sigma^2_{11}&\theta_{21}&\theta_{31}&\theta_{41}\\ \theta_{21}&\sigma^2_{22}&\theta_{32}&\theta_{42}\\ \theta_{31}&\theta_{32}&\sigma^2_{33}&\theta_{43}\\ \theta_{41}&\theta_{42}&\theta_{43}&\sigma^2_{44} \end{bmatrix} \end{equation}\]

    Auto-regressivo de primeira ordem: \[\begin{equation} V=\sigma^2\begin{bmatrix} \sigma^2_1&p\sigma_1\sigma_2&p^{2}\sigma_1\sigma_3&p^{3}\sigma_1\sigma_4\\ p\sigma_2\sigma_1&\sigma^2_2&p^{2}\sigma_2\sigma_3&p^{3}\sigma_2\sigma_4\\ p^{2}\sigma_3\sigma_1&p\sigma_3\sigma_2&\sigma^2_3&p^{3}\sigma_3\sigma_4\\ p^{3}\sigma_4\sigma_1&p^{2}\sigma_4\sigma_2&p\sigma_4\sigma_3&\sigma^2_4 \end{bmatrix} \end{equation}\]

    Simetria composta: \[\begin{equation} V=\begin{bmatrix} \sigma^2_1&p\sigma_1\sigma_2&p\sigma_1\sigma_3&p\sigma_1\sigma_4\\ p\sigma_2\sigma_1&\sigma^2_2&p\sigma_2\sigma_3&p\sigma_2\sigma_4\\ p\sigma_3\sigma_1&p\sigma_3\sigma_2&\sigma^2_3&p\sigma_3\sigma_4\\ p\sigma_4\sigma_1&p\sigma_4\sigma_2&p\sigma_4\sigma_3&\sigma^2_4 \end{bmatrix} \end{equation}\]

  • 2.1.5.2 Estimação do modelo

    • Para a estimação destacam dois métodos (West, Welch, and Galecki 2022):
      • Método de máxima verosimilhança;
      • Método de máxima verosimilhança restrita.
  • Os MLM’s baseiam-se na maximização da função de verosimilhança conjunta de Y e b, obtendo as estimativas dos efeitos fixos \(\beta\) e aleatórios \(b\) (Resende et al. 1996).

  • De modo geral dividem-se os MLM’s em dois grupos: os modelos de padrão de co-variâncias e os modelos de coeficientes aleatórios.

      • \[\begin{equation}\label{ia} \large Y_{ij} =(\beta_0+b_{0i})+\beta_1t_{ij}+\varepsilon_{ij} \end{equation}\]
      • \[\begin{equation}\label{lla} \large Y_{ij} =\beta_0+(\beta_{1}+b_{1i})t_{ij}+\varepsilon_{ij} \end{equation}\]
      • \[\begin{equation}\label{IOO} Y_{ij} =(\beta_0+b_{0i})+(\beta_{1}+b_{1i})t_{ij}+\varepsilon_{ij} \end{equation}\]
  • 2.1.5.3 Desenvolvimento do aplicativo web

  • Com os avanços das tecnologias de informação, as empresas geram e lidam com cada vez maiores quantidades de dados (Guimarães 2020).

  • Face ao desenvolvimento da tecnologia os Dashboard estão em ascensão, sendo usados por empresas mundiais com a Google e Space X (Resnick 2006).

      • O R é uma linguagem de programação inicialmente criada para fins estatísticos mas que
        • Com o crescimento de sua popularidade, aumentou o seu escopo, sendo hoje uma das melhores ferramentas existentes para automação de tarefas

          • Através dos pacotes R MarKdown, Flexdashboard, Shiny e Quarto é possível:
      • Compilar documentos com formatos de saída, como PDF, HTML e Word;

      • Criar dashboards com Flexdasboard, Shiny e Shiny + Flexdasboard;

      • Criar Blogs e sites;

      • Escrever artigos científicos ou livros;

      • Criar apresentações em Power Point e HTML;

      • Criar mapas interactivos.

3 Material e Métodos

3.1 Material

  • A empresa Doce Mel faz colecta das quantidades de açúcar vendidos semanalmente desde 2019, em 7 lojas.

    • Ao todo foram analisadas 508 observações

    • Também foram mensurados os pesos dos pacotes vendidos

  • 3.2 Descrição das variáveis

    • A variável resposta representa o número de unidades (pacotes) de açúcar vendidos semanalmente pelas lojas

    • A variável Lojas é a designação ou nome das lojas que efectuaram as vendas

    • O tempo é referente ao tempo de recolha semanal do número de unidades vendidas

    • Caracterização das variáveis em estudo.
      Nome da Variável Descrição Tipo Categoria
      Loja Nome da loja Qualitativa nominal 1, 2, 3, 4, 5, 6 e 7
      Venda Numero de unidades vendidas Quantitativa discreta -
      Tempo Tempo (em semanas) Quantitativa discreta -
  • Sendo as categorias descritas como: 1- Loja E.L, 2-Loja M.I, 3- Loja L.U, 4- Loja M.A, 5- Loja M.E, 6- Loja M.M e 7- Loja M.N.

4 Resultados e Discursão

4.1 Análise exploratória

  • OGR data source with driver: ESRI Shapefile 
    Source: "D:\r\Segundo Ano+Segundo semestre\Quarto Ano\II semestre\EX\Localidades\Localidades.shp", layer: "Localidades"
    with 1457 features
    It has 11 fields
  • 4.1.1 Gráfico de controle \(\bar{x}\) e R

  • 4.1.1.1 Proporção de não conformidade

    • \[\begin{eqnarray} \hat{p}&=&P\lbrace x<LIE\rbrace + P\lbrace x>LSE\rbrace\\ &=& P\lbrace x<LIE\rbrace+[1-P\lbrace x<LSE\rbrace]\nonumber\\ &=&\phi(\frac{LIE-\mu}{\hat{\sigma}}) + 1 - \phi(\frac{LSE-\mu}{\hat{\sigma}})\nonumber\\ &=&\phi(\frac{0.996 - 0.999}{0.001}) + 1 -\phi(\frac{1-0.999}{0.001})\nonumber\\ &=&\phi(-3) + 1 - \phi(1)\nonumber\\ &=& 0.001 + 1 - 0.841\nonumber\\ &=&0.16\nonumber \end{eqnarray}\]
      • Onde as lojas venderam um total de 4215 unidades de açúcar, portanto \(4215\times 7= 674\)
      • Correspondendo ao número de unidades vendidas não conformes

4.2 Construção de modelos estatístico

  • 4.2.1 Modelo marginal e modelos lineares de efeitos mistos

      • Modelo marginal

      • Estimado por \(\beta_0 + \beta_{1}t_{ij} + \varepsilon\)

        
        Call:
        lm(formula = Vendas ~ T, data = Base_V)
        
        Residuals:
           Min     1Q Median     3Q    Max 
        -6.943 -3.609 -1.486  2.301 21.990 
        
        Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
        (Intercept) 7.497639   0.372882  20.107   <2e-16 ***
        T           0.018299   0.007098   2.578   0.0102 *  
        ---
        Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
        
        Residual standard error: 4.665 on 506 degrees of freedom
        Multiple R-squared:  0.01297,   Adjusted R-squared:  0.01101 
        F-statistic: 6.647 on 1 and 506 DF,  p-value: 0.01022
      • Modelo linear de efeitos mistos com intercepto aleatório e inclinação aleatória

      • Estimado por \((\beta_0 +b_{0i}) + (\beta_1+b_{1i})t_{ij} +\varepsilon_{ij}\)

        Linear mixed model fit by REML ['lmerMod']
        Formula: Vendas ~ T + (T | Loja)
           Data: Base_V
        
        REML criterion at convergence: 2651.8
        
        Scaled residuals: 
            Min      1Q  Median      3Q     Max 
        -2.0873 -0.7284 -0.1011  0.4966  5.0249 
        
        Random effects:
         Groups   Name        Variance  Std.Dev. Corr 
         Loja     (Intercept) 29.080428 5.39263       
                  T            0.001229 0.03506  -0.86
         Residual              9.939459 3.15269       
        Number of obs: 508, groups:  Loja, 7
        
        Fixed effects:
                    Estimate Std. Error t value
        (Intercept)  7.34544    2.05577   3.573
        T            0.05223    0.01517   3.443
        
        Correlation of Fixed Effects:
          (Intr)
        T -0.794
        optimizer (nloptwrap) convergence code: 0 (OK)
        Model failed to converge with max|grad| = 0.0615243 (tol = 0.002, component 1)
      • Modelo linear de efeitos mistos com intercepto fixo e inclinação aleatória

      • Estimado por \(\beta_0 + (\beta_1+b_{1i})t_{ij} +\varepsilon_{ij}\)

        Linear mixed model fit by REML ['lmerMod']
        Formula: Vendas ~ 1 + (T | Loja)
           Data: Base_V
        
        REML criterion at convergence: 2652.7
        
        Scaled residuals: 
            Min      1Q  Median      3Q     Max 
        -2.1228 -0.7160 -0.0858  0.4976  5.1079 
        
        Random effects:
         Groups   Name        Variance  Std.Dev. Corr 
         Loja     (Intercept) 18.622237 4.31535       
                  T            0.002444 0.04944  -0.86
         Residual             10.073168 3.17383       
        Number of obs: 508, groups:  Loja, 7
        
        Fixed effects:
                    Estimate Std. Error t value
        (Intercept)   10.176      0.952   10.69
        optimizer (nloptwrap) convergence code: 0 (OK)
        Model failed to converge with max|grad| = 1.42166 (tol = 0.002, component 1)
      • Modelo linear de efeitos mistos com intercepto aleatório e inclinação fixa

      • Estimado por \((\beta_0 +b_{0i}) + \beta_1t_{ij} +\varepsilon_{ij}\)

        library(lme4)
        M_IAIF<- lmer(Vendas~T+(1|Loja),Base_V)
         summary(M_IAIF)
        Linear mixed model fit by REML ['lmerMod']
        Formula: Vendas ~ T + (1 | Loja)
           Data: Base_V
        
        REML criterion at convergence: 2656.6
        
        Scaled residuals: 
            Min      1Q  Median      3Q     Max 
        -2.1721 -0.6830 -0.1275  0.4955  4.8346 
        
        Random effects:
         Groups   Name        Variance Std.Dev.
         Loja     (Intercept) 23.62    4.860   
         Residual             10.13    3.183   
        Number of obs: 508, groups:  Loja, 7
        
        Fixed effects:
                    Estimate Std. Error t value
        (Intercept) 6.970353   1.854654   3.758
        T           0.074344   0.005413  13.733
        
        Correlation of Fixed Effects:
          (Intr)
        T -0.108
      Comparação entre os modelos estimados, como os respectivos ‘-2ll’, número de parâmetros, AIC e o ranking de acordo com o AIC.
      Modelos -2ll Parâmetros AIC Rank\(_{AIC}\)
      MM 3004.4 3 3010.4 4
      MLM IFIA 2652.0 5 2662.1 3
      MLM IAIF 2651.0 4 2659.0 2
      MLM IAIA 2647.2 6 2659.3 1
  • Portanto o modelo adequado para descrever as vendas das lojas é o MLM IAIA

  • library(ggeffects)
    QW<-  ggpredict(M_IAIA,terms = c("T[0:200]","Loja[sample=7]"),type = "re")  
    QW$Loja<-QW$group
    QW$Semanas<-QW$x
    ggplot(QW,aes(x=x,y=predicted,color=Loja))+geom_line(
      )+theme_minimal()+labs(x="Tempo (Semanas)",y="Quantidades de vendas (Previsão)")  

      library(ggeffects)
    
    Previsao<-ggpredict(M_IAIA ,terms = c("T[0]","Loja[sample=7]"),
                  type= "re")  
    
      Previsao 
    # Predicted values of Vendas
    
    # Loja = M.N
    
    T | Predicted |        95% CI
    -----------------------------
    0 |     12.63 | [5.23, 20.02]
    
    # Loja = M.I
    
    T | Predicted |         95% CI
    ------------------------------
    0 |      3.59 | [-3.80, 10.99]
    
    # Loja = M.M
    
    T | Predicted |        95% CI
    -----------------------------
    0 |     13.26 | [5.87, 20.65]
    
    # Loja = L.U
    
    T | Predicted |         95% CI
    ------------------------------
    0 |      2.67 | [-4.72, 10.06]
    
    # Loja = M.A
    
    T | Predicted |        95% CI
    -----------------------------
    0 |      2.31 | [-5.09, 9.70]
    
    # Loja = E.L
    
    T | Predicted |         95% CI
    ------------------------------
    0 |      3.65 | [-3.74, 11.05]
    
    # Loja = M.E
    
    T | Predicted |        95% CI
    -----------------------------
    0 |     13.31 | [5.91, 20.70]
    Coeficientes estimados do modelo no tempo 0 e IC.
    Lojas Coeficientes\(\beta_0 + b_{0i}\) Tempo\((\beta_1 + b_{1i})t_{ij}\) I. de confiança 95%
    Loja E.L 3.65 0 [0, 11.05]
    Loja L.U 2.67 0 [0, 10.06]
    Loja M.A 2.31 0 [0, 9.70]
    Loja M.E 13.31 0 [5.91, 20.70]
    Loja M.I 3.59 0 [0, 10.99]
    Loja M.M 13.26 0 [5.87, 20.65]
    Loja M.M 12.63 0 [5.23, 20.02]
  • 4.3 Interpretação dos parâmetros do modelo

    • A variação total dos dados é dada por \[\sigma_{total}^2=\sigma_{1}^2 +\sigma_{2}^2 + \sigma_{\varepsilon}^2=38.376\].
    • Portanto, o calculo da variância total permitiu estimar-se o contributo de cada fonte de variação no modelo.
      • A variância entre grupos (intercepto) \(\tau_1=\dfrac{\sigma_{1}^2}{\sigma_{total}^2}\);
      • variância entre grupos (inclinação), \(\tau_2=\dfrac{\sigma_{2}^2}{\sigma_{total}^2}\) e;
      • variância dentro grupo, \(\tau_\varepsilon=\dfrac{\sigma_{\varepsilon}^2}{\sigma_{total}^2}\)
      • Contribuem com cerca de 74.088%, \(3.517e^{-5}\%\) e 25.901% na variação total dos dados respectivamente.
  • A média geral das vendas é 7 e as médias individuais das lojas M.A, L.U, M.I, E.L, M.N, M.M e M.E são 2, 3, 4, 4, 12, 13 e 13 respectivamente

  • O modelo apresenta uma inclinação média das vendas positiva \(\beta_1=0.052\)

    • Estimou para o intercepto e inclinação, os desvios entre a resposta prevista média e a resposta prevista para um determinado grupo.

    • Respondendo o quanto um indivíduo difere da população foram divididas as estimativas dos efeitos aleatórios pelas suas respectivas médias.

    • Representando o percentual de desvios dos grupos em relação à média geral populacional do intercepto e inclinação,

  • 4.3.1 Previsão do modelo estimado

    • A previsão das vendas por loja foi efectivada tendo em conta o desbalenceamento em relação ao tempo.

    • library(lme4)
          attach(Base_V)
      
        M_IAIA<- lmer(Vendas~T+(T|Loja),Base_V )
      
      library(ggeffects)
      QWw<-  ggpredict(M_IAIA,terms = c("T[121:136]","Loja[sample=4]"),type = "re")
      
      Q<-  ggpredict(M_IAIA,terms = c("T[45:60]","Loja[sample=7]"),type = "re")
      • Previsão das semanas 121 a 136

          QWw<-as.data.frame(QWw)
        head(QWw)
            x predicted std.error  conf.low conf.high group
        1 121  17.14175  3.397735 10.466215  23.81728   M.M
        2 121  14.30003  3.397735  7.624501  20.97557   M.N
        3 121  13.46877  3.397735  6.793235  20.14430   E.L
        4 121  13.45166  3.397735  6.776126  20.12719   M.I
        5 122  17.17383  3.398679 10.496443  23.85122   M.M
        6 122  14.31387  3.398679  7.636484  20.99126   M.N
      • Previsão das semanas 45 a 60

         Q<-as.data.frame(QWw)
          head(Q)
            x predicted std.error  conf.low conf.high group
        1 121  17.14175  3.397735 10.466215  23.81728   M.M
        2 121  14.30003  3.397735  7.624501  20.97557   M.N
        3 121  13.46877  3.397735  6.793235  20.14430   E.L
        4 121  13.45166  3.397735  6.776126  20.12719   M.I
        5 122  17.17383  3.398679 10.496443  23.85122   M.M
        6 122  14.31387  3.398679  7.636484  20.99126   M.N
      • Somando as tabelas obteve-se um total de \(\sum_{i=121}^{i=136} 876.369 + \sum_{i=45}^{i=60} 678.397=1554.766\) unidades previstas para o período de escassez

4.4 Disponibilização do aplicativo web (Dashboard)

Site do dashboard

4.5 Discussão dos resultados

  • Os gráficos \(\bar{x}\) e R são importantes no controle estatístico de qualidade do processo e em detectar possíveis desvios ou tendências indesejáveis (Montgomery 2009).

    • A redução da proporção de não conformidade, garante pacotes de açúcar com o peso pré-estabelecido e a garantia satisfação do cliente.
      • O gráfico estimou tal proporção em cerca de 16%, ou seja, de cada 100 unidades produzidas 16 são não conformes.
  • Através do AIC e do -2ll, constatou-se que o MLM com intercepto e inclinação aleatória mostrou-se adequado para descrever os dados.

    • A componente aleatória é parte fundamental dos MLM’s, pois permite que se capture e considere a variabilidade entre sujeitos.
      • A variância dentro e entre grupo representam:
      • A variabilidade não explicada pelos efeitos fixos nem aleatórios e a explicada pelos efeitos do grupo, respectivamente (Pinho, Nobre, and Singer 2015).
      • Entretanto, resultados deste estudo mostraram que a variância do intercepto entre grupos retém maior variação dos dados (74.088%).
      • Enquanto, a variância dentro do grupo retém cerca de 29.901% da variância total dos dados.
  • O uso de interceptos aleatórios permite que diferentes unidades amostrais tenham interceptos diferentes (valores iniciais diferentes) (Verbeke, Molenberghs, and Rizopoulos 2010).

    • O estudo mostrou interceptos aleatórios diferentes, com o loja M.E a apresentar o maior intercepto (13.31), enquanto, a loja M.A apresentou o menor intercepto (2.31).
  • A inclusão de inclinações aleatórias permite que diferentes que diferentes grupos tenham taxas de mudanças diferentes ao longo do tempo (Gelman and Hill 2006).

    • O estudo mostrou diferentes taxas de evolução ao longo do tempo, com destaque para as lojas L.U e M.N que apresentaram maior (0.032) e menor (0.014) inclinações, respectivamente.
  • Ao incluir a variável tempo como independente, pode-se estimar a relação entre a resposta e o tempo, tendo em consideração diferenças entre sujeitos (West, Welch, and Galecki 2022).

    • Quanto a variável Tempo, o modelo apresenta a média geral da inclinação aleatória estimada em \(\beta_1=0.052\) (positivo).
      • Indicando crescimento das unidades vendidas ao longo do tempo.
      • Assim de \(\beta_1\), obteve-se diferentes taxas de crescimento ao longo do tempo entre as lojas, apresentando o seguinte Rank:
      • \(1^{\circ},\,\, 2^{\circ},\,\, 3^{\circ},\,\, 4^{\circ},\,\, 5^{\circ}\,\,e\,\, 6^{\circ}\) para as lojas L.U, M.I e E. L, M.A, M.M, M.E e M.N respectivamente.
  • Quanto a quantidade ideal prevista para o período de escassez, o MLM apresentou estimativas de previsão mais consistentes em dados correlacionados (Hox and Kreft 1994).

    • Portanto, o modelo adequado para prever as vendas estimou para o período de escassez, um total de 1555 unidades a serem vendidas.
    • Permitindo a empresa planear o estoque ideal de açúcar para o período de escassez.

5 Conclusões e Recomendações

5.1 Conclusões

  1. Estimou-se a proporção de não conformidade do processo de empacotamento das unidades de açúcar em aproximadamente 16%.

  2. O modelo permitiu obter \(\mu_{ij}=7.343 + 0.052\times t_{ij}\) que fornece a estimativa média das vendas em um determinado instante de tempo.

  3. Da hipótese assumida para \(\beta_1=0.052\) constatou-se que é um inclinação positiva.

  4. A variância entre grupos (intercepto) retém 74.088% da variação total das quantidades de unidades vendidas.

  5. A variância entre grupos (inclinações) retém a menor parte (\(3.517e^{-5}\%\)) da variação total das vendas.

  6. Sendo as vendas correlacionadas, a variância dentro do grupo retém 25.901% da variância total dos dados.

  7. O MLM com intercepto e inclinação aleatória estimou o desvio padrão em 5.33 unidades de açúcar.

  8. Os interceptos inicias médios das lojas foram estimados em 2, 3, 4, 4, 12, 13 e 13 para as lojas M.A, L.U, M.I, E.L, M.N, M.E e M.M respectivamente.

  9. Para os meses (semanas) de escassez do açúcar, estimou-se que as 7 lojas irão vender cerca de 1555 unidades o que corresponde em média a 31 sacos de 50 KG de açúcar.

  • 5.2 Recomendações

    • A promoção e realização de estudos relacionados a dados do sector informal de forma a compreender de melhor o sector
    • Desenhar estratégias para melhor lidar com as empresas do sector informal.
    • Ao Governo, desenhar melhores estratégia para fácil transacção de potenciais empresas Moçambicanos do sector informal para o sector formal.
    • A promoção do apoio financeiro de empresas ou negócios do sector informal considerandos sustentáveis.
    • Que as empresas já no mercado facilitem a disponibilização dos dados das vendas para fins de estudos relacionados com o tema.
    • A realização de um estudo paralelo com outra estrutura de matriz de co-variância para modelar a variável aleatória.
    • A divulgação e promoção ao desenvolvimento de habilidades de programação no software R Studio a nível nacional.
  • 5.3 Limitações

    • A dificuldade de inclusão de outras variáveis ao modelo, como mês de recolha do dado devida ao pressuposto de multicolinearidade violado;
    • A fraca disponibilidade de material auxiliar sobre modelos de efeitos mistos, considerando os dois tipos de modelos mistos;
    • Fraca disponibilidade de material auxiliar sobre programação avançada em R Studio;

6 Referências Bibliográficas

6.1 Referências Bibliográficas

Carvalho, João MS. 2016. Inovação & Empreendedorismo: Ideia, Implementação, Informação e Impacto. Vida Economica Editorial.
Garvin, David. 1987. “Competing on the Eight Dimensions of Quality.” Harv. Bus. Rev., 101–9.
Gelman, Andrew, and Jennifer Hill. 2006. Data Analysis Using Regression and Multilevel/Hierarchical Models. Cambridge university press.
Guimarães, Cicero Aparecido, André José Ribeiro e Bezerra. 2020. “Gestão de Dados: Uma Abordagem Bibliométrica.” Perspectivas Em Ciência Da Informação 24: 171–86.
Hox, Joop J, and Ita GG Kreft. 1994. “Multilevel Analysis Methods.” Sociological Methods & Research 22 (3): 283–99.
Laird, Nan M, and James H Ware. 1982. “Random-Effects Models for Longitudinal Data.” Biometrics, 963–74.
Melo, Daniela de Castro, and Rosane Lúcia Chicarelli Alcântara. 2011. “A Gestão Da Demanda Em Cadeias de Suprimentos: Uma Abordagem Além Da Previsão de Vendas.” Gestão & Produção 18: 809–24.
MIC. 2016. “Ministério Da Indústria e Comércio.”
Montgomery, Douglas C. 2009. Statistical Quality Control. Vol. 7. Wiley New York.
Mulzer, Johanna, Gloria Faerber, Friedrich Kaufmann, and Evgenij V Potapov. 2019. “Recovery Plug for HeartMate 3 Left Ventricular Assist Device.” The Journal of Thoracic and Cardiovascular Surgery 157 (2): e35–37.
Nelder, John Ashworth, and Robert WM Wedderburn. 1972. “Generalized Linear Models.” Journal of the Royal Statistical Society Series A: Statistics in Society 135 (3): 370–84.
Osório, Conceição. 2021. “Relatório de Pesquisa.” Desigualdades e Resistência Em Tempos de Pandemia. Impactos Da COVID-19 Nas Mulheres Do Mercado Informal. WLSA: Maputo, 2021–04.
Pinho, Luis Gustavo B, Juvêncio S Nobre, and Julio M Singer. 2015. “Cook’s Distance for Generalized Linear Mixed Models.” Computational Statistics & Data Analysis 82: 126–36.
Resende, Marcos Deon Vilela de, Douglas Fabrı́cio Prates, Cibele Keiko Yamada, and A de JESUS. 1996. “Estimação de Componentes de Variância e Predição de Valores Genéticos Pelo método Da máxima Verossimilhança Restrita (Reml) e Melhor Predição Linear não Viciada (Blup) Em Pinus.”
Resnick, Marc. 2006. “1.1 Human Factors in Industrial and Systems Engineering.” INDUSTRIAL and SYSTEMS ENGINEERING.
Singer, JM, JS Nobre, and FMM Rocha. 2015. “Análise de Dados Longitudinais (Versão Parcial Preliminar).[citado 17 Nov. 2015] Disponı́vel Em: Http://Www. Ime. Usp. Br/~ Jmsinger/MAE0610.” Singer&Rocha&Nobre2015fev. Pdf.
Verbeke, Geert, Geert Molenberghs, and Dimitris Rizopoulos. 2010. “Random Effects Models for Longitudinal Data.” In Longitudinal Research with Latent Variables, 37–96. Springer.
Vonesh, E, and VM Chinchilli. 1997. “Linear and Non-Linear Models for the Analysis of Repeated Measurements Marcel Decker.” Inc, New York, NY.
West, Brady T, Kathleen B Welch, and Andrzej T Galecki. 2022. Linear Mixed Models: A Practical Guide Using Statistical Software. Crc Press.