A importância dos cálculos para o marketing – Parte 2

Autora: Karin Ayumi Tamura
Supondo que seja preciso verificar a efetividade de uma campanha, e para isso foi necessário separar um grupo de controle para não receber a ação que o grupo de abordados receberia. Sendo assim, a comparação desejada resume-se a testar a seguinte hipótese:
 
 
H0: pa –  c = 0
 
pa: proporção de resposta no grupo abordado;
 
c: proporção estimada de resposta no grupo controle.
 
Rejeitaremos a hipótese nula H0, caso o nível descritivo (p-valor) fornecido do teste seja inferior a 5%, ou seja, se o p-valor < 5% há evidências amostrais para se rejeitar a hipótese nula, concluindo, assim, que há diferença entre os grupos quanto a proporção em questão.
 
Note que o teste realizado não considera a interferência de outros efeitos como, por exemplo, interação com outras campanhas ou divisão por outra variável, que poderia ser uma fonte de mudança que deveria ser controlada. Um exemplo de fonte de variação seria: o estado de São Paulo tem resultado melhor que os demais estados e há o interesse em verificar esta suposição estatisticamente. Quando existe mais de um efeito para ser avaliado, segundo uma única variável resposta, somente um teste de hipótese já não é suficiente, pois o mesmo só avalia um efeito de cada vez. O indicado neste caso seria um modelo estatístico (regressão logística) para avaliar diversos efeitos simultâneos, segundo uma variável resposta do tipo binária.
 
A fórmula para se chegar ao tamanho ideal da amostra(controle) é feita através do cálculo que segue o método de amostragem aleatória simples sem reposição (já considerando o estrato definido), onde n é obtido através da seguinte fórmula:
 
 
z = valor da distribuição normal para o nível de confiança desejado;
 
p = proporção do evento na população (na prática, usaremos , que é uma proporção amostral);
 
q = 1 – p;
 
d = erro amostral tolerável;
 
N = tamanho populacional (ressaltando que o público-alvo deve estar definido).
 
A distribuição amostral pode ser aproximada pela distribuição Gaussiana sempre que o tamanho amostral for ´grande´, isto é, quando forem satisfeitas as seguintes condições:
 
n p ≥ 5     e   n (1-p)  ≥  5
 
Geralmente, o nível de confiança assumido é de 95%, o que resulta em um valor de z sempre igual a 1,96 da distribuição Gaussiana, conforme a Figura 1. Caso adotássemos um nível de confiança 90%, z=1,64.
 
 
 
Figura 1: Distribuição amostral de .
 
O tamanho populacional (N) é fornecido por meio da definição do público-alvo (estrato) com os filtros de interesse, ilustrado pelo modelo a seguir.
 
A proporção do evento de interesse deve ser fornecida pela área de negócios de acordo com uma base histórica – ou, se for a primeira vez, por meio de uma proporção esperada. Na teoria, quando não se conhece esse valor, geralmente adota-se uma proporção de 50%, que significa que quando não se sabe qual valor assumir, é usada a probabilidade de 50%, que maximiza o tamanho amostral. Entretanto, na prática, o percentual real geralmente é baixo quando se trata de ações de marketing e caso seja considerada uma proporção aleatória (50%), nem sempre o erro adotado é adequado para a proporção populacional. Note na Figura 2 que mesmo adotando-se uma proporção amostral aleatória (% evento=50%), o erro pode ser muito grande quando mensurado o resultado real da campanha. Neste caso, apesar do planejamento correto, o estudo ficou inconclusivo, pois não foi possível saber se a campanha de vendas de um determinado produto funcionou. Note que se um cliente a mais comprasse, poderíamos concluir erroneamente que a campanha não funcionou.
 
 
Figura 2: Cálculo do controle assumindo proporção amostral de 50% e erro de 5%.
 
O erro (d) é o quanto se espera errar com amostragem, sendo necessário que a área de negócios ajude a definir o quanto é tolerável desacertar. Na prática, quanto menor o equívoco, maior o tamanho amostral. É importante guardar o histórico dos erros adotados em cada cálculo para que nas ações recorrentes não se tenha uma grande variação no tamanho dos grupos de controle.
 
O parâmetro deve ser atualizado periodicamente para obter uma estimativa mais próxima da proporção populacional, conforme a Figura 3.
 
 
 
Figura 3: Atualização da proporção amostral.
 
 Na prática, podemos pensar em ´chutar´ uma quantidade para compor o grupo de controle. O objetivo do ´cálculo estatístico tamanho amostral´ é computar uma quantidade mínima que garanta medir o resultado com validade estatística no futuro. Portanto, o conhecimento desta metodologia irá ajudar na tomada de decisão com maior confiabilidade e os números servirão como ferramentas-base para investimentos em marketing.
 
Karin Ayumi Tamura é gerente de modelagem estatística da MarketData.
 
Clique aqui e veja a primeira parte do artigo.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima