Todos conhecemos alguém, fanático torcedor, que associe o local onde está, com quem está assistindo um jogo, ou até mesmo a roupa íntima que está vestindo com resultados do seu time do coração. Para piorar, muitas vezes, o histórico parece corroborar com esse tipo de crença. Não é mesmo? Evidentemente, para desgosto de alguns, o mais provável é que tudo seja mera coincidência.
[tweet]Não é raro ignorarmos que correlação não implica em causalidade. Ou seja, não é porque dois eventos aparentemente ocorram sempre juntos que um seja o causador do outro.[/tweet] As vezes, a causa é um terceiro evento, não analisado, ou, ainda, as ocorrências simultâneas podem não ter qualquer causalidade comum, mesmo que indireta.
Nas empresas a confusão entre correlação e causalidade sempre ocorreu. É comum “especialistas”, em suas análises de causa raíz, com utilidade cada vez mais questionável, cometerem esse erro recorrentemente. Além disso, há quem use desse “erro comum” para criar argumentos falaciosos.
Com a proliferação da adoção amadora de algoritmos de análise de dados, sobretudo os que tratam de regressão e correlação, tememos que muitos disparates causados por pura incompetência sejam “travestidos” com racionalidade acadêmica. Isso fica bem indicado nas hilárias correlações identificadas no site Spurious Correlations.
Infelizmente, situações práticas, nada hilárias, tem ficado evidenciadas já “em plena produção”. Além disso, há potencial para que esse problema se amplifique.
É necessário investir em formação e constante revisão dos métodos de análise adotados na empresa para evitar a propagação de enganos. Estamos na “era dos modelos de negócios exponenciais” habilitados pelo “desprendimento” da informação como fonte de receita. As oportunidades são grandes demais para serem ignoradas ou ameaçadas por simples despreparo.
[tweet]Em tempos em que se fala tanto em culturas “data-driven”, é papel do CTO garantir que a companhia desenvolva as capacidades e competências para não ser “data-stupid”.[/tweet]