O que fazemos com todos esses dados importantes?

Susan Etlinger, em Palestra TED (What do we do with all this big data?) defende o uso inteligente, bem considerado e ético dos dados. Necessitamos ter cuidado, pois é possível pegar dados e dá-los qualquer significado. Torturando os números eles confessam qualquer coisa!

O desafio é que nós temos a oportunidade de tentar fazer sentido disso nós mesmos, porque, francamente, dados não criam significado. Nós criamos. Então como pessoas de negócios, como consumidores, como pacientes, como cidadãos, temos uma responsabilidade, acredita Susan Etlinger, de passar mais tempo focando nossas habilidades de pensamento crítico.

Por quê? Porque, a esta altura da nossa história, como temos ouvido repetidamente, conseguimos processar exabytes de dados à velocidade da luz. Então temos o potencial de tomar más decisões muito mais rápido e eficientemente, e com um impacto muito maior do que tínhamos no passado. Ótimo, não é?

E o que precisamos fazer, em vez disso, é passar um pouco mais de tempo em coisas como Ciências Humanas e Sociologia, e Ciências Sociais, Retórica, Filosofia, Ética, porque elas nos dão um contexto que é tão importante para os megadados [big data], já que nos ajudam a nos tornarmos pensadores críticos.

Porque afinal de contas, se eu conseguir identificar um problema em um argumento, não importa tanto se está expressado em palavras ou em números. E isso significa ensinar-nos a encontrar o viés de confirmação e falsas correlações.

Seremos capazes de identificar um apelo puramente emocional de longe, porque uma coisa que acontece depois da outra não significa que aconteceu por causa da outra, necessariamente. Este é o viés do historicismo: narra-se uma história desde certo início, encadeada, logicamente, em causas-e-efeito, de acordo com hipótese apriorística do historiador, que não colhe (ou esconde) dados que falseariam essa hipótese. Em outras palavras, o historiador se transforma em um vidente do passado!

Os romanos chamavam isso de “post hoc ergo propter hoc” [“depois disso, logo causado por isso”].

Isso significa questionar disciplinas como Demografia. Por quê? Porque são baseadas em suposições sobre quem somos com base em nosso sexo e nossa idade e onde vivemos [de acordo com algoritmos que criam determinados padrões] ao invés de dados sobre o que realmente pensamos e fazemos. Se pensamos “fora-da-caixa”, estaremos “fora da curva” da distribuição normal e poderemos ser discriminados (ou, pior, criminalizados) a priori por causa disso!

Já que temos esses megadados, precisamos lidar com eles com o controle de privacidade apropriado e o consentimento dos consumidores. Além disso, precisamos ser claros sobre nossas hipóteses, as metodologias que usamos, e nossa confiança no resultado.

Como dizia o professor de Álgebra no colégio de Susan Etlinger: “mostre-me a Matemática, porque se eu não souber os passos que você deu, não saberei os passos que não deu, e se eu não souber as perguntas que você fez, não saberei as perguntas que não fez”.

Enfim, significa fazer-nos a pergunta mais difícil de todas: será que os dados realmente mostram isso, ou será que o resultado apenas faz-nos sentir mais bem-sucedidos e mais confortáveis?

Em outra Palestra TED, Tricia Wang não diz que os sistemas de big data estão dando previsões inválidas. Muito pelo contrário, o que diz é que, da mesma forma que o oráculo da Grécia antiga precisava dos guias de templo, nossos sistemas de big data precisam deles também. Precisam de pessoas como etnógrafos e pesquisadores de usuários que podem reunir o que chama de “thick data” [dados grosseiros]. São dados valiosos de pessoas, como histórias, emoções e interações que não podem ser quantificadas.

É o tipo de dados de pesquisa qualitativa que ela coletou para a Nokia, que chega na forma de um tamanho de amostra muito pequeno, mas oferece uma profundidade de significado incrível. A Nokia não os levou em consideração e não fez a inovação em smartphone que eles indicavam como necessária para sua popularização – e “perdeu o bonde-da-história”.

O que o torna tão denso e significante é a experiência de compreender a narrativa humana. Isso é o que ajuda a ver o que está faltando em nossos modelos. Thick data baseia nossas questões de negócio em questões humanas. Por isso que integrar big data e thick data forma uma imagem mais completa.

Big data é capaz de oferecer compreensões sobre a escala e alavancar o melhor da inteligência da máquina, enquanto thick data pode nos ajudar a resgatar a perda de contexto. Eles tornam o big data utilizável, aproveitando o melhor da inteligência humana.

Quando os dois são integrados, as coisas ficam muito divertidas, porque não estamos mais apenas trabalhando com dados já coletados. Também trabalhamos com dados que não foram coletados. Fazemos perguntas sobre o porquê: “Por que está acontecendo isso?”

Quando a Netflix fez isso, foi revelada uma forma totalmente nova de transformar os negócios. A Netflix é conhecida por seu excelente algoritmo de recomendação, e ofereceu um prêmio de US$ 1 milhão para quem pudesse melhorá-lo. Houve ganhadores. Mas a Netflix descobriu que as melhorias eram apenas incrementais. Para descobrir o que estava acontecendo, contratou um etnógrafo, Grant McCracken, para reunir ideias de thick data. O que ele descobriu foi algo não visto inicialmente nos dados quantitativos: as pessoas adoravam assistir às maratonas de séries na TV. De fato, nem se sentiam culpadas por isso. Elas gostavam.

Para a Netflix era como: “Ah, esta é uma nova visão”. Levou para a equipe de ciência de dados, que conseguiu dimensionar esta visão do big data com os dados quantitativos. Uma vez verificados e validados, a Netflix decidiu fazer algo muito simples, mas de grande impacto. Disse que, em vez de oferecer o mesmo programa de diferentes gêneros ou mais dos diferentes programas de usuários semelhantes, iria apenas oferecer mais do mesmo programa, fazer com que seja mais fácil assistir.

Ela não parou por aí. Ela fez tudo isso para replanejar toda a experiência do telespectador, e realmente incentivá-lo a assistir. É por isso que as pessoas e os amigos somem em finais de semana inteiros, colocando em dia as séries como “Master of None”. Ao integrar big data e thick data, ela não só melhorou os negócios, mas transformou a forma como consumimos a mídia. Agora as ações dela estão projetadas para duplicar nos próximos anos.

Mas não se trata apenas de assistir a mais vídeos ou de vender mais smartphones. Para alguns, integrar thick data ao algoritmo pode ser uma questão de vida ou morte, especialmente para os marginalizados.

Em todo o país, os departamentos de polícia estão usando o big data para o policiamento preditivo, para estabelecer valores de títulos e recomendações de sentença de forma a reforçar as prevenções existentes. O algoritmo de aprendizagem de máquina Skynet da NSA ajudou possivelmente na morte de milhares de civis no Paquistão pela leitura errada de metadados do dispositivo celular. À medida que toda a nossa vida se torna mais automatizada, dos automóveis aos planos de saúde ou ao emprego, é provável que todos nós sejamos impactados pelo viés da quantificação.

A boa notícia é que percorremos um longo caminho até fazer previsões com maior arte. Temos ferramentas melhores, então vamos apenas usá-las melhor. Vamos:

  1. integrar o big data ao thick data,
  2. empregar os etnógrafos de tecnologia e os pesquisadores de usuários, e
  3. se este trabalho acontecer em empresas ou organizações sem fins lucrativos, no governo ou mesmo no software, tudo isso importa.

Significa que estamos comprometidos coletivamente a elaborar dados melhores, algoritmos melhores, resultados melhores e decisões melhores. É assim que evitaremos deixar escapar esse algo relevante para essas decisões.

Deixe uma Resposta

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão /  Alterar )

Google photo

Está a comentar usando a sua conta Google Terminar Sessão /  Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão /  Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão /  Alterar )

Connecting to %s