A 6 de junho, a agência norte-americana CIA estreou-se na rede social Twitter. Tinha 140 caracteres para anunciar ao mundo que aquele era o seu perfil oficial, mas optou por utilizar apenas 61. A mensagem foi breve e vaga, mas fez furor. Afinal, era a estreia dos serviços secretos norte-americanos no universo dos tweets. E era uma estreia com humor: “Não podemos confirmar nem desmentir que este é o nosso primeiro tweet”, escreveu a CIA. Resultado: mais de 300 mil partilhas e mais de 185 mil “likes”.
We can neither confirm nor deny that this is our first tweet.
— CIA (@CIA) June 6, 2014
A ousadia fez com que o post tenha sido considerado o “melhor primeiro tweet” de todas as agências governamentais norte-americanas. Mas, se as palavras fossem outras, apesar de a mensagem e o autor serem os mesmos, o resultado teria sido diferente? Chenhao Tan, Lilian Lee e Bo Pang acreditam que sim.
A preocupação com a seleção das palavras levou os três cientistas de computação a criar um algoritmo capaz de prever qual é o tweet, com o mesmo link e autor, que tem mais probabilidades de ser partilhado na rede social. No fundo, tenta prever o comportamento dos utilizadores. O objetivo era pôr fim à dúvida: Há poder nas palavras ou a popularidade do tópico e do tema “tweetam” por si?
“O nosso interesse neste artigo [que explica o algoritmo] é perceber o efeito do texto que está dentro da mensagem, ou seja, a forma como a mensagem é comunicada e não o tema sobre o qual incide”, lê-se no texto assinado por Chenhao Tan, Lilian Lee e Bo Pang.
A versão experimental está online e o Observador fez o teste. A ideia é a de introduzir dois tweets sobre o mesmo assunto, com uma abordagem diferente, e perceber qual é o post que o algoritmo prevê gerar mais partilhas.
O tema escolhido foi este, com duas formas de comunicar a mesma mensagem: “Três cientistas criam algoritmo para prever que tipo de mensagem gera mais partilhas no Twitter” vs “Qual é o poder das palavras no Twitter? Cientistas criam algoritmo para prever retweets”. O segundo tweet tem 54% de probabilidades de obter mais partilhas do que o segundo, diz a versão experimental do programa.
fazer contas à emoção
Algoritmo. Dados. Computação. O sucesso de um post à mercê da matemática. O algoritmo foi construído tendo por base 11 mil pares de tweets (cada pessoa enviou dois tweets sobre o mesmo tema) e o objetivo era descobrir quais os padrões de palavras que pareciam preditivos, para testá-los, depois, em dados novos. Mas, há espaço para as emoções?
“Isto é impressionante, quando se tem em conta a enorme desvantagem que este algoritmo contém. Sim, é certo que ele pode aprender com 11 mil pares de tweets, mas não tem outro tipo de conhecimento. Não é rico nas informações de contexto que os utilizadores podem acumular durante anos. Nunca ouviu os amigos queixarem-se que os seus cônjuges mexem no seu telefone de manhã. Não tem sentido de humor nem sabe o que é um trocadilho. Não sabe o que torna uma frase elegante ou constrangedora”, adianta Sendhil Mullainathan, professor na Universidade de Harvard, no The New York Times.
Por não ter este tipo de sensações, o algoritmo baseia-se no comprimento do tweet, na presença de palavras como “retweet” ou “por favor” ou na utilização de artigos indefinidos para fazer previsões. “E faz tanto com tão pouco”, diz Sendhil Mullainathan, para quem este tipo de algoritmo é uma espécie de milagre da análise de dados.
Os utilizadores podem achar que tweets mais longos têm maiores probabilidades de serem partilhados, porque têm mais informação, mas a verdade é que, para Mullainathan, “less is more”.
Contudo, também este milagre tem um calcanhar de Aquiles, para o professor de Harvard. “A correlação não é causalidade. Alterar uma variável que é altamente preditiva pode não ter efeito”, adianta. E dá um exemplo: os utilizadores podem achar que tweets mais longos têm maiores probabilidades de serem partilhados, porque têm mais informação, mas a verdade é que, para Mullainathan, “less is more”, ou seja, é preciso “fazer mais com menos”. Solução? Escrever tweets não mais longos, mas com mais conteúdo, “o que é muito mais difícil de fazer”.
Outra das barreiras que o algoritmo tem de ultrapassar é a capacidade de prever o que é interessante, avança o professor. No Twitter, se escrever “retweet” ou “por favor”, é provável que os restantes utilizadores partilhem o post, mas se toda a gente começar a fazer o mesmo, será que a estratégia continua a funcionar?