Em Julho de 2016 o Observador publicava um texto intitulado – Este é o futuro: cinco empregos que ainda poucos conhecem – da autoria de Marta Leite Ferreira. Os cinco empregos, recordo, eram propostas mais ou menos desconhecidas e talvez até estranhas para a maioria dos leitores: Técnico de Medicina Nuclear, Reparador de Equipamento Médico, Responsável por Antecipar Riscos na e da Internet, Professor de Saúde e Bem-Estar, finalmente, Psicólogo Industrial e Organizacional.

O que agora escrevo não tem a ver com emprego mas com trabalho. Porque no futuro, goste-se ou não, haverá apenas trabalho. A profissão que agora nomeio não vem das acima descritas mas do que parece ser cada vez mais óbvio: a enorme quantidade de dados e informação que geramos. Alguém que consiga associar e usar conhecimentos de análise de dados, de web, de programação e que seja capaz de trabalhar dados que não apareçam apenas de fontes estruturadas terá um presente e futuro risonhos: falo dos data scientists.

A Gartner antecipava para 2015 uma necessidade global de 4,4 milhões de data scientists, afirmando que apenas um terço destes estaria disponível porque eventualmente teria alguma formação para o efeito. O mundo atrasou-se em relação à previsão mas a necessidade cada vez maior de data scientists veio para ficar. Por todo o lado, mesmo em Portugal, o perfil mais requerido é este. Analisar dados. Seja de futebol, de medicina, de retalho, de operações, de marketing, de finanças, ou até de sites de dating. Pouco importa qual o negócio ou organização que se vislumbre. Importa que se tenham skills de análise de dados em quantidades maciças, estruturados ou não.

Vantagens desta profissão:

  • pode trabalhar a partir de casa e/ou em qualquer parte do mundo. Basta uma boa ligação à internet ou uma ligação remota a bases de dados ou a dados;
  • pode ser autónomo em termos de trabalho e prestar serviços para várias empresas e organizações;
  • pode variar de indústria para indústria e de tipo de negócio para tipo de negócio à medida que vai desenvolvendo análises de dados;
  • muitas outras existirão como definir as suas próprias horas de trabalho, a partir de onde trabalhar, como trabalhar – mais concentrada ou mais compassadamente no tempo –, como abordar os desafios para resolver problemas e fornecer soluções às várias empresas e organizações que o vão solicitar.

Claro está que poderão existir, como em tudo na vida, desvantagens:

  • pode não conseguir trabalhar senão integrado numa equipa de data scientists o que o obriga a alguma disciplina de trabalho conjunto;
  • pode ter que trabalhar para uma organização com algum controlo de horários, muito embora o mais apetecível sejam mesmo os outputs/deliverables do seu trabalho;
  • pode vir a ser, mesmo, um assalariado de uma empresa ou organização e não um mero trabalhador, ganhando menos do que o que na primeira condição poderia ganhar;
  • pode ser considerado uma espécie de data freak ou data neard mas, pela positiva, de quem se terá sem dúvida alguma inveja;
  • outras como problemas de excesso de tempo on-line, concentração excessiva em programação ou em algoritmos matemáticos e estatísticos podem ser críticos.

A grande novidade dos data scientists será a sua capacidade para entrar e estar em qualquer indústria, em qualquer lugar e em qualquer condição. Será, por excelência, um apologista da flexibilidade pelo que um ativo interessante para as organizações de hoje e amanhã porque poderá trabalhar em regime de outsourcing; será sempre um ativo lean. Ainda por cima pode ser pago em termos de resultados o que para as organizações é sem dúvida o tipo de trabalhador que procuram. Será autónomo, na maior parte das vezes, e, à sua maneira, um criativo de soluções.

Mas é bom contar com o que é necessário trazer de base para passar a ser um data scientist, certo?

  • saber lidar com algumas ferramentas básicas, ou ditas básicas, de que muitos infelizmente fogem. Usar Stata ou SPSS ou análogo. Ser capaz de programar em R ou em Python – em ambientes estatísticos, portanto. Java Script também dará muito jeito. Finalmente, ser capaz de usar SQL – Structured Query Language – para proceder a queries em bases de dados estruturadas convencionais. Se se sentir confortável a trabalhar nestas áreas tem uma muito boa base de partida.
  • conhecer os fundamentos da estatística, simples e multivariada, bem como da álgebra linear, que, infelizmente também, fazem as dores de cabeça de muito boa gente. Esqueça, portanto, a fuga à matemática no liceu. Cursos onde a Matemática, e em particular a estatística, sejam essenciais, serão o futuro. Testes estatísticos, distribuições, estimadores de máxima verosimilhança, entre outros;
  • saber como lidar com ausência de dados ou dados contraditórios e, no meio da selva de dados, ser capaz de descobrir padrões pode tornar-se verdadeiramente chave. O lado criativo aparece aqui em muitas dimensões;
  • saber tirar partido de grandes quantidades de dados e transformá-las em visualização simples e intuitiva; a visualização é igualmente crítica pelo que a capacidade de sintetizar e de mostrar informação de forma sexy se estão a tornar centrais. Outra vez o lado criativo a sobressair;
  • saber distinguir o essencial do acessório. Saber lidar com charadas e responder a algumas delas com respostas óbvias, quais pequenos ovos de Colombo;
  • saber onde podem estar as fontes de dados no negócio. Por isso, fundamental perceber vários modelos de negócio. Fundamental conhecer os fundamentos dos negócios. Saber fazer as perguntas chave para ir atrás desses dados e, simultaneamente, ser capaz de, não só indo atrás dos dados, os trabalhar e apresentar com conclusões apelativas para os decisores – visualmente atrativas e sintéticas.

Agora a questão que estará a formular: se eu tiver que tirar um curso, o que devo escolher como base? Uma engenharia, uma gestão ou uma economia de banda larga e fortes em componentes quantitativas. Boas em análise de processos e de negócio. E estruturadas em termos dos vários conhecimentos que apresentam: do lado das engenharias o lado quantitativo aprofundado e extenso, bem assim como a programação. Do lado das economias e da gestão igualmente o lado quantitativo aprofundado e extenso e o profundo conhecimento do negócio: produtivo, distributivo, digital, clientes, mercados, valor e criação de valor, pelo que igualmente estratégico e financeiro. Diria mais: conhecimento de processos. Processos, processos e processos. Depois disto, das engenharias, economias ou gestão como base, atirar-se ao mundo do big data como formação complementar.

Parece simples escrito. Mas não é. Ficarão sempre vagas por preencher e candidatos por encontrar. Será um mundo de oportunidades para os arrojados. Poucos. Que, perante uma oferta crescente e mesmo agigantada desequilibrarão sempre a equação. É aí que os salários falarão mais alto. E a profissão se tornará atrativa para quem realmente goste dela. Trata-se da profissão com mais futuro. Tanto hoje como no futuro. E não são necessárias análises preditivas. Basta o senso comum e a perceção do mundo que nos rodeia.

Professor Catedrático, NOVA SBE