Big Data. É uma daquelas expressões que entrou paulatinamente no quotidiano e anda hoje na boca de todos. Mas afinal o que é o Big Data e para que serve?
Antes de falar da sua relevância atual, importa sublinhar que não é um conceito novo. Durante décadas o foco esteve, sobretudo, na recolha de dados, na sua integração e armazenamento e na criação de métricas que permitissem monitorizar o negócio, ajustando políticas e regras para a sua otimização. Atualmente, a par da maior sofisticação das empresas, é uma ferramenta incontornável para potenciar uma gestão analítica, permitindo assim às organizações acompanhar o ritmo do panorama competitivo.
Um exemplo fácil de perceber será o do retalho alimentar. A sua experiência de compra num qualquer supermercado, físico ou online, gera uma multiplicidade de dados – associados ao seu número de cliente – passíveis de serem recolhidos, processados e analisados. O output será conhecimento, cujo nível de complexidade poderá variar entre a simples capacidade de gerir, de forma preventiva, a rutura de stocks, ou a criação de estimativas de comportamentos de consumo.
O crescimento do volume de dados criados, o seu suporte – texto, imagem ou vídeo – e a velocidade com que são gerados, introduzem novos desafios. De acordo com a IDC (Data Age 2025), o volume de dados criados no Mundo passará de 33 zetabytes, em 2018, para 175 zetabytes, em 2025. Um zetabyte são 1021 bytes, o que corresponde, a título de exemplo, a 10 mil milhões de filmes no formato 4K. Ou seja, seriam necessários cerca de 1,8 milhões de anos para os conseguir visualizar.
Um volume avassalador de dados disponíveis que, a par dos diferentes formatos e da velocidade com que são gerados, constituem um desafio que importa endereçar, de forma a assegurar a correcta extração de conhecimento útil, quer do negócio, quer dos clientes. Assim se compreende a necessidade crescente de encontrar recursos humanos qualificados – em Portugal e no Mundo – existindo um conjunto de competências que são, normalmente, apontadas como críticas: uma base sólida em Matemática e Estatística, fortes competências em ciências da computação, pensamento crítico e analítico, orientação para a resolução de problemas e espírito inovador.
De uma forma genérica, as principais funções de um cientista de dados passam por recolher, estruturar e integrar um conjunto de dados, os quais serão depois processados e modelados usando técnicas de Machine Learning e de Inteligência Artificial. Modelos capazes de gerar conhecimento que, uma vez passado aos decisores, será a base para uma gestão orientada e informada.
Conclusões de um estudo recente da QuantHub indicam que, em 2020, a carência de cientistas de dados no mercado de trabalho cifrou-se em 250 mil. Várias abordagens têm sido seguidas para reduzir este impacto, entre as quais, a maior automatização das tarefas associadas aos dados a partir de plataformas de analítica self-service, que possibilitam a execução de análises a partir de mãos menos experientes, com todos os riscos inerentes a essa inexperiência.
Movimentos de literacia de dados, e em competências digitais mais genéricas, têm surgido de forma transversal, onde propostas de formação online estão cada vez mais disponíveis e complementam formações mais tradicionais. Finalmente, também as universidades se têm adaptado à literacia dos dados, sendo esta, cada vez mais, uma competência presente nas várias áreas de formação.
Neste âmbito, a NOVA IMS promove, desde a sua fundação, em 1989, a conversão de dados em valor, quando estas competências eram ainda reconhecidas por uma minoria como essenciais e inovadoras. Essa visão não era, à data, partilhada pela maioria dos decisores e empresas, havendo menos procura e certamente menos glamour associado à função.
Muita coisa mudou em 30 anos, mas não o objetivo de treinar profissionais capazes de entender, desenvolver e utilizar as técnicas mais avançadas da ciência de dados. A mais recente licenciatura da NOVA IMS completa o tridente da formação ao nível das licenciaturas, estruturado para dar resposta precisamente a este novo paradigma.
A nossa oferta inclui agora a licenciatura em Gestão de Informação – mais alinhada com a análise e gestão orientada aos dados – a licenciatura em Sistemas e Tecnologias de Informação – mais associada à componente de infraestura e desenvolvimento tecnológico – e a a licenciatura em Ciência de Dados, com um foco maior nas técnicas de análise e respetiva conversão dos dados em conhecimento.
São muitas as dúvidas que persistem em relação às competências necessárias num mercado de trabalho em rápida e contínua evolução. Mas uma coisa certa: a ciência de dados fará certamente parte dos empregos do futuro.