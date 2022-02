Tem acesso livre a todos os artigos do Observador por ser nosso assinante.

O ruído, sob a forma de música (mais frequentemente, muzak), tráfego, maquinaria, gadgets electrónicos ou animais de companhia, é um dos problemas mais disseminados do mundo moderno e estamos tão imersos nele que, muitas vezes, não damos pela sua existência nem pelos seus efeitos negativos. O mesmo pode dizer-se de outro tipo de ruído – a inconsistência das decisões tomadas quotidianamente por governantes, juízes, médicos, gestores e cidadãos comuns. É deste outro ruído, também ele omnipresente, insidioso e invisível – ou, melhor, inaudível –, que trata o livro Ruído: Porque tomamos más decisões e como podemos evitá-lo, de Daniel Kahneman, Olivier Sibony & Cass R. Sunstein, publicado originalmente em 2021 (como Noise: A flaw in human judgement) e que, com uma rapidez que é de saudar, foi editado em Portugal poucos meses depois pela Objectiva, com tradução de Isabel Veríssimo.

O americano Daniel Kahneman, que foi distinguido em 2002 com o Prémio Nobel da Economia e é autor de Pensar: Depressa e devagar (2011), um livro que, com invulgar clareza e perspicácia, desmonta o funcionamento da mente humana e revela os mecanismos falaciosos subjacentes a muitos dos nossos raciocínios, aliou-se ao seu compatriota Cass R. Sunstein, que, além de ser um respeitado jurista, tem vasta obra publicada nas áreas da política, filosofia, ética, direitos animais, psicologia, avaliação de risco e tomada de decisão (o seu livro de maior notoriedade é Nudge: Improving decisions about health, wealth and happiness, de 2008), e ao francês Olivier Sibony, professor de Estratégia Empresarial na HEC Paris Business School e autor de You’re about to make a terrible mistake!, para redigir um livro também ele centrado na falibilidade do raciocínio do Homo sapiens, sobretudo quando este é chamado a tomar decisões ou a fazer prognósticos.

Juiz severo vs. juiz clemente

Escrevem Kahneman et al. que “seria chocante se três arguidos em condições semelhantes, condenados pelo mesmo crime, recebessem penas radicalmente diferentes: pena suspensa para um, dois anos de prisão para outro e dez anos de prisão para um terceiro. No entanto, uma tal atrocidade pode ocorrer em muitos países – não apenas no passado distante, mas também nos nossos dias”, o que resulta de os juízes usufruírem “de um poder discricionário para decidirem sentenças adequadas”. Nos EUA, o juiz Marvin Frankel foi um dos primeiros a alertar, em 1973, para “‘os amplos poderes praticamente sem controlo’ de juízes federais que resultavam ‘em crueldades arbitrárias perpetradas todos os dias’, considerando-as inaceitáveis num “regime de leis, não de homens’”. No ano seguinte, Frankel substanciou esta advertência genérica e difusa com um estudo envolvendo 50 juízes, que foram chamadas a decidir em vários casos judiciais hipotéticos, e que permitiu concluir que a “ausência de consenso era a norma”. Vários estudos similares realizados nos anos seguintes confirmaram que o “ruído” na justiça criminal americana era muito relevante. Um estudo de 1981, por exemplo, apurou que “só houve acordo unânime para impor uma pena em três dos 16 casos. Mesmo nos casos em que que a maioria dos juízes concordou que era adequada uma pena de prisão, houve uma variação substancial no tempo de detenção recomendado”.

Nada disto será surpreendente para o leitor português que esteja a par das acesas polémicas em torno do Tribunal Central de Instrução Criminal e da actuação dos juízes Carlos Alexandre e Ivo Rosa. Neste caso, a disparidade de tratamentos está a montante da sentença (uma vez que respeita à fase de instrução do processo), com um dos juízes a tender a dar crédito à acusação e a impor aos arguidos medidas de coacção restritivas e cauções milionárias e outro a tender a anular meios de prova, a desmantelar acusações (por vezes com indisfarçado comprazimento) e até a determinar o arquivamento de processos. Desde 4 de Janeiro de 2022, Alexandre e Rosa deixaram de ser os únicos juízes do Tribunal Central de Instrução Criminal, passando os processos a ser distribuídos por mais sete juízes, mas sem que tal implique a alteração da titularidade dos processos já distribuídos e, plausivelmente, sem que as decisões dos dois juízes originais ganhem harmonização.

A diferença sistemática e consistente das decisões entre juízes “severos” e “clementes” tem equivalente noutros tipos de juízos: “alguns analistas têm […] tendências altistas e tendências baixistas para os mercados bolsistas; alguns médicos prescrevem mais antibióticos que outros”. O ruído inerente aos “juízes” (entendidos no sentido lato, de quem quer que emita um juízo), que Kahneman et al. designam como ruído de nível, é o factor de distorção do julgamento mais óbvio – e talvez o único de que a maioria das pessoas está consciente – mas o “ruído” (o ruído total ou “ruído de sistema”) pode ter outras fontes igualmente relevantes.

A justiça não é cega (e, por vezes, tem o estômago a dar horas)

Para lá da variabilidade no nível médio de juízos por diferentes juízes (ruído de nível), há que considerar a variabilidade nas reacções de cada juiz a casos específicos, reflectindo “um padrão complexo nas atitudes dos juízes perante determinados casos”, que Kahneman et al. denominam ruído-padrão. Este ocorre quando, “por exemplo, um juiz pode ser mais duro que a média [dos outros juízes] mas relativamente mais clemente com arguidos que cometem crimes de colarinho branco. Ou pode sentir-se inclinado a impor castigos leves, mas a ser mais severo quando o arguido é reincidente. Um terceiro [juiz] pode estar próximo da severidade média, mas ser compreensivo quando o arguido é apenas um cúmplice e duro quando a vítima é uma pessoa idosa”.

O ruído-padrão – a variabilidade nas decisões de um mesmo juiz – decompõe-se, por sua vez, em ruído-padrão estável e ruído ocasional. O ruído-padrão estável “pode reflectir a filosofia pessoal de sentenças do juiz. Outras respostas podem resultar de associações de que o juiz quase não tem consciência, como uma arguida que lhe faz lembrar uma criminosa especialmente odiosa, ou que talvez se pareça com a sua filha. Seja qual for a sua origem, estes padrões não são um mero acaso: será expectável que recorram se o juiz julgar de novo o mesmo caso”. Depreende-se directamente deste exemplo que, apesar de a representação alegórica da Justiça a mostrar de olhos vendados, há muitos casos em que ela não é cega. Esta distorção do juízo é tanto mais preocupante quando se considera que a análise de estudos de decisões efectuada por Kahneman et al. permitiu concluir que “o ruído-padrão estável […] é geralmente a maior fonte de ruído de sistema”.

Um factor adicional de variabilidade é o ruído ocasional, que resulta de “as atitudes características dos juízes não [serem] inteiramente estáveis”. Existe ruído ocasional “se um radiologista fizer diferentes diagnósticos para a mesma imagem em duas ocasiões diferentes ou um técnico de impressões digitais identificar duas impressões digitais como sendo iguais numa ocasião mas não noutra”. Claro que o ruído ocasional se torna menos frequente se o juiz for capaz de reconhecer que o caso que lhe é apresentado já foi analisado antes, o que levaria, por uma questão de consistência, a repetir a decisão antes formulada.

Na vida real, é difícil apurar quais são as fontes do ruído ocasional, mas alguns estudos controlados, envolvendo simulação de juízos, e alguns estudos de grande escala envolvendo juízos reais, permitiram chegar a conclusões surpreendentes, como ser mais provável os juízes “concederem liberdade condicional no início de um dia de trabalho ou após uma pausa para comer, do que imediatamente antes dessa pausa. Se tiverem fome, os juízes são mais duros”.

“Um estudo que teve como objecto milhares de decisões do tribunal de menores concluiu que, quando a equipa de futebol [americano] local perde um jogo ao fim-de-semana, os juízes tomam decisões mais duras à segunda-feira (e, em menor escala, durante o resto da semana)”.

“Um estudo que contemplou 6 milhões de decisões tomadas por juízes em França ao longo de 12 anos constatou que os arguidos usufruem de uma maior clemência no dia do seu aniversário [do aniversário do arguido, entenda-se]”.

Na análise de 207.000 decisões judiciais referentes a casos de imigração, foi encontrada uma relevante associação com a temperatura atmosférica: “quando está calor lá fora, é menos provável que os requerentes consigam asilo” (o que sugere uma complexa relação causal, pois, hoje em dia, muitas das audiências, diligências e decisões judiciais decorrem em ambiente climatizado).

“Um estudo que teve por base quase 700.000 consultas de cuidados primários demonstrou que é muito mais provável os médicos receitarem opióides no final de um longo dia [de trabalho]” ou quando estão atrasados na agenda de consultas: “quando os médicos estão pressionados pelo tempo, aparentemente sentem-se mais inclinados a escolher uma solução rápida, apesar dos sérios inconvenientes”.

Ao contrário do que os juízes e decisores profissionais gostam de pensar, “não somos a mesma pessoa em todos os momentos. À medida que o estado de espírito varia (uma coisa de que estamos conscientes), algumas características da máquina cognitiva variam com ele (uma coisa de que não estamos plenamente conscientes)”

A conjugação destes dados gera uma imagem da justiça que se aproxima de uma lotaria e leva a crer que o advogado de defesa de um requerente de asilo terá muito a ganhar se conseguir manipular a agenda judicial de forma a que a sentença seja proferida numa segunda-feira que, além de ser fresca, coincida com o aniversário do arguido e venha logo a seguir a uma vitória estrondosa da equipa de futebol da cidade (o panorama do futebol português faz com que o padrão geográfico-desportivo seja mais difuso do que nos EUA, já que boa parte do clubismo se reparte entre Benfica e Sporting, com adeptos deste dois clubes espalhados por todo o país, e só os adeptos do Porto se concentram em torno da cidade onde o clube tem o seu estádio).

Em resumo, o ruído pode ser assim decomposto: Ruído de sistema = ruído de nível + ruído-padrão estável + ruído ocasional

A montante da análise do ruído há que ter em consideração a diferença entre ruído e enviesamento, que Kahneman et al. elucidam usando uma prova de tiro ao alvo por equipas como analogia: o enviesamento equivale a um desvio sistemático de todos os disparos de uma equipa em relação ao centro do alvo; o ruído equivale à dispersão dos disparos entre os membros da equipa, independentemente do seu posicionamento em relação ao centro do alvo. Como Kahneman et al. esclarecem logo na introdução, intitulada “Dois tipos de erro”, “este livro não é sobre tiro ao alvo. O nosso tópico é o erro humano”.

O ruído custa caro

Poderá haver quem creia que o ruído nas decisões não deverá ser motivo de grande preocupação, pois os diferentes erros (excesso de severidade e excesso de clemência, por exemplo) acabam por anular-se mutuamente. Não é verdade: “os erros acumulam-se, não se anulam”.

Um tribunal com apenas dois juízes em que um é demasiado severo e outro é demasiado clemente até pode proferir, no seu conjunto, sentenças que se aproximam da média dos restantes tribunais, mas as suas sentenças incluirão a condenação, pelo primeiro juiz, de arguidos inocentes ou que cometeram delitos de pequena gravidade e a absolvição, pelo segundo juiz, de criminosos empedernidos.

Uma rede de supermercados em que coexistam dois responsáveis pela secção de frescos que façam estimativas muito díspares das quantidades de produtos a adquirir, será confrontada, simultaneamente, com a ruptura de stock dos produtos encomendados pelo gerente “conservador” – o que significa a perda de oportunidades de realizar vendas – e com a necessidade de descartar, por ultrapassagem do prazo de validade, de grandes quantidades de produtos encomendados pelo gerente “optimista”.

Se, numa empresa ou instituição, as entrevistas de emprego e a avaliação dos candidatos forem confiadas a pessoas com critérios díspares, é provável que sejam rejeitados candidatos com qualidades e sejam admitidos candidatos medíocres.

Uma empresa de construção civil com dois técnicos orçamentistas, um com inclinação para sobre-estimar o custo das obras e outro com inclinação para a sub-orçamentação está condenada à falência, pois os orçamentos elaborados pelo primeiro serão sistematicamente mais dispendiosos do que os apresentados pela concorrência e serão preteridos nos concursos, enquanto os orçamentos elaborados pelo segundo ganharão os concursos mas, uma vez executada a obra, gerarão prejuízo para a empresa.

A antiguidade deve ser um posto?

Se o ruído em juízos profissionais é tão difundido e tem um custo tão elevado, por que razão não é mais discutido e não se tomam medidas enérgicas para o diminuir? Kahneman et al. sugerem que a maioria das organizações nem se dá conta da sua existência, por viverem numa “ilusão da concordância”, que resulta de a maioria das pessoas acreditar que não só a sua perspectiva do mundo é correcta como é a única possível: “os outros vêem o mundo da mesma forma que eu”. Mesmo quem tem de formular regularmente juízos profissionais não se dá conta de que os seus colegas têm critérios e perspectivas diferentes e quando detecta discordâncias com colegas assume que estas são “lapsos de juízo” ocasionais da parte deles, não como sintoma de divergências mais vastas, sistemáticas e profundas. Ou seja, “podemos viver confortavelmente com os nossos colegas sem jamais repararmos que eles não vêem o mundo da mesma forma que nós”.

Poderia pensar-se que a experiência continuada levaria a que cada juiz profissional acabasse por dar-se conta das discordâncias com os colegas e começasse a questionar a validade dos seus próprios juízos ou a forma de operar da organização, mas o correr do tempo parece produzir o efeito inverso: o juiz inexperiente pode começar por discutir alguns casos com o seu supervisor ou com os colegas mais experientes, mas, à medida que ganha confiança, dispensa a consulta de outras opiniões. “A confiança [dos juízes] é estimulada pela experiência subjectiva de juízos que são formulados com uma fluência e facilidade cada vez maiores, em parte porque se assemelham a juízos formulados em casos semelhantes no passado”.

Ou seja: como a maioria das organizações é avessa ao “desconforto da discordância”, numa fase inicial não é feito grande esforço para instruir o juiz inexperiente de forma a adoptar os mesmos critérios que os colegas; pelo seu lado, o “novato” não se dá ao trabalho de verificar quais são as práticas dos colegas e de harmonizar as suas práticas com as deles. Com o passar do tempo, o juiz ganha auto-confiança, não por confirmar que os seus juízos são acertados, mas meramente porque são consistentes com os juízos por si formulados anteriormente em casos similares.

Assim sendo, nada garante que um juiz “sénior” produza melhores decisões do que um juiz “novato. Todavia, em muitas organizações a experiência é um dos elementos mais valorizados na “progressão da carreira” – na administração pública portuguesa, foi, durante muitos anos, o factor mais importante, bastava deixar correr o tempo e ia-se galgando automaticamente os sucessivos patamares na carreira. Ora, a antiguidade não se traduz necessariamente num acréscimo de qualificações ou num melhor desempenho e por vezes está associada à propensão para a rotina, à aversão à novidade e à adopção de estratagemas para evitar tarefas e responsabilidades – é um péssimo critério do ponto de vista do mérito comparado e da eficácia da organização, mas tem a vantagem de ser objectivo, transparente, inequívoco e fácil de calcular. É um critério potencialmente injusto, mas é pacífico, pelo que satisfaz as organizações que prezam o consenso e a paz acima de tudo, mesmo que o consenso seja ilusório e a paz, podre. Porém, as organizações – sejam elas empresas ou países – que acreditam que evitar conflitos é mais importante do que tomar as decisões certas raramente acabam bem.

Como a inflação de notas mina a avaliação de desempenho

A inadequação do critério (quase exclusivo) da antiguidade é tão flagrante que muitas organizações se viram forçadas a criar um sistema de avaliação de desempenho em que os dirigentes classificam periodicamente os seus subordinados. Porém, os estudos realizados sobre as avaliações de desempenho revelam que estas tendem a ser extremamente “ruidosas”: as diferenças entre as notas atribuídas resultam apenas em 20-30% das efectivas diferenças de desempenho entre os indivíduos avaliados, sendo os restantes 70-80% resultado do ruído de sistema. As razões para este ruído são muito variadas: os avaliadores “podem inflacionar de forma intencional uma classificação para evitarem justificar-se, para favorecerem uma pessoa que procura uma promoção há muito esperada ou até, paradoxalmente, para se livrarem de um membro da equipa que tem um desempenho abaixo da média, mas necessita de uma boa avaliação para conseguir a transferência para outro departamento”, escrevem Kahneman et al., deixando de fora, generosamente, a possibilidade de as avaliações poderem também ser fortemente condicionadas por considerações de cariz emocional (ódio, rancor, despeito, inveja, atracção sexual, mesquinhez, vingança – as possibilidades são ilimitadas).

Por outro lado, a maioria dos modelos de avaliação de desempenho são rapidamente corrompidos pela inflação das notas – Kahneman et al. dão o exemplo de “uma grande empresa industrial [que] observou que 98% dos seus gestores tinham sido classificados como ‘cumprindo plenamente as expectativas’”. Quando todos os funcionários da organização obtêm notas de topo, as avaliações deixam de ter qualquer utilidade. Era esta a situação que estava instalada na administração pública portuguesa, o que levou à introdução, em 2007, do Sistema Integrado de Gestão e Avaliação do Desempenho da Administração Pública (SIADAP), que impôs aos avaliadores uma “classificação forçada”, que não só impede a atribuição de “excelente” a todos os avaliados, como sujeita as avaliações a uma distribuição predeterminada (por exemplo: um número máximo de funcionários no escalão A, ou um número mínimo de funcionários no escalão Z).

A introdução de uma forma de “classificação forçada” tende a suscitar reacções de indignação e contestação – como preencherá as fichas de avaliação um chefe de divisão cuja equipa é, por acaso, constituída só por funcionários extremamente competentes e dedicados?. Segundo Kahneman et al., “os críticos da classificação forçada têm concentrado com frequência os seus ataques no princípio das avaliações, que desacreditam como brutal, desumano e, no fundo, contraproducente”, mas, para os autores, “a falha fatal da classificação forçada não é a ‘classificação’, mas o facto de ser ‘forçada’”. Uma vez que as diferentes equipas não têm constituição homogénea no que respeita ao desempenho, as “classificações forçadas” irão criar, inevitavelmente, erros e injustiças, mas estes serão, ainda assim, inferiores aos decorrentes de um sistema de avaliação de desempenho em que toda a gente é, sistematicamente, contemplada com “muito bons” e “excelentes”.

As organizações tendem hoje a investir quantidades colossais de dinheiro na avaliação de desempenho, crendo que tal poderá dar-lhes vantagem na luta com a concorrência, mas, apesar da introdução de métodos de avaliação cada vez mais complexos, “um estudo concluiu que uns surpreendentes 90% dos gestores, funcionários e directores de recursos humanos acreditam que os seus processos de gestão de desempenho não se traduzem nos resultados que esperavam”.

Jogar no Totobola à segunda-feira

Um dos tipos de juízos mais frequentemente solicitados são as previsões. Ao contrário da astronomia, em que é possível estimar com precisão onde estará Neptuno de hoje a 300 dias, as previsões envolvendo seres humanos são pouco fiáveis.

A mente humana tem uma forte propensão para o pensamento causal, que cria “histórias em que acontecimentos, pessoas e objectos específicos se afectam mutuamente”, de forma a “explicar” o desfecho a que assistimos, seja ele qual for. A maioria dos eventos tem lugar no que Kahneman et al. designam como “vale da normalidade”, “onde os acontecimentos não são inteiramente esperados nem especialmente surpreendentes”; quase todos eles “parecem normais em retrospectiva, embora não fossem esperados e embora não fôssemos capazes de prevê-los”. O observador de um destes eventos elaborará com facilidade uma narrativa que o explica, mas não lhe custaria mais elaborar uma narrativa caso o evento tivesse produzido o resultado oposto. Ou seja, “o destino que é alcançado por fim faz sempre sentido”, o que leva a que, em retrospectiva, a realidade pareça quase sempre previsível. E é a esta (quase) inesgotável capacidade para estruturar narrativas que explicam os eventos que testemunhamos que chamamos a “compreensão do mundo”. Como escrevem Kahneman et al., “a sensação de compreender a vida à medida que ela se vai desenrolando consiste no fluxo constante de retrospectiva no vale da normalidade. Esta sensação é fundamentalmente causal: novos acontecimentos, quando conhecidos, eliminam alternativas, e a narrativa deixa pouco espaço para a incerteza”. E a nossa aversão à incerteza é tal que, mesmo quando a experimentamos, temos tendência a apagar essa experiência da nossa memória.

Tivemos recentemente um excelente exemplo desta forte pulsão para a criação de narrativas explicativas da realidade com a maioria absoluta obtida pelo Partido Socialista nas eleições legislativas de 30 de Janeiro. Algumas sondagens admitiram tal resultado, mas apenas no limite superior da margem de erro da votação no PS (e numa situação de indefinição que gerou margens de erro invulgarmente amplas). Para mais, o PS tinha vindo a ser apresentado nos media como um partido a perder ímpeto, em resultado do desgaste de seis anos no Governo, do impacto de quase dois anos de pandemia, confinamentos e outras restrições da vida social, associados a um recuo da economia e a um sentimento geral de pessimismo dos empresários e cidadãos; somava-se a isto a perda pelo PS de algumas câmaras importantes (nomeadamente a de Lisboa) nas recentes eleições autárquicas, bem como a uma pouco entusiasmante – dizia-se – campanha eleitoral de António Costa (levando alguns comentadores a sugerir que Costa nem sequer estava empenhado em voltar a ser primeiro-ministro). A ideia de que o PS estava a entrar em “fim de ciclo” ia sendo repetida com insistência e, logo, os políticos e comentadores não perderam tempo a especular sobre o cenário da obtenção de maioria absoluta pelo PS.

Todavia, nos dias que se seguiram às eleições de 30 de Janeiro, políticos e comentadores irromperam nos media a explicar detalhadamente e em tom assertivo e professoral, como o PS conquistara 119 deputados, como o PSD se quedara pelos 73 e como a CDU e o BE tinham caído de 12 para 6 e de 19 para 5, respectivamente. Era tudo perfeitamente límpido: fora o efeito do voto útil à esquerda, da “dinâmica de bipolarização” entre PS e PSD, da “dramatização do perigo da direita” levada a cabo por António Costa, de o PS se ter “apropriado dos avanços” nas condições de vida dos trabalhadores que tinham sido obra do PCP, da associação do PSD aos “anos da troika”, da falta de confiança numa “geringonça” que acabara de mostrar-se incapaz de acordo, de a grande massa de dependentes do Estado (funcionários públicos, reformados) ter visto no PS a melhor garantia de estabilidade, de Rui Rio não ter feito uma oposição eficaz, de Rui Rio não se ter demarcado claramente de André Ventura, de Rui Rio ter anunciado que o PSD não era um partido de centro-direita, de o BE “não ter sido capaz de comunicar as razões profundas do chumbo do Orçamento de Estado”, ou de as empresas de sondagens terem sub-representado (presume-se que de forma deliberada e concertada) a votação no PS, de forma a incentivar os seus potenciais eleitores a ir votar.

Uma vez que boa parte desta miríade de “narrativas” foi apresentada pelas lideranças dos partidos derrotados (os vencedores nunca precisam de justificar a vitória, que se deve simplesmente a terem “sabido merecer a confiança do povo português”), levantam-se várias questões candentes: se é assim tão claro para o BE que a sua derrota se deveu à falha de comunicação “das razões profundas do chumbo do OE”, por que razão não empregou o BE todas as suas energias e recursos na explicação dessa atitude aos eleitores? Se o triunfo do PS foi conseguido ao reivindicar para si conquistas que tinham sido obra do PCP, como se explica que o PCP não tenha feito tudo para desmistificar essa atoarda? Se era óbvio que a maior ameaça à vitória do PSD era o efeito do “voto útil à esquerda”, como se explica que Rui Rio tivesse apostado numa campanha “leve e fresca”, pontuada por faits divers como o gato Zé Albino?

É tão fácil urdir narrativas plausíveis depois de conhecer o fim da história…