Newsletter
Ciência e Cultura - Agência de notícias da Bahia
RSS Facebook Twitter Flickr
Atualizado em 24 DE agosto DE 2017 ás 17:46

Inteligência artificial analisa gastos de deputados

Jovens desenvolvem uma plataforma para investigar como deputados brasileiros usam a cota única mensal destinada ao custeio dos gastos vinculados ao exercício da atividade parlamentar, a chamada Cota para o Exercício da Atividade Parlamentar

POR REBECA ALMEIDA*
rasrebeca@gmail.com

Ela se chama Rosie. É uma inteligência artificial capaz de analisar pedidos de reembolso para a Câmara dos Deputados. A Rosie analisa dados abertos da Câmara dos Deputados, referentes à Cota para o Exercício da Atividade Parlamentar (CEAP), antiga verba indenizatória, que é “uma cota única mensal destinada a custear os gastos dos deputados exclusivamente vinculados ao exercício da atividade parlamentar”, segundo definição do site da Câmara.

Em uma palestra sobre a Rosie, a cientista de dados Jessica Temporal explicou a origem do projeto. Segundo ela, a ideia surgiu quando o cientista de dados Irio Musskopf percebeu que, apesar de ter conhecimentos pouco triviais em programação e ciência da computação, não se sentia seguro na hora de escolher um candidato em quem votar. “Assim, ele e mais dois amigos, Felipe Cabral e Eduardo Cuducos, se uniram para tentar entender, baseados nos dados abertos brasileiros, como os deputados gastam dinheiro, o que poderia ser um bom indicativo da índole de um candidato”, conta Jessica. Ela é a integrante da Operação Serenata de Amor.

Com o passar do tempo, eles perceberam que gostariam de trabalhar integralmente no projeto. Resolveram então compartilhar os códigos que já haviam desenvolvido no GitHub, plataforma voltada para o desenvolvimento colaborativo de softwares, e depois iniciaram um projeto de financiamento coletivo. O plano era alcançar o montante de R$ 60 mil e trabalhar com uma equipe de oito pessoas por dois meses. Concluído o financiamento, tinham conseguido mais de R$ 80 mil e a Operação Serenata de Amor começou oficialmente em novembro de 2016. “No final do financiamento, 1286 pessoas haviam contribuído. Deu para trabalhar por três meses”, conta Jessica.

“Três meses depois, a gente queria continuar com o projeto. Quem trabalha com análise de dados sabe que três meses é um período curto para desenvolver algo palpável”. Assim, a equipe continuou trabalhando, mesmo depois que os recursos do financiamento coletivo terminaram. O objetivo final é desenvolver uma Inteligência Artificial (IA) capaz de analisar os gastos das verbas públicas, não apenas da Câmara dos Deputados, mas se estender para outras esferas do poder público, como o Senado Federal. “Com a operação Serenata de Amor ainda não temos braços para tudo que sonhamos. Atualmente, analisamos apenas gastos da Câmara e um pouco do Senado”, explica Eduardo Cuducos no site da operação.

infografico.png

Infográfico disponível no site da Operação Serenata de Amor

Por que uma IA? – Atualmente, cerca de 503 deputados solicitam reembolsos para seus gastos pessoais em exercício de trabalho baseados na CEAP. Assim, para cada pedido de reembolso é gerado um processo que deverá ser analisado por uma equipe técnica para se certificar a autenticidade do mesmo. Por dia, são cerca de 1500 pedidos para uma equipe de apenas quatro pessoas. Todos esses dados ficam disponíveis para qualquer cidadão na API (Application Programming Interface) da Câmara dos Deputados. No entanto, não é qualquer pessoa que detém os conhecimentos técnicos específicos para lidar com a plataforma. Além disso, o volume de dados é tamanho que se torna inviável analisar tudo “manualmente”.

“Como uma equipe de quatro pessoas pode analisar 1500 processos diários? Analisar se o restaurante que um deputado comeu é de fato um restaurante? Se o valor de reembolso solicitado equivale ao valor da refeição no local indicado? Isso e vários outros fatores em cada processo?”, questiona Jessica. Dessa forma, o objetivo da Rosie é acessar os reembolsos que foram aceitos e estão disponíveis no site da Câmara e ver se eles são realmente válidos. Como sempre surgem novos dados, uma vez que novos pedidos de reembolso surgem diariamente, seria necessário que o software desenvolvido fosse capaz de se atualizar constantemente, ou seja, aprender sozinho.

Assim foi desenvolvida a Rosie, uma IA que funciona com base em hipóteses. “A Rosie roda na linha de comando e é necessário dar os comandos para ela, como ‘rode’ ou ‘teste’. Ela roda em mais ou menos uma hora e meia para os dados da Câmara dos Deputados”, explica Jéssica. A IA funciona analisando cada subcota que a CEAP prevê, tal como alimentação, transporte, manutenção de escritório e outros. Para cada área, ela levanta hipóteses que podem classificar um reembolso como suspeito ou não. A Rosie testa centenas de hipóteses para cada processo. Felipe Cabral acredita que levantar essas questões é importante “para entender se os deputados utilizam a verba da CEAP como complemento de renda, caracterizando ou não desvio de função da verba”.

No entanto, apesar de terem desenvolvido uma IA capaz de otimizar o processo, a equipe da Serenata não pode abrir mão do trabalho humano. “A Rosie, apesar de ser mais eficiente que um grupo de humanos, não é perfeita. Ela processa 1 milhão e meio de reembolsos, filtra os suspeitos (atualmente são 3 mil) e nós, com um trabalho de auditoria, separamos quais temos base o suficiente para denunciar”, explica Felipe.

Ou seja, a Rosie opera apontando suspeitas de fraudes nos pedidos de reembolso, e, a partir disso, a equipe precisa analisar se essas suspeitas são válidas e então formalizar denúncias no site da Câmara. “Como toda tecnologia de aprendizado, ela [a Rosie] pode ter falhas, pois vai aprendendo aos poucos”, explica Jessica. Por isso, parte do trabalho da Serenata é feito por humanos.

A equipe acessa os dados específicos sobre um caso suspeito e começa um trabalho de refino. Para alimentação, por exemplo, é preciso saber se a nota fiscal emitida é referente a um endereço existente ou não. Caso seja, passa-se para outros questionamentos, como se o CNPJ da empresa é válido ou não, se o valor emitido na nota equivale é condizente com o valor da alimentação no local indicado… Dessa maneira, a equipe da Serenata e voluntários de todo o Brasil estão fazendo uma pilha de denúncias de casos suspeitos encontrados pela Rosie.

O objetivo do refino é evitar sobrecarga denúncias. Em janeiro, foi realizado um mutirão para formalizar denúncias baseadas nos dados levantados pela Rosie. Até hoje foram formalizadas 629 denúncias na Câmara dos Deputados, sendo referentes a 216 políticos diferentes, com um total de R$ 378 mil de gastos suspeitos levantados (dados do site da Operação Serenata de Amor).

Sobre a CEAP – A CEAP é uma lei de 2009 que prevê uma cota para reembolsos de gastos de deputados e atende a uma série de despesas, dentre as quais: passagens aéreas, telefonia, serviços e produtos postais, manutenção de escritórios, assinatura de publicações, alimentação, hospedagem, despesas com locomoção, combustível, serviços de segurança, contratação de consultorias e trabalhos técnicos, divulgação da sua atividade parlamentar, participação do parlamentar em cursos, palestras, seminários, simpósios, congressos ou eventos congêneres.

O valor disponibilizado pela CEAP é baseado na distância do estado de origem do deputado com relação à sede da Câmara, no Distrito Federal. O objetivo principal dela é garantir que os deputados consigam exercer plenamente seu trabalho, frequentando as reuniões na Câmara sem deixar de lado seu estado de origem.

Aplicação da Operação Serenata de Amor – Qualquer pessoa pode ter acesso às suspeitas que a Rosie levanta. Além disso, o projeto todo está compartilhado na internet e baseado em princípios de código aberto. Para além da equipe oficial da operação, qualquer pessoa pode colaborar. Muitas coisas referentes ao projeto estão em inglês, segundo Jessica, para que pessoas do mundo todo possam contribuir. “A gente gostaria que o projeto pudesse ser adaptado e aplicado para diferentes países”, explica.

Atualmente, a equipe continua trabalhando a partir de doações e colaborações de diversas pessoas, uma vez que o dinheiro do financiamento coletivo acabou. Por conta disso, a operação enfrenta uma série de dificuldades. A principal delas é o trabalho de “traduzir” os dados levantados pela Rosie, tornando o conhecimento mais acessível para quem tem pouquíssimo conhecimento de informática.

Através da interface Jarbas, desenvolvida pela equipe da Operação Serenata de Amor, qualquer pessoa pode ter acesso a todos os reembolsos analisados pela Rosie. O Jarbas se apresenta em forma de tabela, o que pode ser pouco atraente para o usuário comum. A forma de interagir com os dados ainda é manual, tornando o processo de comparações entre diferentes deputados pouco intuitivo. Além disso, ainda não é possível fazer download das tabelas completas.

Os números da Rosie para a Bahia – hoje, 38 deputados em exercício representam o estado da Bahia, segundo dados do site da Câmara. Nossa equipe fez uma busca básica voltada especificamente para os representantes do estado. Os dados levantados pela IA começam a partir do ano 2009. No dia 18 de agosto de 2017, a Rosie apontava 121.586 processos de reembolsos referentes ao estado da Bahia, desde 2009 até 2017. Destes, 543 foram considerados suspeitos pela robô. Em 2017, foram aprovados 4 mil pedidos de reembolso, sendo que nenhum deles foi considerado suspeito.

interface do jarvas.png

Amostra de tabela do Jarbas com dados referentes aos deputados da Bahia

O maior valor reembolsado este ano foi de R$ 40 mil para o deputado Sérgio Brito (PSD), referente a gastos com consultorias, pesquisas e trabalhos técnicos, pagos para a empresa Seculus Consultoria e Assessoria. Gastos com consultorias e pesquisas somados com gastos com divulgação de atividades parlamentares representam os maiores valores reembolsados.

*Estudante de jornalismo na Faculdade de Comunicação e repórter da Agência de Notícias em CT&I – Ciência e Cultura da Ufba

Deixe um comentário

O seu endereço de email não será publicado Campos obrigatórios são marcados *