Jornal Correio Braziliense

Trabalho e Formacao

Entenda o que é mineração de dados e o que faz um cientista da área

Esse profissional precisa não só garimpar grande volume de informações, mas, sobretudo, saber aplicá-las de modo inteligente. O mercado oferece boas oportunidades para os que trabalham no setor, que é novo e carece de mão de obra capacitada. No DF, o ramo começa a despontar e já há uma graduação e algumas pós na área

Profissão: cientistade dados


O mercado oferece boas oportunidades para quem trabalha minerando grande volume de informações. O setor é novo e carece de mão de obra capacitada. No DF, o ramo começa a despontar e já há uma graduação e algumas pós na área
Acessos e cliques em sites, curtidas nas redes sociais, formulários on-line, pesquisas... Há um turbilhão de dados que os internautas geram diariamente e que é armazenado na internet. Quem sabe garimpar a montanha de informações pode usá-la para diversas finalidades em áreas das mais distintas, como marketing, indústria e até medicina. Essa é a tarefa do cientista de dados. A profissão é considerada uma das mais promissoras para o futuro pela consultoria Robert Half e pelo site de empregos Catho. O Fórum Econômico Mundial também a listou como uma das mais relevantes para o mercado até 2020. Imagine saber quem será o próximo presidente dos Estados Unidos, qual será a música hit do verão e quem desenvolverá câncer... Todas essas são possibilidades de respostas que podem ser encontradas ao estudar dados.

E há pessoas correndo bastante atrás para conseguir predizer questões como essas. Um exemplo clássico do uso inteligente de dados é o caso do supermercado que percebeu que muitos dos homens que compravam cerveja na sexta-feira também adquiriam fraldas descartáveis. Ao colocar os dois produtos próximos um do outro na prateleira, o estabelecimento teria conseguido duplicar as vendas. De acordo com Eduardo Fonseca Mendes, professor da Escola de Matemática Aplicada da Fundação Getulio Vargas (EMAp/FGV), a profissão de cientista de dados ganhou espaço devido ao crescimento da internet. ;Nos últimos 20 anos, tem acontecido uma explosão da produção de dados. Teve uma mudança na maneira como as pessoas se relacionam com o computador. Eu estou o tempo todo usando sistemas que geram dados, como a Uber;, diz. ;Mas uma coisa são os dados, outra é o conhecimento. E esse é o objetivo da ciência de dados. Se você não consegue monetizar e interpretar, os dados não servem para nada;, explica.
Para Fabio Meneghim, vendas de analytics e Big Data na Hitachi Vantara, empresa de gerência de dados, a tendência é de que esse profissional seja cada vez mais requisitado. ;O prognóstico não poderia ser melhor. Este é um mundo em que a gente está o tempo todo conectado, gerando continuamente informações sobre nossas preferências;, afirma. De acordo com Eduardo Fonseca Mendes, engenheiro de computação pela Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio) e doutor em estatística pela Northwestern University, o cientista de dados é muito valorizado pelas empresas pelo fato de elas entenderem o valor que esse profissional pode gerar. Além disso, são poucas as pessoas capacitadas para trabalhar na área, isso faz com que haja oportunidades de emprego e que sejam oferecidos altos salários.

Segundo Fabio Meneghim, a carência de profissionais é uma vantagem para os que já estão na área. ;Quem tem familiaridade com matemática e estatística tem um longo caminho, mas não vai sofrer de desemprego;, diz. De acordo com Eduardo Fonseca Mendes, porém, antes de se arriscar no setor, não se deve apenas olhar para o crescimento da área, mas, sim, identificar se você tem perfil para trabalhar com o assunto. ;Tem que ter uma curiosidade científica forte, interesse em colocar a mão na massa, gostar de matemática e estatística;, explica. ;A pessoa precisa entender de modelos de negócios. Não pode esquecer a parte humana. A quantidade de pessoas sendo substituídas por robôs vai aumentar e o que vai sobressair são as relações humanas;, completa Fabio.

Na prática

E já existem cientistas de dados atuando em Brasília. É o caso de Hommenig Scrivani, 35 anos. Ele é superintendente de dados, analytics e CRM do Laboratório Exame. ;Minha atividade envolve algumas etapas: consolidação dos dados, interação do cientista com outras áreas para saber que perguntas podemos fazer e depois fazer a análise em si;, explica. Ele conta com uma equipe de 12 colaboradores para executar essas tarefas. ;O que a gente busca são formas de melhorar a vida do paciente. Por exemplo, sabemos que mais de 3% das pessoas que agendam exames não comparecem;, afirma. ;Quando isso acontece, geram-se alguns problemas: o médico, muitas vezes, não recebe; tinha outro paciente que queria marcar e não conseguiu; e ainda complica a parte financeira para a empresa;, completa.
;Para lidar com isso, desenvolvemos um modelo estatístico para saber qual o paciente que faltará. Dessa forma, podemos fazer uma ligação lembrando-o do exame ou, até mesmo, marcar outra pessoa para vir no lugar dele;, exemplifica. Graduado em estatística, Hommenig atua com ciência de dados desde 2005 e percebe que o setor tem crescido e se valorizado. ;Eu sempre gostei de trabalhar com números, é um assunto que me encanta. Conheci a profissão por meio de uma professora. E eu gosto da área por ser possível conseguir resultados práticos. Minha escolha pela saúde é pela quantidade de dados disponíveis;, justifica.

Graduação pioneira no DF

Brasília oferece a única graduação presencial da área no país: é o curso de nível superior em ciência de dados e inteligência artificial do Centro Universitário Iesb. A mesma instituição também oferece uma pós-graduação em ciência de dados. O coordenador das duas formações, Sérgio Côrtes, explica que o trabalhador da área faz o que se chama de mineração de dados. ;O mercado de trabalho necessita de milhares de profissionais com essa formação. Instituições financeiras, seguradoras, entidades públicas nas esferas federal, estadual e municipal também são grandes demandantes;, aponta.
;De forma geral, podemos afirmar que todas as empresas, de todos os ramos, necessitam ser orientadas por dados, por informações e por uma busca permanente de conhecimentos. Isso é importante para garantir um nível elevado de competitividade no Brasil e no exterior;, argumenta. De acordo com Sérgio Côrtes, a estimativa é de que o mercado de trabalho nacional necessite de no mínimo 80 mil profissionais do ramo nos próximos 10 anos. ;Na Europa e nos Estados Unidos, esse número chega a cerca de 2 milhões de cientistas de dados;, completa. O curso superior do Iesb foi criado há um ano e envolve disciplinas de matemática, estatística, computação e inteligência artificial, machine learning, deep learning, robótica e automação. ;Nossos meninos ainda estão no terceiro período e já são requisitados para estágios;, afirma o professor.
Uma das alunas dele é Érika da Silva Santos, 20 anos, que começou a graduação sem nem ter muita noção do que era o curso. ;Escolhi por me identificar com a área de exatas;, conta. ;Hoje, permaneço no curso porque nele posso ter contato com todas as áreas e porque o mercado de trabalho está crescendo cada dia mais;, diz. ;Ainda é meio incerto no que eu pretendo trabalhar, mas gostaria que fosse no setor público. Também quero ter uma empresa de análise de dados, que ajudaria outras empresas a ter mais assertividade em relação ao público-alvo, aos produtos... Enfim, ajudaria na tomada de decisão;, planeja.

É bom pelo menos entender

De acordo com Eduardo Fonseca Mendes, mesmo que você não tenha interesse em trabalhar com ciência de dados, é importante ter noção desse universo, independentemente da sua área de atuação. ;É um plus para as graduações. Existem cursos de curta duração que ajudam a entender como são os dados, como usar gráficos para contar uma história, o storytelling, visual nalytics;, diz.

A parte acadêmica

Na turma do mestrado profissional em ciência da computação ; linha de pesquisa ciência de dados da UnB, muitos alunos buscam soluções para problemas enfrentados no cotidiano do trabalho ao minerar grande volume de informações. O estudante José Eduardo Vaz Nascimento, 31, é formado em física e trabalha no Hospital Sírio-Libanês. ;A ideia é facilitar algumas etapas e a tomada de decisão médica. Nós conseguimos prever alguns parâmetros de um tipo de medicamento, no caso para tratamento de câncer no crânio. Assim, temos uma previsão de qual dose o cérebro receberá para tratar lesões;, explica. Também aluno da pós na UnB, Gustavo Cunha Garcia, 41, já aplica os conhecimentos adquiridos na rotina. ;Eu sempre tive curiosidade pela área, e a instituição em que trabalho tem interesse em avançar e absorver esse tipo de conhecimento;, diz ele, que trabalha na Agência Nacional de Vigilância Sanitária (Anvisa).
;Eu trabalho com inteligência regulatória, que é exatamente processar dados e transformar em informações para a tomada de decisões internas;, explica o economista. Estudantes que já terminaram o mestrado na Universidade de Brasília também continuam aplicando os conhecimentos de mineração de dados na rotina. É o caso de Débora Reis, 31, chefe da área de ciência de dados do Ministério da Economia, que terminou o curso no ano passado. ;Vi que era um caminho quase sem volta, eu tinha que me atualizar. As coisas na área de TI acontecem muito rápido. A área de ciência de dados veio para ficar. Não tem como fugir;, explica a graduada em ciência da computação pela Universidade Paulista (Unip). ;No meu trabalho, temos várias bases de dados do governo federal e, com a ciência de dados, fazemos a integração com diferentes órgãos. Assim, podemos construir políticas públicas melhores e otimizar serviços;, explica.
Ela usa os conhecimentos para observar comportamentos de compra anteriores e, assim, evitar fechar contratos ruins. ;Temos vários dados abertos que qualquer cidadão pode acessar e ter seu momento de cientista de dados;, brinca. No caso do auditor-fiscal da Receita Federal Leon Silva, 39, foram as próprias demandas do órgão que o levaram a estudar. ;Mudou o rumo da minha carreira. Sei que está na moda, mas a gente realmente consegue resolver problemas que não conseguiria sem a ciência de dados. Eu trabalho com compensação de créditos tributários e uma coisa que se consegue fazer por meio da ciência de dados é tirar pessoas da malha fina que não deveriam estar;, exemplifica. Para ele, o Brasil ainda tem que avançar na área, mas já há boas pessoas trabalhando com isso.
;Na Receita, temos um caso de sucesso bem interessante que foi apresentado até internacionalmente. No serviço aduaneiro (liberação de mercadoria pela alfândega para a entrada ou saída no país), há vários riscos. Por meio do sistema que foi desenvolvido lá, é possível avaliar melhor as chances de fraude;, afirma ele que terminou a pós em 2016 e é formado em computação pela UnB. Para Gustavo Van Erven, 39, estudar mineração de dados foi um caminho natural já que ele trabalhava com bancos de dados. Ele é formado em física e terminou o mestrado em 2015. Na Corregedoria-Geral da União (CGU), ele trabalha com pesquisa e informação estratégicas. ;A gente tenta encontrar o que é mais vantajoso para a administração pública, o que tem na gestão pública que podemos melhorar. Podemos identificar fraudes e economizar dinheiro;, afirma.

E a minha segurança?


O debate sobre o uso de dados está em alta. Recentemente, o Brasil aprovou a Lei Geral de Proteção de Dados Pessoais, que rege sobre como informações podem ser tratados. A norma entrará em vigor em 2020. A principal inovação é a criação da Autoridade Nacional de Proteção de Dados (ANPD), órgão responsável por implementar a legislação e fiscalizar o cumprimento. A Medida Provisória que regulamenta a legislação está sob análise de comissão mista no Congresso Nacional.

;A gente tem discussões que estão indo para o Congresso. A lei ainda não está clara. Os EUA também estão discutindo isso. A Europa está falando em direito do esquecimento: afinal, eu tenho direito a não aparecer no Google? Esse é um debate que deve esquentar por aqui;, opina Marcelo Vitorino, consultor e professor de comunicação e marketing político pela Escola Superior de Propaganda e Marketing (ESPM). ;O Brasil está entrando numa regulação para falar sobre proteção dos dados das pessoas que vai trazer mais controle. Nós, como pessoas físicas, temos informações circulando;, completa Fabio Meneghim, big data.

Seminário discute nova legislação


Para ajudar as empresas a se prepararem para a Lei de Proteção de Dados, que entra em vigor em 2020, a Unidas (União Nacional das Instituições de Autogestão em Saúde) discutirá o tema no 10; Seminário Unidas ; Gestão das informações em saúde como estratégias para tomada de decisão. O evento ocorre amanhã e terça-feira. no Windsor Plaza Hotel, em Brasília. A palestra Lei Geral de Proteção de Dados: desafios e oportunidades para a conformidade legal será amanhã, das 11h40 às 12h30. Um dos que discutirá o assunto no seminário será Marcelo Crespo, especialista em direito digital. Ingresso: R$ 880 (filiados) ou R$ 1.430 (não filiados). Há desconto para quem fizer mais de duas inscrições. Informações: 10seminario.unidas.org.br.


Revolução

Nas campanhas políticas


Na última eleição americana, o uso de dados se tornou pauta, pela polêmica envolvendo a campanha do presidente eleito Donald Trump. O candidato republicano usou um banco de dados da empresa Cambrigde Analytics. Com as informações, era possível fazer propagandas específicas para um grupo determinado. O problema é que a empresa está sendo acusada de ter conseguido os dados de 87 milhões de pessoas ilegalmente. ;O Obama usou big data. Para isso, o partido passou cinco anos coletando informações sobre os simpatizantes. O Trump não tinha isso e usou um atalho, que foi a compra de um banco de dados. Isso no Brasil não é permitido;, explica Marcelo Vitorino, professor e consultor de marketing digital e gestão de crise.

No Brasil, de acordo com Marcelo Vitorino a mineração de dados está sendo usada no marketing político, porém ainda de forma incipiente. ;Está engatinhando nesse sentido, são poucos aqueles que conseguem usar e, quando a gente fala na internet, é muito mais fácil;, diz. Ele explica que é só uma mudança.

Antes, eram feitas pesquisas quantitativas e qualitativas por telefone ou presencialmente. Agora, a tendência é usar dados que estão disponíveis no mundo digital. ;Por exemplo, se eu quero saber que vídeo atinge o meu público, posso identificar isso sabendo quem efetivamente o assistiu. O desafio da comunicação hoje não é entregar o conteúdo, é entregá-lo para a pessoa correta;, diz.




*Estagiária sob supervisão da subeditora Ana Paula Lisboa