Avanço em aprendizado de máquina possibilita novas tecnologias baseadas na análise de imagens

Máquinas podem ser treinadas para classificar imagens e, desse modo, identificar tumores em tomografias, composições mineralógicas em rochas ou patologias em análises de microscopia óptica. Essa área da inteligência artificial é conhecida como aprendizado de máquina e vem ganhando novas aplicações nos últimos anos.

O treinamento da máquina é feito por meio da repetição de imagens usadas como exemplos de um determinado contexto ou situação e a preparação adequada desse material requer um esforço de especialistas das mais diversas áreas.

“O humano é que coordena. Sem o controle do especialista sobre o processo de treinamento, a máquina pode aprender a tomar decisões com base nas características da imagem que não estão relacionadas ao problema-alvo. Isso gera um resultado ruim ou restrito àquela base de dados em que a máquina foi treinada. Quando muda a base de dados, o erro aumenta consideravelmente, tornando a análise da máquina pouco confiável”, disse Alexandre Xavier Falcão, do Instituto de Computação da Universidade Estadual de Campinas (Unicamp), em palestra apresentada na última quinta-feira (21/11) na FAPESP Week France.

Falcão tem unido a ciência da computação com diferentes áreas do conhecimento a partir de projetos em machine learning, desenvolvidos com o apoio da FAPESP, linha de pesquisa que investiga a interação humano-máquina na tomada de decisões.

Automatização da detecção de parasitas

Um dos projetos liderados por Falcão e apresentados na FAPESP Week France teve como objetivo automatizar a detecção de parasitas em exame de fezes. A pesquisa foi conduzida por meio de uma parceria entre a Immunocamp e pesquisadores dos Institutos de Computação e de Química da Unicamp, além da Faculdade de Ciências Médicas da mesma universidade.

A equipe interdisciplinar desenvolveu uma máquina – patenteada e em breve disponível no mercado – capaz de identificar as 15 espécies mais prevalentes de parasitas que infectam humanos no Brasil.

A técnica de aprendizado de máquina demonstrou eficiência superior a 90%, bem maior que as análises convencionais realizadas por humanos por meio de análise visual de lâminas de microscopia óptica, cujos índices variam de 48% a, no máximo, 76%. A máquina também é capaz de processar 2 mil imagens em quatro minutos.

“A ideia não é substituir o trabalho de humanos, até porque eles precisam treinar as máquinas para a identificação de mais espécies de parasitas e confirmar o diagnóstico dos patógenos detectados pela máquina, mas evitar a fadiga dos humanos e aumentar a precisão dos resultados”, disse.

A tecnologia inédita contou também com apoio da FAPESP por meio do Programa Pesquisa Inovativa em Pequenas Empresas (PIPE).

Aprendizado interativo de máquina

De acordo com Falcão, a primeira dificuldade do projeto foi ensinar a máquina a distinguir nas imagens o que era impureza e o que era, de fato, parasita. “Só conseguimos contornar esse obstáculo por meio da combinação entre técnicas de processamento de imagens, aprendizado interativo de máquina e visualização. O especialista e a máquina participam de forma colaborativa no ciclo do aprendizado da máquina. Outro ponto importante é que áreas da saúde e da química têm criado técnicas para gerar lâminas de microscopia óptica mais ricas em parasitas e com menos impurezas fecais”, disse.

Uma das inovações criadas pela equipe da Unicamp foi um sistema para separação de parasitas e impurezas baseado no princípio de flotação por ar dissolvido.

A máquina é capaz de fazer a varredura automatizada da lâmina e detectar os parasitas que aparecem em imagens na tela do computador. Isso foi possível por meio de técnicas computacionais que separam os componentes da imagem para verificar e decidir se são impurezas ou uma das 15 espécies parasitárias.

“A interação humano-máquina tem potencial para reduzir o esforço humano e aumentar a confiança na decisão algorítmica. Nossa abordagem tem mostrado que a inclusão do especialista no ciclo de treinamento gera sistemas confiáveis de tomada de decisão baseada em análise de imagem."

O intuito da metodologia é minimizar o esforço do especialista na anotação de imagem em larga escala visando a construção de sistemas de tomada de decisão com alto índice de acerto.

“A abordagem clássica, que usa exemplos pré-anotados e sem interação humana durante o treinamento, deixa várias perguntas sem resposta. São questões essenciais, como quantos exemplos são necessários para que as máquinas aprendam ou como explicar as decisões tomadas pela máquina. A nossa metodologia consiste em incluir o especialista no ciclo do aprendizado de máquina para que perguntas como essas sejam respondidas”, disse.

A estratégia da equipe de Falcão para construir sistemas de tomada de decisão confiáveis tem sido explorar habilidades complementares. “Os humanos são superiores na abstração de conhecimento. Já as máquinas não se cansam e são melhores no processamento de grandes quantidades de dados. Desse modo, o esforço do especialista é minimizado ao controlar o ciclo de aprendizado e as decisões das máquinas passam a ser explicáveis”, disse.

Aprendizado autônomo

Outra técnica de machine learning que tem sido empregada cada vez mais para desenvolver novas tecnologias baseadas em análise de imagens é a de deep learning, que visa treinar as máquinas a aprenderem sozinhas por meio de reconhecimento de padrões e, dessa forma, agirem e interpretarem dados de modo mais natural.

Os avanços nessa área têm possibilitado inovações importantes baseadas na análise de imagens, como reconhecimento facial, identificação de corpos celestes ou sistemas capazes de descrever o conteúdo de uma foto, destacou Nina Hirata, pesquisadora do Instituto de Matemática e Estatística da Universidade de São Paulo (IME-USP), em palestra apresentada também na última quinta-feira (21/11) durante a programação da FAPESP Week France.

“Tarefas comuns em problemas de análise de imagens, como classificação, reconhecimento de objetos, segmentação [delineação precisa do contorno de objetos] e interpretação do conteúdo, podem ser abordadas com técnicas de machine learning e, nos últimos anos sobretudo, com técnicas de deep learning”, disse Hirata.

Como explicou a pesquisadora, deep learning envolve técnicas que permitem processar uma imagem diretamente, sem que um humano precise descrever as características da imagem durante o treinamento da máquina.

“Antes era preciso escrever algoritmos muito específicos para extrair informações de características da imagem. Cada caso era um caso. O processo era muito manual. Hoje, com o deep learning, essa tarefa ficou muito mais fácil, o que nos permite focar em tarefas de nível mais elevado. Por exemplo, no caso de imagens biomédicas, em vez de empenhar nosso esforço em segmentar e extrair características de células individuais em um tecido, podemos canalizar o esforço na comparação de tecidos”, disse Hirata.

No entanto, acrescentou, apesar dos vários aspectos positivos dessa tecnologia, existem também vários desafios a serem vencidos. “Deep learning é uma espécie de caixa-preta: é muito difícil explicar por que ele está funcionando ou por que, às vezes, deixa de funcionar”, disse Hirata.

Interdisciplinar

A pesquisadora da USP trabalha atualmente em um projeto dedicado ao entendimento de imagens e de modelos de deep learning. Outro objetivo da pesquisa é testar a aplicação desses modelos em áreas diversas da ciência, como o reconhecimento de espécies de plânctons e a identificação de corpos celestes em imagens capturadas por meio de telescópios. Ela ainda citou outros projetos em andamento no instituto, um deles com o objetivo de medir o quão verde é uma cidade com base em dados do Google Street View.

“Em minha experiência, percebi que há uma dificuldade de comunicação entre pesquisadores de áreas distintas, barreira que dificulta colaborações multidisciplinares. Mas isso precisa ser mudado, pois atualmente é quase impossível fazer uma pesquisa sem estar amparado em dados e na ciência da computação”, disse.

Para Hirata, é preciso que pesquisadores de outras áreas entendam como formular problemas computacionais e, ao mesmo tempo, os estudantes da área de computação sejam treinados a lidar mais diretamente com problemas reais.

O simpósio FAPESP Week France acontece entre os dias 21 e 27 de novembro, graças a uma parceria entre a FAPESP e as universidades de Lyon e de Paris, ambas da França. Leia outras notícias sobre o evento em www.fapesp.br/week2019/france.

Fonte: Portal Cimm - Indústria 4.0