Matthias Knorr IBM

Ele ajuda os computadores a entenderem melhor as linguagens da internet

Matthias Knorr é alemão, mas está em Portugal desde 2006. Veio para Lisboa terminar o mestrado em Lógica Computacional na Universidade Nova de Lisboa (NOVA). E por cá foi ficando.

“Cheguei aqui, fiz uma parte do meu programa do mestrado. Gostei da investigação que cá se fazia e ainda gosto do que se está a fazer. Gostei do país e das pessoas. Resolvi, perante a opção de fazer doutoramento, ficar”.




Além de doutorado em Engenharia Informática, agora é investigador e professor convidado na NOVA LINCS. Ao currículo junta também o prémio científico IBM relativo ao ano de 2015 e que foi atribuído de forma oficial esta semana.

Foi a gala de cerimónia que proporcionou a nossa conversa com Matthias Knorr. O investigador está a criar um sistema de inteligência artificial que tem por base um melhor entendimento das linguagens da web semântica. O trabalho de Matthias destaca-se pelo facto de conseguir combinar de forma mais eficiente diferentes linguagens e regras.

Isto significa que um mesmo sistema será capaz de reconhecer informações que têm por base fontes distintas e que estão trabalhadas em diferentes semânticas da web. O projeto, conhecido como NoHR, está disponível online para os que quiserem explorá-lo melhor.

“O sistema pode ser resistente a inconsistências, consegue encontrar as inconsistências, apontá-las e não se deixa afetar nas conclusões”, explicou à audiência o investigador alemão antes de receber o prémio.

Além do projeto mais académico, o sistema de inteligência artificial também já está a ser testado no mercado para provar que existem cenários onde um melhor entendimento e processamento da informação trazem vantagens claras na realização de algumas tarefas.

Mas deixemos que seja Matthias Knorr a explicar isso.

Para quem não conhece, em que é que consiste este trabalho de investigação?

No fundo enquadra-se na inteligência artificial, mais concretamente na representação de conhecimento. Na web temos muita informação disponível e para poder usá-la de forma mais integrada, queremos analisar as linguagens e depois poder raciocinar sobre o que lá está.

Por exemplo, quando queremos saber se um barco que entra num porto é para inspecionar ou não, temos que ter em conta informações como de onde vem, o que está a transportar, informação sobre a tripulação, informação sobre a legislação em vigor. Depois surge um sistema que integra toda esta informação e surge uma recomendação.

Nestes trabalhos relacionados com a web semântica quais acabam por ser as grandes dificuldades?

O problema que nós em particular enfrentamos, apesar da estandardização em vigor e esses standards que nós usamos já existirem. Mas no fundo foram desenvolvidos por comunidades quase diferentes e disjuntas.

Mas mesmo assim há aplicações, como o caso que apresentei, em que nós precisamos das duas linguagens [Regras e Ontologias]. Situações em que queremos usar as ontologias e as regras ao mesmo tempo. Usufruindo uma da outra quando queremos raciocinar sobre essas informações.

Os princípios que eles usam em termos científicos, lógicos e matemáticos são mesmo muito diferentes. Partem de ideias completamente diferentes que se juntam num sistema de ideia – ‘vamos pegar um pouco dessa, um pouco do outro e ver o que dá’. Normalmente depois não colam, vai passar ao lado.

No fundo a dificuldade resulta como integrar os elementos por forma a usufruir mais da informação contida nas duas linguagens.

Matthias Knorr IBM
Matthias Knorr disse ter sido uma grande honra ter recebido o prémio de inovação da IBM. “É o reconhecimento do trabalho científico e um incentivo para trabalhos futuros”. #Crédito: Future Behind

Com os resultados que conseguiram com esta investigação, em que áreas poderão ser explorados? Será mais no âmbito académico, no âmbito empresarial? Poderemos ver em alguns cenários de consumo?

Acho que de todas maneiras. Obviamente no início o desenvolvimento surgiu no âmbito científico-académico, mas o exemplo que referi da inspeção dos barcos é um caso real. Existem membros da nossa equipa a trabalhar nisso. Não é em Portugal, por questões de segurança não posso dizer em que país, mas está a ser usado.

Isso é um exemplo real. Mas também já aqui foi muito referido, outra área onde ainda não está a ser aplicado o nosso trabalho, mas onde nós prevemos que há grande possibilidade, é na área da saúde.

Por exemplo, nestas linguagens existem grandes ontologias biomédicas que no fundo são usadas para representar todas as doenças, a constituição do corpo humano, os tratamentos, os medicamentos.

Há uma que é a Snowmed City que é uma iniciativa internacional e esta ontologia é muito grande, acho que é a maior em uso hoje em dia, é usada em mais de 30 países na área da saúde, tanto no sector público, como privado.

Já é usada em diagnósticos, na gestão dos hospitais. No fundo o nosso trabalho pode contribuir, por exemplo, quando queremos usar isso em combinação com ética de medicina ou procedimentos médicos que requerem mais esta ideia de se ‘alguma coisa acontece, então depois quero derivar’.

Tem-se falado muito de inteligência artificial. Na opinião do Matthias em que estado estamos atualmente ao nível do desenvolvimento?

Obviamente que existem muitas referências nos meios de comunicação, também pelo sensacionalismo dos filmes, da ideia que daqui a poucos anos vamos ser dominados.

Acho que ainda falta um pouco, há muitas coisas que estão a acontecer. Já se consegue fazer muita coisa, muito para além do que se esperava no fim da década de 60, após a primeira euforia. As pessoas disseram ‘afinal isso não vai funcionar tão bem como queríamos’.

Hoje já é possível fazer muito. Não estamos no limite. Como nota queria ainda apontar, de forma menos positiva, é que existe agora toda uma iniciativa à volta de limitar estas tecnologias no sector militar, onde é preciso ter, parece-me, algum cuidado para que depois de forma automática não se utilizem as máquinas – quem é responsável depois no fim? São questões muito difíceis de responder.

Parece que há um objetivo que é tentar fazer com que um robô fale e compreenda como um humano. Estamos assim tão longe?

Uma das coisas que também escrevi no documento é que alguns dos sucessos que foram desenvolvidos, como o IBM Watson, ou talvez mais cedo, outro sucesso da IBM foi o Deep Blue to xadrez, funcionam muito bem porque no fundo foram desenhados para um problema em concreto. O Deep Blue sabia jogar xadrez maravilhosamente, mas se lhe colocassem à frente um jogo de damas nada fazia.

Vê-se que o IBM Watson também tinha um foco concreto, mas agora a tecnologia vai ser usada de forma mais abrangente. Precisamos primeiro de treinar para essa utilização, sem intervenção humana na sua direção.

Aliás, para passar o teste Turing ainda falta um bocadinho, na minha opinião.

Quais os próximos passos na investigação? Como vai evoluir o projeto e quais são os vossos objetivos?

No imediato o que nós queremos fazer, por um lado, como já tinha referido, é ver se conseguimos enquadrá-lo em mais aplicações. Do lado da medicina por exemplo.

Mas também, no fundo, estender ainda um pouco mais o que é que a ferramenta pode incorporar. O que também foi referido na apresentação, a questão de ter fluxos de dados, o nosso sistema funciona e funciona bem, mas podemos ter situações em que há milhões de dados sempre a serem gerados.

Isso requer ainda mais do sistema para que seja capaz de atualizar-se perante isso.