Assisti uma palestra do WPCCG (Workshop de Pesquisa em Computação dos Campos Gerais), apresentada quase um mês atrás, mas que consegui assistir apenas agora. O tema foi processamento de linguagem natural, com a apresentação do DANTEStocks (base de tweets de trading) e aplicação de técnicas de NPL:
https://www.youtube.com/watch?v=Fws8fR8OQoI. Importante sempre lembrar que NLP é mais do que extrair termos e lematizar: envolve também, e principalmente, análise sintático (morfossintática). Nada impede de usar técnicas de aprendizagem de máquina nesse contexto, mas as características e, consequentemente, os conjuntos de dados devem conter características morfossintáticas. Infelizmente, muitos trabalhos de “NLP” em Engenharia de Software ignoram essa parte.