Um modelo de aprendizado profundo de conhecimento de senso comum para tarefas de processamento de linguagem natural [Digital]
Dissertação
Português
681.3.02:007.52
Fortaleza, 2022.
88f.
Conhecimento de senso comum são informações que estão presentes no dia a dia das
pessoas, são conhecimentos básicos sobre o mundo e normalmente não estão explícitos na
comunicação ou escrita entre as pessoas. No contexto da área de Inteligência Artificial
(IA), este conhecimento torna-se importante... Ver mais Conhecimento de senso comum são informações que estão presentes no dia a dia das
pessoas, são conhecimentos básicos sobre o mundo e normalmente não estão explícitos na
comunicação ou escrita entre as pessoas. No contexto da área de Inteligência Artificial
(IA), este conhecimento torna-se importante para sistemas que envolvem entendimento de
linguagem natural (NLU), pois podem fornecer à máquina informações básicas que estão
subentendidas no texto. O conhecimento de senso comum pode ser recuperado de bases
de conhecimento (CSKB), por exemplo, a ConceptNet. Devido à grande quantidade de
conhecimento presente nestas bases, é importante que a apreensão e integração destas
informações seja feita de forma eficiente, pois nem todo conhecimento recuperado de uma
base será útil para melhorar o desempenho de uma Tarefa-Alvo de NLU.
Neste trabalho, é proposto um modelo genérico de aprendizado, chamado DeepCS, para
integrar conhecimento de senso comum a diversas tarefas de entendimento de linguagem
natural. O DeepCS tem como objetivo aprender, a partir de um conjunto de conhecimentos
de senso comum, o conhecimento que melhor auxilia na realização de uma determinada
tarefa-alvo. Além disso, o modelo aqui proposto deve ser generalizado de forma que possa
ser acoplado em diferentes tarefas de Processamento de Linguagem Natural (PLN).
O módulo DeepCS foi experimentado nas tarefas-alvo de Sistema de Diálogo, utilizando
um corpus em português e outro em inglês, e para a tarefa de Classificação de Postura,
com corpus em inglês. Os resultados indiciam melhora no desempenho das tarefas, quando
do uso do DeepCS para língua portuguesa e este modelo pode ser usado em tarefas e
conjuntos de dados diversos e distintos.
Palavras-chave: Conhecimento de senso comum, Entendimento de Linguagem Natural,
Sistema de Diálogo, Classificação de Texto. Ver menos
pessoas, são conhecimentos básicos sobre o mundo e normalmente não estão explícitos na
comunicação ou escrita entre as pessoas. No contexto da área de Inteligência Artificial
(IA), este conhecimento torna-se importante... Ver mais Conhecimento de senso comum são informações que estão presentes no dia a dia das
pessoas, são conhecimentos básicos sobre o mundo e normalmente não estão explícitos na
comunicação ou escrita entre as pessoas. No contexto da área de Inteligência Artificial
(IA), este conhecimento torna-se importante para sistemas que envolvem entendimento de
linguagem natural (NLU), pois podem fornecer à máquina informações básicas que estão
subentendidas no texto. O conhecimento de senso comum pode ser recuperado de bases
de conhecimento (CSKB), por exemplo, a ConceptNet. Devido à grande quantidade de
conhecimento presente nestas bases, é importante que a apreensão e integração destas
informações seja feita de forma eficiente, pois nem todo conhecimento recuperado de uma
base será útil para melhorar o desempenho de uma Tarefa-Alvo de NLU.
Neste trabalho, é proposto um modelo genérico de aprendizado, chamado DeepCS, para
integrar conhecimento de senso comum a diversas tarefas de entendimento de linguagem
natural. O DeepCS tem como objetivo aprender, a partir de um conjunto de conhecimentos
de senso comum, o conhecimento que melhor auxilia na realização de uma determinada
tarefa-alvo. Além disso, o modelo aqui proposto deve ser generalizado de forma que possa
ser acoplado em diferentes tarefas de Processamento de Linguagem Natural (PLN).
O módulo DeepCS foi experimentado nas tarefas-alvo de Sistema de Diálogo, utilizando
um corpus em português e outro em inglês, e para a tarefa de Classificação de Postura,
com corpus em inglês. Os resultados indiciam melhora no desempenho das tarefas, quando
do uso do DeepCS para língua portuguesa e este modelo pode ser usado em tarefas e
conjuntos de dados diversos e distintos.
Palavras-chave: Conhecimento de senso comum, Entendimento de Linguagem Natural,
Sistema de Diálogo, Classificação de Texto. Ver menos
Common sense knowledge is information that is present in people¿s daily lives, and is
basic knowledge about the world and is usually not explicit in communication or writing
between people. In the context of the area of Artificial Intelligence (AI), this knowledge
becomes important for systems that... Ver mais Common sense knowledge is information that is present in people¿s daily lives, and is
basic knowledge about the world and is usually not explicit in communication or writing
between people. In the context of the area of Artificial Intelligence (AI), this knowledge
becomes important for systems that involve Natural Language Understanding (NLU), as
they can provide the machine with basic information that is implied in the text. Common
sense knowledge can be retrieved from knowledge bases (CSKB), for example ConceptNet.
Due to the large amount of knowledge present in these bases, it is important that the
acquisition and integration of this information is done efficiently, as not all knowledge
retrieved from a base will be useful to improve the performance of an NLU Target Task.
In this work, a generic learning model, called DeepCS, is proposed to integrate common
sense knowledge to several NLU tasks. DeepCS aims to learn, from a set of common sense
knowledge, the knowledge that best assists in performing a given target-task. Furthermore,
the model, proposed here, must be generalized so that it can be coupled in different Natural
Language Processing (NLP) tasks.
The DeepCS module was tested in the Dialogue System target-tasks, using a corpus in
Portuguese and another in English, and for the Stance Classification task, with a corpus in
English. The results indicate an improvement in tasks performance, when using DeepCS,
for Portuguese and this model can be used in different tasks and diversified datasets.
Keywords: Common Sense knowledge, Natural Language Understanding, Dialogue System, Text Classification Ver menos
basic knowledge about the world and is usually not explicit in communication or writing
between people. In the context of the area of Artificial Intelligence (AI), this knowledge
becomes important for systems that... Ver mais Common sense knowledge is information that is present in people¿s daily lives, and is
basic knowledge about the world and is usually not explicit in communication or writing
between people. In the context of the area of Artificial Intelligence (AI), this knowledge
becomes important for systems that involve Natural Language Understanding (NLU), as
they can provide the machine with basic information that is implied in the text. Common
sense knowledge can be retrieved from knowledge bases (CSKB), for example ConceptNet.
Due to the large amount of knowledge present in these bases, it is important that the
acquisition and integration of this information is done efficiently, as not all knowledge
retrieved from a base will be useful to improve the performance of an NLU Target Task.
In this work, a generic learning model, called DeepCS, is proposed to integrate common
sense knowledge to several NLU tasks. DeepCS aims to learn, from a set of common sense
knowledge, the knowledge that best assists in performing a given target-task. Furthermore,
the model, proposed here, must be generalized so that it can be coupled in different Natural
Language Processing (NLP) tasks.
The DeepCS module was tested in the Dialogue System target-tasks, using a corpus in
Portuguese and another in English, and for the Stance Classification task, with a corpus in
English. The results indicate an improvement in tasks performance, when using DeepCS,
for Portuguese and this model can be used in different tasks and diversified datasets.
Keywords: Common Sense knowledge, Natural Language Understanding, Dialogue System, Text Classification Ver menos
Pinheiro, Vladia Celia Monteiro
Orientador
Furtado, João José Vasco Peixoto
Banca examinadora
Carvalho, Aline Marins Paes
Banca examinadora
Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
Dissertação (mestrado)