Definição de Desambiguação em Estudos de Linguagem

click fraud protection

No linguística, desambiguação é o processo de determinar qual sentido de um palavra está sendo usado em um determinado contexto. Também conhecido como desambiguação lexical.

Em linguística computacional, este processo discriminativo é chamado desambiguação de sentido de palavra (WSD).

Exemplos e Observações

"Acontece que nosso comunicação, em diferente línguas da mesma forma, permite que a mesma forma de palavra seja usada para significar coisas diferentes em transações comunicativas individuais. A conseqüência é que se tem que descobrir, em uma transação particular, o significado pretendido de uma determinada palavra entre seus sentidos potencialmente associados. Enquanto o ambigüidades decorrentes de tais associações múltiplas de significado de forma estão no lexical nível, eles muitas vezes têm que ser resolvidos por meio de um contexto mais amplo do discurso incorporar a palavra. Conseqüentemente, os diferentes sentidos da palavra "serviço" só poderiam ser diferenciados se alguém pudesse olhar além da própria palavra, como em contrastar "o serviço do jogador em Wimbledon 'com' serviço do garçom no Sheraton. ' Este processo de identificar significados de palavras em um discurso é geralmente conhecido como

instagram viewer
sentido das palavras desambiguação (WSD). "(Oi Yee Kwong, Novas perspectivas em estratégias computacionais e cognitivas para a desambiguação do sentido das palavras. Springer, 2013)

Desambiguação Lexical e Desambiguação Word-Sense (WSD)

"Lexical desambiguação em sua definição mais ampla, nada mais é do que determinar o significado de cada palavra no contexto, o que parece ser um processo amplamente inconsciente nas pessoas. Como um problema computacional, é frequentemente descrito como 'AI-completo', ou seja, um problema cuja solução pressupõe uma solução completa linguagem natural compreensão ou raciocínio de senso comum (Ide e Véronis 1998).

"No campo da linguística computacional, o problema é geralmente chamado de desambiguação do sentido da palavra (WSD) e é definido como o problema de determinar computacionalmente qual 'sentido' de uma palavra é ativado pelo uso da palavra em um determinado contexto. WSD é essencialmente uma tarefa de classificação: os sentidos das palavras são as classes, o contexto fornece o evidência, e cada ocorrência de uma palavra é atribuída a uma ou mais de suas classes possíveis com base no evidências. Esta é a caracterização tradicional e comum do WSD que o vê como um processo explícito de desambiguação com respeito a um inventário fixo de sentidos de palavras. As palavras são consideradas como tendo um conjunto finito e discreto de sentidos de um dicionário, uma base de conhecimento lexical ou uma ontologia (neste último, os sentidos correspondem a conceitos que uma palavra lexicaliza). Também podem ser usados ​​inventários de aplicações específicas. Por exemplo, em uma configuração de tradução automática (MT), pode-se tratar as traduções de palavras como sentidos de palavras, um abordagem que está se tornando cada vez mais viável devido à disponibilidade de grandes paralelo corpora que podem servir como dados de treinamento. O inventário fixo do WSD tradicional reduz a complexidade do problema, mas existem campos alternativos.. .. "(Eneko Agirre e Philip Edmonds," Introdução. " Desambiguação do Word Sense: Algoritmos e Aplicativos. Springer, 2007)

Homonímia e Desambiguação

"Lexical desambiguação é bem adequado especialmente para casos de homonímia, por exemplo, uma ocorrência de baixo deve ser mapeado em qualquer um dos itens lexicais baixo1 ou baixo2, dependendo do significado pretendido.

“A desambiguação lexical implica uma escolha cognitiva e é uma tarefa que inibe os processos de compreensão. Deve ser diferenciado de processos que levam a uma diferenciação dos sentidos das palavras. A primeira tarefa é realizada de forma bastante confiável também sem muitas informações contextuais, enquanto a última não é (cf. Veronis 1998, 2001). Também foi demonstrado que palavras homônimas, que requerem desambiguação, tornam o acesso lexical lento, enquanto palavras polissêmicas, que ativam uma multiplicidade de sentidos de palavras, aceleram o acesso ao léxico (Rodd e.a. 2002).

"No entanto, tanto a modificação produtiva dos valores semânticos quanto a escolha direta entre itens lexicamente diferentes em comum, eles exigem informações não lexicais adicionais. "(Peter Bosch," Productivity, Polysemy, and Predicate Indexicality. " Lógica, Linguagem e Computação: 6º Simpósio Internacional de Tbilisi em Lógica, Linguagem e Computação, ed. por Balder D. ten Cate e Henk W. Zeevat. Springer, 2007)

Desambiguação da categoria lexical e o princípio da probabilidade

"Corley e Crocker (2000) apresentam um modelo de ampla cobertura de categoria lexicaldesambiguação baseado no Princípio de Probabilidade. Especificamente, eles sugerem que, para uma frase que consiste em palavras C0... Cn, o processador de frase adota o mais provável parte do discurso seqüência t0... tn. Mais especificamente, seu modelo explora duas probabilidades simples: (eu) a probabilidade condicional da palavra Ceu dada uma parte específica do discurso teu, e (ii) a probabilidade de teu dada a parte anterior do discurso ti-1. À medida que cada palavra da frase é encontrada, o sistema atribui a classe gramatical teu, o que maximiza o produto dessas duas probabilidades. Este modelo capitaliza a percepção de que muitos sintático ambiguidades têm uma base lexical (MacDonald et al., 1994), como em (3):

(3) Os preços / marcas do armazém são mais baratos do que os restantes.

"Essas frases são temporariamente ambíguas entre uma leitura em que preços ou faz é o verbo principal ou parte de um nome composto. Depois de ser treinado em um grande corpus, o modelo prevê a classe gramatical mais provável para preços, explicando corretamente o fato de que as pessoas entendem preço como um substantivo, mas faz como um verbo (ver Crocker & Corley, 2002, e as referências aí citadas). O modelo não só leva em conta uma gama de preferências de desambiguação enraizadas na categoria lexical ambigüidade, também explica por que, em geral, as pessoas são altamente precisas na resolução de tais ambigüidades. " (Matthew W. Crocker, "Rational Models of Comprehension: Addressing the Performance Paradox." Psicolinguística do século XXI: quatro pedras angulares, ed. por Anne Cutler. Lawrence Erlbaum, 2005)

instagram story viewer