AuthorWrite something about yourself. No need to be fancy, just an overview. ArchivesCategories |
Back to Blog
Vlmc download5/9/2023 ![]() ![]() Existem três abordagens principais utilizadas pelos etiquetadores para rotular sentenças: 1) baseada em regras, que aplica grandes conjuntos de regras codificadas manualmente ou de forma semi-automática para desambiguizar as palavras (GREENE, RUBIN, 1971 KARLSSON et al., 1995 BICK, 2000) 2) probabilística, que, dada uma palavra e um conjunto finito de etiquetas possíveis para essa palavra, as quais podem ser buscadas, por exemplo, em um corpus eletrônico, aplica métodos de aprendizado de máquina para determinar a sequência ótima de etiquetas T, dada uma sequência de palavras W (TOUTANOVA et al., 2003 KEPLER, FINGER, 2006) e 3) híbrida, que surgiu a partir do método de aprendizado baseado em transformação dirigida por erro (transformation-based error-driven learning -TBL) proposto por Brill (1995), a qual combina as duas primeiras abordagens e extrai, automaticamente, uma lista ordenada de regras de corpora anotados para etiquetar palavras de uma sentença (FINGER, 2000 KINOSHITA, SALVADOR, MENEZES, 2007 SANTOS, MILIDIÚ, RENTERÍA, 2008 (NUGUES, 2006, p.
0 Comments
Read More
Leave a Reply. |