Теперь необходимо сделать из этих кластеров признаки для обучени... Заключение

РефератПомощь в написанииУзнать стоимостьмоей работы

В настоящей работе была реализована система распознавания анафорических отношений на основе синтаксически разобранных текстов, которая включает в себя собственный алгоритм для извлечения именных групп. Сначала были реализованы базовые признаки для обучения и был обучен классификатор SVM. Далее с помощью трех экспериментов были введены также и синтаксические признаки в алгоритм классификации… Читать ещё >

Теперь необходимо сделать из этих кластеров признаки для обучени... Заключение (реферат, курсовая, диплом, контрольная)

В работе были использованы следующие синтаксические признаки:

1) расстояние от корня до местоимения (глубина местоимения);
2) тип связи местоимения и слова, контролирующего данное слово;
3) отношение глубины местоимения к глубине предложения;
4) количество узлов с той же глубиной;
5) количество запятых в предложении;
6) расстояние от анафора до антецедента;
7) разница уровней в дереве (уровень антецедента vs уровень местоимения);
8) тип синтаксической связи антецедента со словом, его контролирующим;
9) Есть ли в списке отношений «предик» ?
10) Есть ли в списке отношений «1-компл» ?
11) Есть ли в списке отношений второй кластер синтаксических отношений?
12) Есть ли в списке отношений четвертый кластер синтаксических отношений?

Последние четыре признака проверяют наличие определенных типов отношений на расстоянии от узла с антецедентом и корнем дерева. Первая группа (1−5) — это признаки, относящееся только к анафору. Вторая группа (6−7) — это признаки, связывающие анафора и антецедент. Третья группа (8−12) — это признаки, относящиеся к антецеденту. Первые две группы улучшили алгоритм на 8 и 3 процента соответственно. Последняя группа показала незначительное улучшение результатов работы алгоритмов, потому как распределение типов синтаксических отношений вне анафорических связей совпадает с распределением внутри.

В целом, удалось увеличить показатели работы классификатора на 12 процентов, что говорит о том, что признаки, которые удалось извлечь с помощью синтаксического парсера, имеют значительное влияние на алгоритм работы системы по разрешению анафорических отношений.

Показать весь текст

Заполнить форму текущей работой

Другие работы

Русские постмодернисты и В.В. Набоков: Интертекстуальные связи

Материалом для исследования послужили наиболее заметные тексты самых известных авторов-постмодернистов, либо уже вошедших в историю русской литературы, либо добившихся в последнее десятилетие большой популярности, признания читателей и критиков. В случае Андрея Синявского были выбраны не политически заостренные повести «Любимов» и «Суд идет», а наиболее, с нашей точки зрения, интересные…

Диссертация