Диплом, курсовая, контрольная работа
Помощь в написании студенческих работ

Теперь необходимо сделать из этих кластеров признаки для обучени... Заключение

РефератПомощь в написанииУзнать стоимостьмоей работы

В настоящей работе была реализована система распознавания анафорических отношений на основе синтаксически разобранных текстов, которая включает в себя собственный алгоритм для извлечения именных групп. Сначала были реализованы базовые признаки для обучения и был обучен классификатор SVM. Далее с помощью трех экспериментов были введены также и синтаксические признаки в алгоритм классификации… Читать ещё >

Теперь необходимо сделать из этих кластеров признаки для обучени... Заключение (реферат, курсовая, диплом, контрольная)

В настоящей работе была реализована система распознавания анафорических отношений на основе синтаксически разобранных текстов, которая включает в себя собственный алгоритм для извлечения именных групп. Сначала были реализованы базовые признаки для обучения и был обучен классификатор SVM. Далее с помощью трех экспериментов были введены также и синтаксические признаки в алгоритм классификации.

В работе были использованы следующие синтаксические признаки:

  • 1) расстояние от корня до местоимения (глубина местоимения);
  • 2) тип связи местоимения и слова, контролирующего данное слово;
  • 3) отношение глубины местоимения к глубине предложения;
  • 4) количество узлов с той же глубиной;
  • 5) количество запятых в предложении;
  • 6) расстояние от анафора до антецедента;
  • 7) разница уровней в дереве (уровень антецедента vs уровень местоимения);
  • 8) тип синтаксической связи антецедента со словом, его контролирующим;
  • 9) Есть ли в списке отношений «предик» ?
  • 10) Есть ли в списке отношений «1-компл» ?
  • 11) Есть ли в списке отношений второй кластер синтаксических отношений?
  • 12) Есть ли в списке отношений четвертый кластер синтаксических отношений?

Последние четыре признака проверяют наличие определенных типов отношений на расстоянии от узла с антецедентом и корнем дерева. Первая группа (1−5) — это признаки, относящееся только к анафору. Вторая группа (6−7) — это признаки, связывающие анафора и антецедент. Третья группа (8−12) — это признаки, относящиеся к антецеденту. Первые две группы улучшили алгоритм на 8 и 3 процента соответственно. Последняя группа показала незначительное улучшение результатов работы алгоритмов, потому как распределение типов синтаксических отношений вне анафорических связей совпадает с распределением внутри.

В целом, удалось увеличить показатели работы классификатора на 12 процентов, что говорит о том, что признаки, которые удалось извлечь с помощью синтаксического парсера, имеют значительное влияние на алгоритм работы системы по разрешению анафорических отношений.

Показать весь текст
Заполнить форму текущей работой