Эксперимент 3 (syntax3)
В предыдущих двух экспериментах были рассмотрены девять признаков, определяющих связь между анафорическим выражением и потенциальным антецедентом, которые удалось извлечь из синтаксического анализа текстов. Каждый из этих признаков напрямую связан либо с анафором, либо с антецедентом, либо с отношением этих признаков. В целом, признаки показали хорошие результаты (увеличение F1-score на 11… Читать ещё >
Эксперимент 3 (syntax3) (реферат, курсовая, диплом, контрольная)
В предыдущих двух экспериментах были рассмотрены девять признаков, определяющих связь между анафорическим выражением и потенциальным антецедентом, которые удалось извлечь из синтаксического анализа текстов. Каждый из этих признаков напрямую связан либо с анафором, либо с антецедентом, либо с отношением этих признаков. В целом, признаки показали хорошие результаты (увеличение F1-score на 11 процентов).
Однако из синтаксических отношений между узлами в дереве, можно извлечь дополнительную информацию, кроме той, что уже была извлечена (тип отношения антецедента и анафора с контролирующим узлом). Между корнем и каждым узлом может быть определенная последовательность синтаксических связей, которая способна влиять на возможность анафорической связи между узлами. Оказывать влияние способна не последовательность, а непосредственно тип синтаксической связи, которая может быть характерна пути между антецедентом и корнем.
Таким образом, третий эксперимент предполагает изучение частотности синтаксических связей узлов, расположенных от узла с антецедентом до корня синтаксического дерева для того, чтобы перевести наиболее частотные синтаксические отношения в признаки для классификации. Хотя синтаксические связи антецедента извлекались для всех кандидатов, данные связи будут извлекаться не со всех потенциальных антецедентов, а только с тех, которые входят в кореферентную цепочку, для того, чтобы не предоставлять классификатору много лишней информации.
Таблица с синтаксическими отношениями и их количеством находится в приложении 3. Проанализировать таблицу можно с помощью диаграммы 3, которая представлена ниже.
Из диаграммы видно, что два самых больших блока это «предик» и «1-й компл». Далее, такие синтаксические отношения, как «предл», «соч-союзн», «сочин», «сент-соч», «подч-союзн», «квазиагент» и «обст», образуют следующий кластер отношений (позже второй кластер), согласно их примерной доли среди остальных отношений. Все оставшиеся отношения можно отнести в третий кластер.