Диплом, курсовая, контрольная работа
Помощь в написании студенческих работ

Заключение. 
Использование методов машинного обучения для извлечения слов-терминов

РефератПомощь в написанииУзнать стоимостьмоей работы

Zhang et al., 2008] Zhang Z., Iria J., Brewster Ch., Ciravegna F. A Comparative Evaluation of Term Recognition Algorithms // In Proceedings of the Sixth International Language Resources and Evaluation (LREC'08). 2008. Pecina et al., 2006] Pecina P., Schlesinger P. Combining association measures for collocation extraction // Annual Meeting of the Association for Computational Linguistics, ACL… Читать ещё >

Заключение. Использование методов машинного обучения для извлечения слов-терминов (реферат, курсовая, диплом, контрольная)

В данной статье было предложено для извлечения однословных терминов использовать три различных типа признаков слов. Помимо наиболее известного способа формирования признаков слов на основе обработки текстовой коллекции предметной области используются также признаки, порожденные на основе выдачи глобальных поисковых машин, а также признак, вычисляемый на основе известных терминологических словосочетаний предметной области.

Кроме того, мы предложили новые признаки, основанные на коллекции текстов предметной области. Это признаки, которые учитывают частотность употребления данного слова в заданном числе наиболее частотных словосочетаний.

Наконец, было выполнено комбинирование всех собранных признаков посредством использования методов машинного обучения, и был получен результат средней точности по упорядочению слов-терминов в упорядоченном списке, который на 40% превышает результат по наиболее часто используемому признаку — tf*idf.

Список литературы

  • 1. [Агеев и др., 2004] Агеев М. С., Кураленок И. Е. Официальные метрики РОМИП'2004 // Российский семинар по Оценке Методов Информационного Поиска (РОМИП 2004). — Пущино, 2004.
  • 2. [Браславский и др., 2006] Браславский П. И., Соколов Е. А. Сравнение четырёх методов автоматического извлечения двусловных терминов из текста // Компьютерная лингвистика и интеллектуальные технологии Труды международной конференции «Диалог 2006». М.: Изд-во РГГУ, 2006.
  • 3. [Добров и др., 2005] Добров Б. В., Лукашевич Н. В., Синицын М. Н., Шапкин В. Н. Разработка лингвистической онтологии по естественным наукам для решения задач информационного поиска. // Труды 7-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL-2005.
  • 4. [Некрестьянов и др., 2008] Некрестьянов И., Некрестьянова М. Особенности организации и проведения РОМИП 2008. Код доступа: http://romip.ru/romip2008/200801_organizers.pdf.
  • 5. [Ahmad et al., 1999] Ahmad K., Gillam L., Tostevin L. University of Surrey participation in Trec8: Weirdness indexing for logical documents extrapolation and retrieval // In the Proceedings of Eigth Text Retrieval Conference (Trec-8). 1999.
  • 6. [Ananiadou, 1994] Ananiadou S. A methodology for automatic term recognition // In the Proceedings of COLING-1994, 1994.
  • 7. [Pecina et al., 2006] Pecina P., Schlesinger P. Combining association measures for collocation extraction // Annual Meeting of the Association for Computational Linguistics, ACL 2006. ACM: 2006.
  • 8. [Zhang et al., 2008] Zhang Z., Iria J., Brewster Ch., Ciravegna F. A Comparative Evaluation of Term Recognition Algorithms // In Proceedings of the Sixth International Language Resources and Evaluation (LREC'08). 2008.
Показать весь текст
Заполнить форму текущей работой