Отправная точка.
Лингвистическая онтология по естественным наукам и технологиям: основные принципы разработки и текущее состояние
Общественно-политический тезаурус используется как лингвистический ресурс в таких задачах информационного поиска как автоматическое концептуальное индексирование, визуализация результатов поиска, автоматическая рубрикация документов, автоматическое аннотирование. лингвистическая онтология информационный поисковый Для реализации обсуждаемого проекта наиболее важны созданные ранее технологии… Читать ещё >
Отправная точка. Лингвистическая онтология по естественным наукам и технологиям: основные принципы разработки и текущее состояние (реферат, курсовая, диплом, контрольная)
Авторы проекта ранее [Лукашевич и др., 1996] создали информационно-поисковый тезаурус для автоматического индексирования текстов в общественно-политической области (далее — Общественно-политический тезаурус), включающих более 32 тысяч понятий, 79 тысяч русскоязычных и 80 тысяч англоязычных текстовых входов.
Представляя собой по форме информационно-поисковый тезаурус, Общественно-политический тезаурус построен на основе формальных онтологических принципов. Это позволяет нам позиционировать его как лингвистическую онтологию для автоматической обработки документов в области общественно-политических отношений.
Создан [Добров и др., 1996], [Лукашевич и др., 1996] не только лингвистический ресурс, но и комплекс математического обеспечения (моделей, алгоритмов) и программного обеспечения (утилит, информационных систем). То есть создан полный технологический цикл от набора терминологии до реализации обеспечения функционирования информационно-аналитических систем различного назначения.
Общественно-политический тезаурус используется как лингвистический ресурс в таких задачах информационного поиска как автоматическое концептуальное индексирование, визуализация результатов поиска, автоматическая рубрикация документов, автоматическое аннотирование. лингвистическая онтология информационный поисковый Для реализации обсуждаемого проекта наиболее важны созданные ранее технологии быстрого автоматизированного формирования терминологической базы по текстам, а также возможность использования уже существующего ресурса большого объема.
В общественно-политических текстах понятия общественных наук встречаются значительно чаще, чем понятия естественных наук, что находит свое отражение в составе Общественно-политического тезауруса. Тем не менее сфера естественных наук затрагивается в связи с обсуждением вопросов промышленности, нефтедобычи, медицины и т. п., поэтому соответствующая научная лексика и терминология неплохо представлена в тезаурусе, что позволило поставить задачу ее использования при создании нового ресурса.