Формирование технологии и прикладные системы
Формирование промышленной технологии извлечения информации из мультиязычных коллекций документов — закономерная стадия развития проекта OntosMiner, соответствующие работы выполнялись в рамках Госконтракта ЗАО «Авикомп Сервисез» с Федеральным Агентством по Науке и Инновациям РФ в 2007;2009 г. г. ОКР «Разработка технологий извлечения данных и анализа текстовых информационных ресурсов на различных… Читать ещё >
Формирование технологии и прикладные системы (реферат, курсовая, диплом, контрольная)
На втором этапе (2005;2008 г. г.) проект OntosMiner развивался в следующих направлениях:
Формирование промышленной технологии извлечения информации из мультиязычных коллекций документов.
Расширение состава моделей предметных областей и спецификация соответствующих предметных онтологий с использованием стандартов W3C.
Развитие методов обработки ЕЯ-текстов, формирование методологии извлечения информации и методов интеграции полученных результатов в базах знаний, построенных на основе RDF-хранилищ.
Разработка прикладных систем в рамках государственных контрактов и инициативных проектов.
Промышленная технология обработки ЕЯ-информации
Формирование промышленной технологии извлечения информации из мультиязычных коллекций документов — закономерная стадия развития проекта OntosMiner, соответствующие работы выполнялись в рамках Госконтракта ЗАО «Авикомп Сервисез» с Федеральным Агентством по Науке и Инновациям РФ в 2007;2009 г. г. ОКР «Разработка технологий извлечения данных и анализа текстовых информационных ресурсов на различных естественных языках для информационно-аналитических систем нового поколения в глобальных и локальных информационных сетях».
Детальное обсуждение этого масштабного проекта с ФАНИ выходит за рамки настоящей работы. Поэтому здесь отметим лишь следующее: успешная его реализация позволила развернуть на базе РНЦ «Курчатовский институт» программно-технический комплекс из более чем 40 физических серверов и дисковых систем хранения, функционирующих в среде распределенных GRID-вычислений, который позволяет обрабатывать до 15 000 док/час при объёме документа до 10К, поддерживает формирование БЗ для таких предметных областей, как политика и бизнес, нанотехнологии, медицина и др., хранит не менее 10млн. документов для одной предметной области с объемами БЗ не менее 1млрд. фактов БЗ, обеспечивает режим работы 24×7×365 и поддерживает до 10 000 конкурентных сессий пользователей.