Диплом, курсовая, контрольная работа
Помощь в написании студенческих работ

Формирование технологии и прикладные системы

РефератПомощь в написанииУзнать стоимостьмоей работы

Формирование промышленной технологии извлечения информации из мультиязычных коллекций документов — закономерная стадия развития проекта OntosMiner, соответствующие работы выполнялись в рамках Госконтракта ЗАО «Авикомп Сервисез» с Федеральным Агентством по Науке и Инновациям РФ в 2007;2009 г. г. ОКР «Разработка технологий извлечения данных и анализа текстовых информационных ресурсов на различных… Читать ещё >

Формирование технологии и прикладные системы (реферат, курсовая, диплом, контрольная)

На втором этапе (2005;2008 г. г.) проект OntosMiner развивался в следующих направлениях:

Формирование промышленной технологии извлечения информации из мультиязычных коллекций документов.

Расширение состава моделей предметных областей и спецификация соответствующих предметных онтологий с использованием стандартов W3C.

Развитие методов обработки ЕЯ-текстов, формирование методологии извлечения информации и методов интеграции полученных результатов в базах знаний, построенных на основе RDF-хранилищ.

Разработка прикладных систем в рамках государственных контрактов и инициативных проектов.

Промышленная технология обработки ЕЯ-информации

Формирование промышленной технологии извлечения информации из мультиязычных коллекций документов — закономерная стадия развития проекта OntosMiner, соответствующие работы выполнялись в рамках Госконтракта ЗАО «Авикомп Сервисез» с Федеральным Агентством по Науке и Инновациям РФ в 2007;2009 г. г. ОКР «Разработка технологий извлечения данных и анализа текстовых информационных ресурсов на различных естественных языках для информационно-аналитических систем нового поколения в глобальных и локальных информационных сетях».

Детальное обсуждение этого масштабного проекта с ФАНИ выходит за рамки настоящей работы. Поэтому здесь отметим лишь следующее: успешная его реализация позволила развернуть на базе РНЦ «Курчатовский институт» программно-технический комплекс из более чем 40 физических серверов и дисковых систем хранения, функционирующих в среде распределенных GRID-вычислений, который позволяет обрабатывать до 15 000 док/час при объёме документа до 10К, поддерживает формирование БЗ для таких предметных областей, как политика и бизнес, нанотехнологии, медицина и др., хранит не менее 10млн. документов для одной предметной области с объемами БЗ не менее 1млрд. фактов БЗ, обеспечивает режим работы 24×7×365 и поддерживает до 10 000 конкурентных сессий пользователей.

Показать весь текст
Заполнить форму текущей работой