Диплом, курсовая, контрольная работа
Помощь в написании студенческих работ

Разработка и исследование формализованных представлений и семантических схем предложений текстов научно-технического стиля для повышения эффективности информационного поиска

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Глобальная сеть Интернет и компьютерные технологии представляют сегодня один из важнейших факторов научно-технического прогресса. Его отличительным признаком является целостно сформированное и интенсивно расширяющееся информационное пространство, которое порождает совершенно новые потребности и требования к технологиям обработки, представления и поиска информации. В настоящее время все… Читать ещё >

Содержание

  • 1. Анализ предметной области
    • 1. 1. Смысл, язык и семантическая интерпретация текстов
      • 1. 1. 1. Феномен и особенности языка
      • 1. 1. 2. Анализ грамматических особенностей языка
      • 1. 1. 3. Характерные особенности текстов научно-технического стиля
      • 1. 1. 4. Определение функционала смысловыразительности предложения
    • 1. 2. Анализ смысловыразительности языковых средств лингвистического обеспечения информационного поиска
      • 1. 2. 1. Обработка текстов. Терминология и основные понятия
      • 1. 2. 2. Обзор методов информационного поиска и его лингвистического обеспечения
      • 1. 2. 3. Оценка смысловыразительности языковых средств информационного поиска
    • 1. 3. Выводы
  • 2. Анализ предложений текстов научно-технического стиля
    • 2. 1. Словосочетание, предложение и связи их элементов
    • 2. 2. Подчинительная связь и ее представления
      • 2. 2. 1. Отношение непосредственного подчинения и его нотации
      • 2. 2. 2. Проективное отношение непосредственного подчинения
    • 2. 3. Представление предложений в виде системы составляющих
      • 2. 3. 1. Отрезочное представление предложения
      • 2. 3. 2. Связь системы составляющих и проективного отношения непосредственного подчинения
    • 2. 4. Выводы
  • 3. Формальные представления предложений текстов научно-технического стиля
    • 3. 1. Разработка формализованного словно-зависимого представления предложения
      • 3. 1. 1. Цепочка зависимостей, ее свойства и характеристические множества
      • 3. 1. 2. Характеристические словные множества, размеченное отношение непосредственного подчинения и их использование для построения цепочек зависимостей
    • 3. 2. Разработка формализованного словно-шкального представления предложения
      • 3. 2. 1. Словная шкала, операции над отрезками, разбиения
      • 3. 2. 2. Система разбиения словной шкалы, ее свойства и стратегии построения
      • 3. 2. 3. Дерево системы разбиения
      • 3. 2. 4. Скобочная форма системы разбиения
      • 3. 2. 5. Расщепление отрезка по главному слову, нормальная системы разбиений
      • 3. 2. 6. ¿-нормальная и Я-нормальные системы разбиения
    • 3. 3. Выводы
  • 4. Семантические схемы предложений на основе функционала смысловыразительности
    • 4. 1. Контекстное уточнение смысла слов в связанном текстовом фрагменте
    • 4. 2. Использование нотации обратной польской записи для контекстного уточнения смыслов фрагментов текстов
    • 4. 3. Процедуры и алгоритмы вычисления функционала смысловыразительности в нотации обратной польской записи
    • 4. 4. Семантическая схема функционала смысловыразительности
    • 4. 5. Выводы
  • Экспериментальное исследование
    • 5. 1. Состав программного комплекса и схема экспериментов
    • 5. 2. Сравнение семантических схем на близость
      • 5. 2. 1. Общая структура критерия сравнения на близость
      • 5. 2. 2. Базовый критерий сравнения близости
      • 5. 2. 3. Семантический критерий сравнения на близость
    • 5. 3. Решающие правила, формирование ВЫДАЧИ
    • 5. 4. Результаты экспериментов, анализ, сравнение
      • 5. 4. 1. Начальные условия и параметры
      • 5. 4. 2. Эксперименты по базовому критерию близости ф6аза
      • 5. 4. 3. Эксперименты по семантическому критерию близости фсеМантик
    • 5. 5. Выводы

Разработка и исследование формализованных представлений и семантических схем предложений текстов научно-технического стиля для повышения эффективности информационного поиска (реферат, курсовая, диплом, контрольная)

Глобальная сеть Интернет и компьютерные технологии представляют сегодня один из важнейших факторов научно-технического прогресса. Его отличительным признаком является целостно сформированное и интенсивно расширяющееся информационное пространство, которое порождает совершенно новые потребности и требования к технологиям обработки, представления и поиска информации. В настоящее время все публикуемые бумажные документы оцифровываются и размещаются в электронных хранилищах различного назначения, активно используются многочисленные электронные библиотеки и электронные архивы, поисковые машины и сервисы. По некоторым оценкам объем глобальных информационных ресурсов ежегодно увеличивается экспоненциально [8].

На многочисленных конференциях и форумах ведется активное обсуждение путей повышения эффективности работы с большими объемами разнородной информации. В этом круге вопросов выделяют и ставят на особое место обработку текстовой информации и связанные с ней прикладные задачи. Так, текстовая обработка напрямую связана с информационным поиском и классификацией документов, автореферированием, автоаннотированием, компьютерным переводом, диалоговыми системами и пр., а сама она представляет собой важный раздел области искусственного интеллекта. Следует выделить ряд работ, посвященных разработке методов решения различных задач, непосредственно связанных с текстовой обработкой.

Подходы и модели формализации семантики и ее компьютерной обработки, а также теоретические работы в области естественных языков представлены в трудах Landauer Т., Foltz P., Laham D. [45]- Salton G., Allan J., Singhai A. [55]- Баженовой Е. А. [74, 75]- Большаковой Е. И. [78, 79]- Васильевой Н. Э. [80]- Гав-риловой Т.А. [116]- Гладкого A.B. [117]- Ермакова А. Е. [123, 125,126]- Ефимен-ко И.В. [127]- Леонтиевой А., Кагирова И. [142]- Кучуганова В. Н. [138, 139, 140]- [143]- Мельчука И. А. [145]- Митрофановой О. Д. [146]- Найхановой Л. В., Евдокимовой И. С. [147], Налимова В. В. [148]- Николаева A.M. [152]- Рубашкина В. Ш. [157]- Рыбакова Ф. И., Руднева Е. А., Петухова В. А. [158]- Рябцева Н. К. [159]- Севбо И. П. [161, 162]- Тестелец Я. Г. [167]- Харламова A.A., Ермакова А. Е., Кузнецова Д. М. [168]- Чугреева В. Л., Яковлева С. А. [171, 172, 173]- Шемякина Ю. И. [174]- Хомского Н. [176, 177].

Также следует отметить ряд фундаментальных трудов, составляющих теоретическую базу языков программирования и методов трансляции, перешедших в разряд классических. Это работы Ахо А. и Ульмана Дж. [70, 71], Гриса Д. [119], Льюиса Ф., Розенкранца А., Стирнза Р. [144]и многих других.

Основы информационного поиска наиболее полно изложены в работах Черного А. И. [170]- Сэлтона Дж. [56, 57, 58, 59,165, 166]- Кристофера Д. Ман-нинга [132]. Различным методам информационного поиска посвящены работы авторов Aggarwal С. С., Al-Garawi F., Yu P. S. [1], Agichtein E., Lawrence S., Gravano L. [2]- Allan J. [3]- Allison P. [4]- Baeza-Yates R., Ribeiro-Neto B. [6]- Baker D.L., Callum A.K. [7]- Brown E. [9]- Callan J. [10, 11]- Chakrabarti S [12, 13]- Cho J. [14, 15, 16]- Graswell N., Cohn D., Chang H. [17, 18], Hartman D. [19, 27], Dreiinger D. [20] Dumais S. [22], Finkelstein L. и др. [23], Foltz P.W. [24], Gruber T. [26], Hawking D. и Craswell N. и др. [30, 31, 32], Henzinger M., Heydon A., Mitzenmacher M., Najork M. [33, 34]- Heydon A., Najork M. [35], Huang L., Hemmje M., Neuhold E. J. [39], Yang Y. [41]- Kilander F., Fehraeus E., Palme J. [42]- Lawrence S. [46, 47, 48]- Melnik S., Raghavan S., Yang В., Garcia-Molina H. [50], Patel A., Petrosjan L., Rosenstiel W. [54]- Moulinier L.A. [52]- Savoy J., Picard J. [61]- Shivakumar N., Garcia-Molina H. [63]- Singhal A. [64, 65, 66]- Turtle H.R. [67]- Yang Y., Pederson J. [68]- Сэлтона Дж. [55, 56, 57, 58, 59, 60, 165, 166], В. И. Шабанова [], А. Е Ермакова [123, 124, 125], И. Е. Кураленка [44, 134, 135, 136, 137], И. С. Некрестьянова [149, 150, 151]- Гринберга И. В., Ли Г. [118]- Дубин-ского А.Г. [121, 122]- Иванова В. В., Некрестьянова И. С., Пантелеева Н. [128]- Карташева Е. И. [129]- Кристофера Д. Маннинга, Рагхавана Прабхакар, Шютце Ханриха [132] и других.

Тематические классификации, связанные с выделением и извлечением информационных объектов, определением их статистических, лингвистических и семантических характеристик, построением семантико-тематической структуры документов и тематик, тематической фильтрацией и ранжированием документов и пр. разрабатываются в работах Amento В., Terveen L., Hill W. [5]- Hatano К., Sano R., Duan Y. Tanaka K. [28]- Hatzivassiloglou V., Gravano L., Maganti A. [29]- Hawking D., Craswell N. [30]- Merkl D. [51]- Yang Y. 41], Molinier L. [52]- Nekrestyanov I., O’Meara T., Romanova E. [53]- Sebastiani N. [62]- Zhang D., Dong Y. [69]- Андреева A.M. и Березина Д. В. [72, 73]- Берштейна Jl.C. [76, 77]- Добрынинина В. Ю. [120]- Романова Е. В., Романова М. В., Некрестья-нова И.С. [156]- Семенова С. Ю. [163]- Хорошевского В. Ф [169].

Различным аспектам обработки текстовой информации посвящаются известные профессиональные форумы, среди которых следует отметить:

• международные конференции Российской ассоциации искусственного интеллекта;

• международные научно-технические конференции «Интеллектуальные САПР»;

• Всероссийскую конференцию «Электронные библиотеки» (RCDL);

• семинар по компьютерной лингвистике «Диалог» .

Также в Таганрогском технологическом институте Южного федерального университета международной лабораторией ELDIC (Educational Laboratory of Distant Informational Communications) проводится ежегодная Всероссийская школа-семинар «Семантическая интерпретация и интеллектуальная обработка текстов и их приложения в информационном поиске, хранении и обработке документов в электронных архивах и библиотеках».

Проблемам информационного поиска посвящены такие форумы как:

• WWW (World Wide Web) Conference — специально организованная конференция по решению задач, связанных с ИнтернетTREC (Text REtrieval Conference) — цикл конференций организованный под эгидой NIST (National Institute for Standards and Technology) — одного из авторитетных органов стандартизации информационных технологий в США;

• SIGIR (Special Interest Group on Information Retrieval) — цикл конференций проводимых ACM SIGIR (ACM — Association of Computing Machinery) -международной группой специалистов по информационному поиску.

• РОМИП — ежегодный Российский семинар по оценке методов информационного поиска и ряд других.

Оценивая положение дел в области обработки текстовой информации в целом, следует отметить, что значимость и роль исследований, направленных на разработку новых методов обработки и представления информационных потребностей пользователей с акцентом на семантическую составляющую сильно актуализируется. Так, в информационном поиске ситуация такова, что улучшение эффективности известных подходов, основанных на частотных свойствах слов, уже не приносит ощутимого эффекта, а решения предлагается искать в выделении и обработке семантической составляющей документов. В особенности, это касается различения документов из одной предметной области, использующих одну и ту же терминологию и слова, что представляет особо трудный случай для частотного критерия релевантности. Трудности такого же порядка наблюдаются в автореферировании, диалоговых системах, компьютерном переводе, принятии решений и пр. Все это свидетельствует о том, что проблема обработки и понимания естественного языка выдвигается на передний план, а повышение эффективности обработки текстовой информации видится в их семантической интерпретации.

Отсутствие универсальных решений в обработке семантики связаны с внутренними особенностями естественных языков. Так, слова и предложения естественного языка обладает многозначностью, которая придает им, с одной, стороны универсальность, облегчая его использование для описания разных явлений, но в то же время создает значительные трудности для семантической интерпретации. Многозначность языка выражается в омонимии, когда один и тот же текст может иметь различные семантические значения, и в синонимии, когда различные тексты могут выражать одно и то же семантическое значение. Семантическую многозначность текстов человек снимает путем выделения самого вероятного (правдоподобного) варианта разбора предложений, но в то же время он не отбрасывает многообразия и других, менее вероятных смысловых вариантов интерпретации, сопоставляя их с общим контекстом всей разбираемой текстовой информации и своим внутренним знанием.

Обобщая выше сказанное, можно утверждать, что в текстах естественного языка морфология и синтаксис выступают средствами оформления семантики, а предметная область определяет поле понятийных значений, обеспечивающих семантическую интерпретацию текста. На интерпретацию семантики также влияют стилистические приемы оформления текстов в различных областях культурной деятельности. Так, в области литературы главенствует так называемый художественный стиль, которому в большей степени свойственна метафоричность, образность, ритмика и поэтичность. В то же время в текстах научных работ используется научно-технической стиль изложения, в котором смысл выражается предельно точно и сухо, а само изложение носит вид правдоподобного рассуждения. Термины, слова и предложения текстов научных работ стремятся всегда к точным и однозначным смысловым значениям [78, 79, 147, 148]. Это многообразие стилей изложения также определяет отсутствие универсальных решений в области семантической интерпретации текстов, определяя в каждой предметной области разработку собственных подходов.

Настоящая диссертационная работа выполнена в рамках данной проблематики и посвящена разработке и исследованию формализованных представлений и семантических схем предложений документов научно-технического стиля и их использованию для повышения эффективности информационного поиска.

Цель диссертационного исследования — разработка и исследование новых формализованных представлений и семантических схем предложений текстов научно-технического стиля и их использование для повышения эффективности информационного поиска.

Объектом исследования являются особенности текстов документов научно-технического стиля, формализованные представления и семантические схемы предложений, эффективность информационного поиска.

Научные задачи, решаемые в диссертации:

1. Проводится анализ естественного языка и его грамматики, особенностей научно-технического стиля, существующих методов формализации представления предложений. Определяется функционал смысловыразительности и анализируется лингвистическое обеспечение различных видов информационного поиска.

2. Разрабатывается и исследуется формализованное словно-зависимое представление предложения и его атрибуты: цепочки зависимостей, характеристические словные множества, размеченные степени отношения непосредственного подчинения, размеченное транзитивное замыкание отношения непосредственного подчинения и алгоритмы восстановления цепочек зависимостей.

3. Разрабатывается и исследуется формализованное словно-шкальное представление предложения и его атрибуты: словная шкала, ее разбиения на непересекающиеся классы, нумерация разбиений, мощностные оценки, системы разбиений. Конструируются алгоритмы построения систем разбиений и нотации их представления.

4. Определяется и исследуется понятия контекста, контекстной связки, дерева контекстной связки, операции контекстного уточнения смысла, конструируется обратная польская запись функционала смысловыразительности, процедуры ее вычисления и представления в виде семантических схем.

5. Разрабатывается критерий сравнения фрагментов текстов на близость, процедуры формирования ВЫДАЧ, а также проводится экспериментальное сравнение семантического информационного поиска на основе сравнения семантических схем предложений и базового, учитывающего вхождение слов запроса в тексты.

Научная новизна. В результате проведённых диссертационных исследований были разработаны:

1. Формализованные словно-зависимое и словно-шкальное представления предложений текстов научно-технического стиля, алгоритмы их построения и обработки, позволяющие выделять и анализировать фрагменты предложений на смысловую целостность.

2. Функционал смысловыразительности, его представление в нотации обратной польской записи, процедуры ее получения и вычисления, позволяющие строить семантические схемы предложений, используемые в информационном поиске для сравнения предложений или их фрагментов на близость.

3. Критерий сравнения и система решающих правил вычисления близости текстовых фрагментов, процедуры включения документов в ВЫДАЧУ, составляющие основу семантического информационного поиска.

Основные положения, выносимые на защиту:

1. Формализованное словно-зависимое представление предложения и его атрибуты: цепочки зависимостей, характеристические словные множества, размеченные степени отношения непосредственного подчинения, размеченное транзитивное замыкание отношения непосредственного подчинения и алгоритмы восстановления цепочек зависимостей.

2. Формализованное словно-шкальное представление предложения и его атрибуты: словная шкала, разбиения на непересекающиеся классы, нумерация разбиений, мощностные оценки, система разбиений, ее нотации, правила и алгоритмы конструирования.

3. Функционал смысловыразительности и его представление в нотации обратной польской записи, способы ее получения и вычисления, семантическая схема предложения.

4. Критерий сравнения и система решающих правил вычисления близости текстовых фрагментов и процедуры включения документов в ВЫДАЧУ.

Практическая ценность работы. Разработанные в диссертации методы и алгоритмы информационного поиска на основе формализованных представлений и семантических схем предложений текстов научно-технического стиля используются в научно-исследовательских работах (г/б НИР № 12 050, 12 456, 37.00.55) лаборатории ELDIC (Education Laboratory of Distant Informational Communications) и учебном процессе по магистерской программе «Интеллектуальные системы» факультета автоматики и вычислительной техники Таганрогского технологического института Южного федерального университета.

Апробация работы. Основные результаты работы докладывались на:

• Всероссийской научной конференции молодых ученых, аспирантов и студентов «Информационные технологии, системный анализ и управление», (Таганрог, 2006, 2008, 2009, 2010, 2011 гг.);

• Международной конференции по системам искусственного интеллекта при поддержке IEEE AIS'06, AIS'08, AIS' 11 (Дивноморское, 2006,2008,2011гг.);

• Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления», (ТРТУ, 2006 г.).

• Всероссийской научной школе-семинаре молодых ученых аспирантов и студентов «Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки (Таганрог, 2007, 2008, 2009, 2010 гг.).

• Всероссийской конференции студентов, аспирантов и молодых ученых «Технологии Microsoft в теории и практике программирования» (Таганрог 2008).

• Всероссийской научной школе-семинаре молодых ученых аспирантов и студентов «Семантическая интерпретация и интеллектуальная обработка текстов, их приложения в информационном поиске, хранении и обработке документов в электронных архивах и библиотеках» (Таганрог 2011, 2012 гг.).

Публикации. По материалам диссертации опубликовано 24 печатных работы, в том числе 4 статьи в изданиях из списка, рекомендованного ВАК, в которых отражены основные результаты диссертационного исследования.

Структура и объём работы. Диссертация состоит из введения, пяти разделов, заключения и списка литературы. Основная часть работы изложена на 141 странице машинописного текста, включает 58 рисунков и 21 таблицу.

5.5 Выводы.

В разделе проводится экспериментальное исследование основных теоретических положений и результатов диссертационного исследования на примере задачи информационного поиска документов из области профессиональной аккредитация образовательных программ вузов. Поиск выполняется относительно запроса пользователя и имеет следующую формулировку: из входного потока документов сформировать пакет (ВЫДАЧУ) документов, которые наиболее близки по смыслу запросу пользователя, и оценить ее качество.

Для проведения экспериментов разработан специальный программный комплекс, построены схемы экспериментов, сформированы обучающая выборка, входной поток документов и проведены эксперименты для базового частного и семантического методов информационного поиска. Сводные данные по обеспечению экспериментов имеют следующий вид:

1. Тестовая выборка состоит 10 работ и используется для настройки программного комплекса. Эти документы также включается случайным образом во входной поток данных, который состоит из 70 документов.

2. В процесс моделирования на исходных текстах строятся словные шкалы предложений и их системы разбиений, анализируется их принадлежность классу нормальных разбиений, нормальные разбиения переводятся в формализованные нотации дерева и скобочной формы, по которым формируется функционал смысловыразительности в нотации обратной польской записи и проводится его обработка МП-автоматными процедурами. В результате формируются семантические схемы предложений текстов, которые оцениваются на близость семантической схеме запроса пользователя, и по результатам сравнения принимается решение о включении документа в ВЫДАЧУ.

3. Разработана структура критерия сравнения семантических схем предложений на близость и построено два его вида: базовый, учитывающий вхождение слов запроса в тексты, и семантический, учитывающий совпадение семантических схем. Первый критерий близости положен в основу базового метода поиска, который взят за основу сравнения, а второй критерий положен в основу семантического метода поиска.

4. Для критерия близости построена базовая шкала, система решающих правил и процедура определения значения близости Бет В текстовых фрагмен по типу «Слабая», «Относительная», «Достаточная» или «Сильная». Для базовой шкалы построены подинтервалы близостей и составные условия включения документов в ВЫДАЧУ, которые составили общую платформу экспериментов.

Результаты экспериментов по формированию ВЫДАЧ для разных запросов, порогов встречаемости и подинтервалов близостей базового и семантического методов поиска и их сравнительный анализ показывают следующее:

— Семантический метод поиска по качеству ВЫДАЧ в разы превосходит базовый метод, что выражается в более компактных ВЫДАЧАХ, содержащих документы тестовой выборки. Это обстоятельство прослеживается на всех интервалах близостей.

Преимущества семантического метода поиска особенно проявляется в различении документов, использующих одну и ту же терминологическую базу. Этот случай является особенно тяжелым для базового метода, который практически нечувствительным к документам, различающимся семантически, но использующим одни и те же слова.

Заключение

.

Увеличение объема информационных ресурсов, появление различного рода электронных хранилищ данных различного назначения, активное использование электронных библиотек и архивов, поисковых машин и сервисов порождают совершенно новые потребности и требования к технологиям обработки, представления и поиска информации. Используемое определение релевантности документа по встречаемости слов уже не удовлетворяет пользователей по точности поиска, что особенно ощущается в профессиональных областях, использующих одну и ту же терминологию.

Сегодня повышение качества обработки текстовой информации связывают с разработкой новых подходов, основанных на семантической интерпретации текстов. Однако отсутствие хороших решений в этой области связано с особенностями естественного языка, и в первую очередь, с отсутствием приемлемых представлений фрагментов текстов и их семантики. Диссертационное исследование выполнено в рамках данного направления и посвящено разработке и исследованию формализованных представлений и семантических схем предложений текстов научно-технического стиля и их использованию в информационном поиске для повышения его эффективности.

В диссертации получены следующие новые научные результаты:

1. Определена терминология в области обработки текстов, проанализирован феномен естественного языка, его грамматика, особенности текстов документов научно-технического стиля и введено понятие функционала смысловы-разительности. Проведена оценка смысловыразительности языковых средств лингвистического обеспечения различных видов информационного поиска, а также выполнен анализ существующих методов формализации и представления предложений текстов на основе грамматических моделей зависимостей и системы составляющих.

2. Разработано формализованное словно-зависимое представление предложения в виде размеченного транзитивного замыкании отношения непосредственного подчинения. Введено понятие цепочки зависимостей, ее характеристических словных множеств и размеченных степеней отношений непосредственного подчинения, а также сконструированы алгоритмы восстановления цепочек зависимостей по размеченному транзитивному замыканию отношения непосредственного подчинения.

3. Разработано формализованное словно-шкальное представление предложения в виде системы разбиения специального вида словной шкалы, в рамках которой определено понятие словной шкалы, ее разбиений на непересекающиеся классы отрезков, способ нумерации множества разбиений и выведены аналитические выражения комбинаторных мощностных оценок.

4. Для формализованного словно-шкального представления предложения на множестве разбиений словной шкалы введено понятие совмещенного разбиения и системы совмещенных разбиений Ч^т) и показано, что словной шкале может соответствовать более одной системы разбиений, задаваемой Б — правилами включения в систему разбиений Ч'(т) экземпляров из классов разбиений. Сконструированы обобщенные алгоритмы построения системы разбиений, использующие стратегии «сверху-вниз» и «снизу-вверх», и доказана их результативность.

5. Для систем разбиений построены их представления в виде нотации дерева и различных видов скобочных форм. Показано, что нотацию типа дерева отличает наглядность отображения иерархичности системы разбиений, а скобочные формы — линейный порядок размещения вложенных отрезков разбиений различных классов.

6. Сформулировано специальное 8 — правило расщепления отрезков словной шкалы по дуге главного слова и на его основе сконструирован алгоритм построения нормальной системы разбиений Ч'(а). Показано, что нормальная система разбиений Ч'(сх) является обобщением системы составляющих предложения.

7. Для нормальных систем разбиений определены частные БЬи БЯправила расщепления отрезков по дугам зависимости главного слова отрезка, в которых осуществляется удаление первой слева или справа таких дуг зависимостей соответственно. Использование данных правил порождают частные случаи нормальных систем разбиения ^(а) и ^(а) соответственно, у которых на каждом шаге их построения осуществляется выбор расщепляемого первого составного отрезка слева и справа соответственно. Введены понятия IX, ЬЯ, ЯЬ, ИИ — нормальных систем разбиения, которые представляют комбинацию выбора расщепляемого составного отрезка и соответствующего БЬи БЯправила расщепления.

8. Определены понятия контекстной связки, дерева контекстной связки, операции контекстного уточнения смысла, которая задана на множестве смысловых значений главного слова контекстной связки. Для контекстной связки построены базовые соотношения для вычисления смысла ее главного слова.

9. Для функционала смысловыразительности введена нотация обратной польской записи, для чего сконструированы представления в обратной польской записи операции контекстного уточнения смысла и уточнение смысла контекстной связки, а также с учетом особенностей данных операций модифицировано дерево зависимостей. Для модифицированного дерева зависимостей сконструирована процедура его обхода, результатом которой является обратная польская запись функционала. Показано, что основные свойства обратной польской записи функционала смысловыразительности, связанные с линейным порядком ее вычисления за один проход слева направо и отсутствием скобок, в нотации обратной польской записи полностью сохранены.

10. Определена процедура вычисления обратной польской записи функционала смысловыразительности, в которой для хранения промежуточных смысловых значений введены временные переменные. Для временных переменных построены правила высвобождения. Разработана формальная процедура вычисления обратной польской записи на основе МП-автомата и построено его полное описание виде решающей таблицы.

11. Разработана структура представления функционала смысловыразительности предложения в виде семантической схемы, которая используется для семантического сравнения фрагментов текстов.

12. Разработана структура критерия сравнения семантических схем предложений на близость и построено два его вида: базовый, учитывающий вхождение слов запроса в тексты, и семантический, учитывающий совпадение семантических схем. Первый критерий близости положен в основу базового метода информационного поиска, который взят за основу сравнения, а второй критерий положен в основу семантического метода поиска.

13. Для критерия близости построена базовая шкала, система решающих правил и процедура определения значения близости СемБл текстовых фрагментов по типу «Слабая», «Относительная», «Достаточная» или «Сильная». Для базовой шкалы построены подинтервалы близостей и составные условия включения документов в ВЫДАЧУ, которые составили общую платформу экспериментов.

14. Проведено экспериментальное исследование базового и семантического видов информационного поиска, для чего разработаны схемы экспериментов, построен специальный программный комплекс, сформирована из 10 документов тестовая выборка, а из 70 документов — поисковое пространство, включающее документы тестовой выборки.

Результаты экспериментов по формированию ВЫДАЧ для разных запросов, порогов встречаемости и подинтервалов близостей базового и семантического методов информационного поиска и их сравнительный анализ показывают, что семантический метод поиска по качеству ВЫДАЧ в разы превосходит базовый метод. Это выражается в более компактных ВЫДАЧАХ, содержащих документы контрольной выборки, и прослеживается на всех интервалах близостей. Преимущества семантического метода поиска особенно проявляется на документах, принадлежащих одной и той же предметной области и использующих одну и ту же терминологическую базу. Этот случай особенно труден для базового метода, который практически нечувствителен к различению документов, использующих одни и те же слова и терминологию.

Показать весь текст

Список литературы

  1. С. С., Al-Garawi F., Yu P. S. Intelligent crawling on the world wide web with arbitrary predicates. In Proc. of the WWW 10, pp. 96−105, May 2001.
  2. Agichtein E., Lawrence S., Gravano L. Learning search engine specific query transformations for question answering. In Proc. of the WWW10, pp. 169−178, 2001.
  3. Allan J. Incremental relevance feedback. In Proceedings of the 19th International Conference on Research and Development in Information Retrieval (SIGIR '96), pages 298−306, April 1996.
  4. Allison P.J. The impact of database selection on distributed searching. In Proc. of the SIGIR'00, 2000.
  5. Amento В., Terveen L., Hill W. Does «authority» mean quality? Predicting expert quality ratings of web documents. In Proc. of the SIGIR'00, pp. 296−303, 2000.
  6. Baeza-Yates R., Ribeiro-Neto B. Modern Information Retrieval. ACM Press, 1999.
  7. Baker D.L., Callum A.K. Distributional clustering of words for text classification. In Proceedings of the SIGIR'98, pages 96−103, 1998.
  8. Broder A. Z., Najork M., and Wiener J. L. 2003. Efficient URL caching for World Wide Web crawling. In Proceedings of the twelfth international conference on World Wide Web (WWW2003). Budapest, Hungary, p. 680−689.
  9. Brown E.W. Execution Perfomance Issue in Full-Text Information Retrieval. Dissertation. University of Massachusetts. Departament of Computer Science. February 1996.
  10. Callan J. Document filtering with inference networks. In Proceedings of the 19th International ACM SIGIR Conference on Research and Development in Information Retrieval, pages 262 269, 1996.
  11. Callan J.P., Lu Z., Croft W.B. Searching distributed collections with inference networks. In Proceedings of the SIGIR'95, 1995.
  12. Chakrabarti S., Van den Berg M., Dom B. Focused crawling: A new approach to topic-specific web resource discovery. In Proc. of the WWW-8, May 1999.
  13. Chakravarthy A.S., Haase K.B. NetSerf: Using semantic knowledge to find internet information archives. In Proc. of the SIGIR'95, pages 4−11, 1995.
  14. Cho J., Garcia-Molina H. The Evolution of the Web and Implications for an Incremental Crawler. The VLDB Journal, pp. 200−209, 2000.
  15. Cho J., Shivakumar N., Garcia-Molina H. Finding replicated Web collections. In Proc. of the SIGMOD’OO, pp. 355−366, 2000.
  16. Cohn D., Chang H. Learning to Probabilistically Identify Authoritative Documents. In Proc. of the ICML'00, pp. 167−174, 2000.
  17. Craswell N., Bailey P. Is it fair to evaluate Web systems using TREC ad hoc methods? In Proc. of the SIGIR'99,1999.
  18. Craswell N., Hawking D., Robertson S. Effective site finding using link anchor information. In Proc. oftheSIGIR'01,2001.
  19. Harman D. Latent semantic indexing (LSI) and TREC-2. In Proc. of the Second Text REtrieval Conference, 1994.
  20. Drelinger D., Howe A. Expiriences wth selecting search engines using MetaSearch. ACM Transactions on Information Systems, 15(3): 195−222, 1997.
  21. Dublin Core Metadata Element Set Reference Description, Version 1.1, 1999−0702. http:/purl.org/dc/documents/proposedrecommendations/pr-dces-19 990 702.html.
  22. Dumais S. Latent semantic indexing: TREC-3 report. In Proc. of the Third Text REtrieval Conference, 1995.
  23. Finkelstein L., Gabrilovich E., Matias Y., Rivlin E., Solan Z., Wolfman G., Ruppin E. Placing search in context: the concept revisited. In Proc. of the WWW10, pp. 406−414, 2001.
  24. Foltz P.W. Using latent semantic indexing for information filtering. In ACM Conference on Office Information Systems (COIS), pages 40−47, 1990.
  25. Gibson D., Kleinberg J. M., Raghavan P. Inferring web communities from link topology. In Proc. of the UK Conference on Hypertext, pp. 225−234, 1998.
  26. Gruber T. A translation approach to portable ontology specifications. Knowledge Acquisition, 5(2), 1993, pp. 199−220.
  27. Harman D. Latent semantic indexing (LSI) and TREC-2. In Proc. of the Second Text REtrieval Conference, 1994.
  28. Hatano K., Sano R., Duan Y., Tanaka K. An Interactive Classification of Web Documents by Self-Organizing Maps and Search Engines. In Proc. of the DASFAA'99, pp. 35−42, 1999.
  29. Hatzivassiloglou V., Gravano L., Maganti A. An investigation of linguistic features and clustering algorithms for topical document clustering. In Proc. of the SIGIR'2000, 2000.
  30. Hawking D., Craswell N. Which Search Engine is best at finding Online Services? In Proc. of the WWW 10, 2001.
  31. Hawking D., Craswell N., Bailey P., Griffiths K. Measuring Search Engine Quality. Information Retieval, 4(l):33−59, 2001.
  32. Hawking D., Craswell N., Thistlewaite P. B., Harman D. Results and Challenges in Web Search Evaluation. In Proc. of the WWW8, pp. 243−252, 1999.
  33. Henzinger M., Heydon A., Mitzenmacher M., Najork M. Measuring Index Quality Using Random Walks on the Web. In Proc. of the WWW8, 1999.
  34. Henzinger M., Heydon A., Mitzenmacher M., Najork M. On Near-Uniform URL Sampling. In Proc. of the WWW9, 2000.
  35. Heydon A., Najork M. Mercator: A Scalable, Extensible Web Crawler. World Wide Web, 2(4):219−229, 1999.36. http://dic.academic.ru/dic.nsf/encmathernatics/5085/%D0%A1%D0%98%D0%9D%D0%A2%D0%90%D0%9A%D0%A 1%D0%98%D0%A7%D0%95%D0%A 1%D0%9A%D0%90%D0%AF
  36. Полнотекстовый поиск (Чикагский университет http:// humanities. uchicago.edu/faculty/goldsm).38. http://www.stilistika.by.ru/08.shtm.
  37. Huang L., Hemmje M., Neuhold E. J. ADMIRE: An Adaptive Data Model for Meta Search Engines. In Proc. of the WWW9, pp. 165−174, 2000.
  38. Jansen B.J., Spink A., Saracevic T. Real life, real users, and real needs: a study and analysis of user queries on the web. Information Processing and Management, 36(2):207−227, 2000.
  39. Yang Y. An evolution of statistical approaches to text categorization. Journal of the ACM. 1997. Vol. 29 (№ 1). Pp 18−46.
  40. Kilander F., Fehraeus E., Palme J. PEFNA: The private filtering news agent. Technical report, Department of Computer and Systems Sciences, Stockholm University, February 1997.
  41. Kleinberg J.M. Authoritative sources in a hyperlinked environment. Journal of the ACM, 46(5):604−632, 1999.
  42. Landauer T., Foltz P., Laham D. An introduction to latent semantic analysis. Discourse Processes, 25:259−284.
  43. Lawrence S. Context in Web Search. IEEE Data Engineering Bulletin, 23(3):25−32, 2000.
  44. Lawrence S., Giles C. Inquirus L. The NECI Meta Search Engine. In Proc. of the WWW7, pp. 95−105, 1998.
  45. Lawrence S., Lee Giles C. Searching the World Wide Web. Science, 280(5360):98−100, 1998.
  46. Maron M.E., Kulins J.L. On relevance, probabilistic indexing and information retrieval. Jornal of the ACM, No. 7, 1960, pp. 216−244.
  47. Melnik S., Raghavan S., Yang В., Garcia-Molina H. Building a distributed full-text index for the web. In Proc. of the WWW10, pp. 396−405, May 2001.
  48. Merkl D. Lessons learned in text document classification. In Proc. of the Workshop on Self-Organizing Maps (WSOM'97), pages 316−321, Helsinki, Finland, June 1997.
  49. Moulinier L. A framework for comparing text categorization approaches. // Journal of the American Society for Information Science. New York, 2000. № 5.-P. 170−179.
  50. Patel A., Petrosjan L., Rosenstiel W., editors. OASIS: Distributed Search System in the Internet. St. Petersburg State University Published Press, St. Petersburg, 1999.
  51. Salton G., Allan J., Singhal A. Automatic text decomposition and structuring. Information Processing & Management, 32(2): 127−138, 1996.
  52. Salton G., Buckley C. Improving retrieval performance by relevance feedback. Journal of the American Society of Information Science, 41(4):288−297, 1990.
  53. Salton G., Buckley C. Term-weighting approaches in automatic text retrieval. Information Processing and Management, 24:513−523, 1988.
  54. Salton G., Fox E., and Wu H. Extended Boolean information retrieval. Communications of the ACM, Vol. 26, No. 4, December 2001, pp. 35−43.
  55. Salton G., McGill M. J. Introduction to modern Information Retrieval. McGraw-Hill Computer Science Series. McGraw-Hill, New York, 1983.
  56. Salton G., Singhal A., Mitra M., Buckley C. Automatic text decomposition and summarization. Information Processing & Management, 33(2): 193−208, 1997.
  57. Savoy J., Picard J. Report on the TREC-8 Experiment: Searching on the Web and in Distributed Collections. In Proc. of the TREC'8, 1999.
  58. Sebastiani F. Machine Learning in Automated Text Categorization. ACM Computing Surveys, 34(1): 1 -47, 2002.
  59. Shivakumar N., Garcia-Molina H. Finding Near-Replicas of Documents on the Web. In Proc. of the WebDB'99, 1999.
  60. Singhal A. Modern Information Retrieval: A Brief Overview. Data Enginering Bulletin, IEEE Computer Society, Vol. 24, No. 4, December 2001, pp. 35−43.
  61. Singhal A., Kaszkiel M. A case study in web search using TREC algorithms. In Proc. of the WWW10, pp. 708−716, 2001.
  62. Singhal A., Mitra M., and Buckley C. Learning routing queries in a query zone. In Proc. of the SIGIR'97, pages 25−32, July 1997.
  63. Turtle H.R. Inference Networks for Document Retrieval. Dissertation. University of Massachusetts. Department of Computer and Information Science. February 1991.
  64. Yang Y., Pederson J. Feature selection in statistical learning of text categorization. In Proc. of the ICML'97, pages 412−420, 1997.
  65. Zhang D., Dong Y. An efficient algorithm to rank web resources. In Proc. of the WWW9, pp. 449−455, 2000.
  66. Ахо А., Ульман Дж.-Теория синтаксического анализа, перевода и компиляции. -M.: Мир, 1978, Т.1.-612 с.
  67. Ахо А., Ульман Дж.-Теория синтаксического анализа, перевода и компиляции. -M.: Мир, 1978, Т.2.-490 с.
  68. A.M., Березкин Д. В., Сюзев В. В., Шабанов В. И. Модели и методы автоматической классификации текстовых документов // Вестник МГТУ. Сер. Приборостроение. М.:Изд-во МГТУ, — 2003, — № 3.
  69. Е.А. Научный текст в аспекте политекстуальности. / Пермь, журнал Вестник пермского университета «Российская и зарубежная филология», вып. 2(8), 2010, с.60−64.
  70. JI.C., Дзюба Т. А. Решение задач классификации на нечетких графах // Интернет журнал «Перспективные информационные технологии и интеллектуальные системы». 2001. -№ 2. — С. 16−24.
  71. JI.C., Целых А. Н., Тимошенко Р. П. О различных подходах к решению задачи нечеткой классификации // Интернет журнал «Перспективные информационные технологии и интеллектуальные системы». 2000. — № 4. — С. 20−25.
  72. Р.Ю. Об одном подходе к интеллектуализации информационно-поисковых систем // Известия ТРТУ. Тематический выпуск, «Интеллектуальные САПР». — Таганрог, изд-во ТРТУ, 2007, № 1 (73) — с. 170−173.
  73. Р.Ю. Построение предметных словарей // Сборник трудов VI Всероссийской научной конференции молодых ученых, аспирантов и студентов «Информационные технологии, системный анализ и управление». — Таганрог изд-во ТТИ ЮФУ, 2008. — С. 1319.
  74. Р.Ю. Проблемно-ориентированный интегратор информационных ресурсов (POINTER) // Неделя науки 2009: Материалы научных работ. — Таганрог: Изд-во ТТИ ЮФУ, 2009.-С.34−36
  75. Ю.Вишняков Р. Ю., Вишняков Ю. М. Семантически ориентированная метамодель предложения научно-технического текста. // Журнал «Информатизация и связь», № 3, 2011, с. 1719.
  76. Р.Ю., Вишняков Ю. М. Об одной модели семантической классификации методов информационного поиска. // Информатика, вычислительная техника и инженерное образование. Таганрог: Изд-во ЮФУ, 2011, № 4(6), с.21−24
  77. Р.Ю., Вишняков Ю. М. Словная шкала, операции над отрезками, разбиения. // Известия ЮФУ. Технические науки. Тематический выпуск «Интеллектуальные САПР». -Таганрог: Изд-во ЮФУ, 2012, № 2 (127), с. 198−204.
  78. Т.А., Червинская K.P. Извлечение и структурирование знаний для экспертных систем. М.: Радио и связь, 1992. — 290 с.
  79. A.B. Синтаксические структуры естественного языка в автоматизированных системах общения. М.: Наука. Главная редакция физико-математической науки, 1985 -144 с. (Серия «Проблемы искусственного интеллекта»).
  80. И., Ли Г. Разработка новых технологий информационного поиска. Открытые Системы, 10, 1999.
  81. И9.Грис Д. Конструирование компиляторов для цифровых вычислительных машин. -М.: Мир, 1975.-545 с. '
  82. В.Ю., Некрестьянов И. С., Задача выбора тематических коллекций, релевантных запросу. // Труды Всероссийской научно-методической конференции «Интернет и современное сообщество», Санкт-Петербург, декабрь 1998.
  83. А.Г. Некоторые вопросы применения векторной модели представления документов в информационном поиске // Управляющие системы и машины. 2001. — № 4. -С. 77−83.
  84. А.Г. Проблема автоматизации поиска информации в глобальной сети // Проблемы автоматизации информационных технологий. Днепропетровск, 1999. — С. 40−48.
  85. А.Е. Полнотекстовый поиск: проблемы и их решение // Мир ПК. 2000. — N5.
  86. А.Е., Плешко В. В. Ассоциативная модель порождения текста в задаче классификации // Информационные технологии. 2000. — N 12.
  87. А.Е. Тематический анализ текста с выявлением сверхфразовой структуры // Информационные технологии. 2000. — N11, — с. 81−93.
  88. В., Некрестьянов И., Пантелеева Н. Расширение представления документов при поиске в Веб // Труды четвертой всероссийской конференция RCDL'2002. В двух томах. Т.2.-Дубна, 2002.-С. 55−68.
  89. Е. Интеллектуальные поисковые системы Excalibur. Сети, 6, 1997.
  90. М. Р. Перспективные технологии информационных систем. М.: ДМК Пресс- М.: Компания АйТи, 2003. — 288 с.
  91. М.Р. Энциклопедия технологий бах данных. М.: Финансы и статистика, 2002. — 800 с.
  92. Д. Маннинг, Рагхаван Прабхакар, Шютце Хайнрих. Введение в информационный поиск.: Пер. с англ. М.: ООО «И.Д. Вильяме», 2011. — 528 с.
  93. О.П. Дискретная математика для инженера. М.: Энергоатомиздат, 1988, с.
  94. И., Некрестьянов И. Оценка систем текстового поиска, Программирование, 28(4), 2002.
  95. И.Е., Некрестьянов И. С. Оценка систем текстового поиска // Программирование. 2002. — N4. — С. 226−242.
  96. И.Е., Некрестьянов И. С. Автоматическая классификация документов с использованием семантического анализа. Программирование, 4:31−41, 2000.
  97. В.Н. Визуальное моделирование текстов//Труды Междунар. научно-технич. конференций «Интеллектуальные системы» (AIS'05)" и «Интеллектуальные САПР» (CAD-2005).- М.: Физматлит, 2005. -Т. 4. С. 104−114.
  98. МО.Кучуганов В. Н. Семантика графической информации. Известия ТРТУ. Тематич. вып. «Интеллектуальные САПР». Материалы междунар. научн.-техн. конф. «Интеллектуальные САПР». Таганрог: Изд-во ТРТУ, 2002, № 3(26). С. 157−166.
  99. В.Н. Введение в системы программирования. М., «Статистика», 1975, 312 с.
  100. Леонтиева А, Кагиров И. Автоматический синтаксический анализ русских текстов. -Труды 10-й Всероссийской научной конференции «Электронные библиотеки: перепективные методы и технологии, электронные коллекции» RCDL'2008, Дубна, Россия, 2008, с. 397−400
  101. Линейка продуктов для поиска и анализа текстов, http://www.metric.ru/, http://www.rco.ru/
  102. Ф., Розенкранц А., Стирнз Р. Теоретические основы проектирования компилято-ров.-М.: Мир, 1979. 645 с.
  103. Л.В., Евдокимова И. С. Методы и алгоритмы трансляции естественноязыковых запросов к базе данных в SQL-запросы: Монография. Улан-Удэ: Изд-во ВСГТУ, 2004.- 148 с.
  104. В.В. Вероятностная модель языка. О соотношении естественных и искусственных языков. М.: Наука, 1979, 303 с.
  105. И.С. Маршрутизация запросов в системах распределенного поиска. Труды второй всероссийской научной конференции «Электронные библиотеки», стр. 280−287, Протвино, Россия, сентябрь 2000.
  106. И.С., Добрынин В. Ю., Клюев В. В. Оценка тематического подобия текстовых документов // Труды второй всероссийской научной конференции «Электронные библиотеки». Протвино, 2000. — С. 204−210.
  107. И.С., Пантелеева H.A. Системы текстового поиска для Веб // Программирование. 2002. — N4.
  108. A.M. Описание семантики научного текста с позиций теории речевых актов (на материале рецензии на научно-техническую работу) // НТИ. Сер. 2. 1998, № 7.
  109. И.К. Грамматика русского языка в таблицах и схемах. Санкт Петербург: Изд-дом «Литера», 2008, 93 с.
  110. К.И., Лебедева М. Н. Грамматика русского языка. М.: Изд-во «Русский язык», издание 5-е и дополненное, 1990. 352 с.
  111. Платон. Кратил. Соч.: В 3-х т., М.: Мысль, 1968, т.1
  112. Е.В., Романов М. В., Некрестьянов И. С. Использование интеллектуальных сетевых роботов для построения тематических коллекций // Программирование. 2000. -N3.-C. 63−71.
  113. В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. М.: Наука. Главная редакция физико-математической науки, 1989 192 с. — (Серия «Проблемы искусственного интеллекта»),
  114. Ф.И., Руднев Е. А., Петухов В. А. Автоматическое индексирование на естественном языке. Москва, Энергия, 1980, 160 с.
  115. H.K. Ментальные перформативы в научном дискурсе // Вопросы языкознания. 1992, № 4.
  116. В. Н. Комбинаторные методы дискретной математики — М.: Наука, 1977. — С. 241.— 319с.
  117. И.П. Графическое представление синтаксических структур и стилистическая диагностика. Киев, Наукова думка, 1983, 192 с.
  118. И.П. Сквозной анализ как шаг к структурированию текста // НТИ. Сер. 2. 1989, № 2.
  119. С.Ю. Поиск параметрической информации в тексте: алгоритмический и лексикографический аспекты // Труды Международного семинара Диалог'96 по компьютерной лингвистике и приложениям. М., 1996. — С. 227−230.
  120. Словарь глагольно-именных словосочетаний общенаучной речи. М., Наука, 1973.
  121. Дж. Автоматическая обработка, хранение и поиск информации: Пер. с англ. / Под ред. А. И. Китова. М.: Советское радио, 1973. — 560 с.
  122. Дж. Эксперименты по автоматическому построению тезауруса для информационного поиска // Кибернетический сборник, новая серия. Вып. И. М.: Мир, 1974. С. 185 199.
  123. Я.Г. Введение в общий синтаксис. Учебное пособие. М.: Изд-во Российского гуманитарного университета, 2001, 830 с.
  124. Хорошевский В.Ф. OntosMiner: семейство систем извлечения информации из мультия-зычных коллекций документов, Труды конференции КИИ-2004, Тверь, Россия, 2004.
  125. А.И. Введение в теорию информационного поиска. Монография. М.: Наука, 1975,239 с.
  126. Чугреев B. JL, Яковлев С. А., Анализ структуры текста и прогнозирование нечисловых величин. // ВУЗОВСКАЯ НАУКА РЕГИОНУ: Материалы 1-й Общероссийской нучн,-техн. конф. — Вологда: ВоГТУ, 2003. — С. 202−204.
  127. В.JI., Яковлев С. А., Выделение критериев поиска текста на основе подобия значимых документов. // ВУЗОВСКАЯ НАУКА РЕГИОНУ: Материалы 1-й Общероссийской нучн.-техн. конф. — Вологда: ВоГТУ, 2003. — С. 200−202.
  128. Ю.И. Начала компьютерной лингвистики: Учеб. пособие. М.: Изд-во МГОУ, А/О"Росвузнаука", 1992.- 120 с.
  129. С.А. Проблемы введения и исключения абстракций более высоких порядков (чем первый).// В кн.: Яновская С. А. Методологические проблемы жизни. М.: Мысль, 1972.
  130. Н. Синтаксические структуры = Syntactic Structures. // Серия сборников переводных статей по языкознанию «Новое в лингвистике». М.: 1962. Вып. II. — с. 412—527.
  131. Для организации проведения научных исследований магистрантами в области семантической интерпретации и обработки текстовой информации и ее приложений в информационном поиске и электронных хранилищах данных-
  132. В дисциплинах «Семантическая интепретация и классификация текстовой информации» и «Методы и средства автоматической обработки текстовой информации».
  133. Теоретические результаты и построенные на их основе программные средства позволяют магистрантам изучать, проводить исследования и ставить эксперименты в области обработки текстовой информации и информационного поиска.
  134. Результаты диссертационной работы обеспечивают качественный учебный процесс по магистерской программе «Интеллектуальные системы» направления 230 100.68 «Информатика и вычислительная техника».
  135. Зав. кафедрой математического обеспечения и применения ЭВМ, д.т.н., профессор1. П.П. Кравченко
Заполнить форму текущей работой