CLAIM – научно-образовательный кластер

Филиппович Андрей Юрьевич

 

Отзыв официального оппонента

на диссертационную работу Буштедта Владислава Андреевича
на тему «Модель принятия решения на основе синтаксического анализа в задачах обработки патентной информации», представленной на соискание ученой степени кандидата технических наук по специальности 05.13.01 — «Системный анализ, управление и обработка информации (в производственной сфере)»

 

Актуальность проблемы

На сегодняшний день в автоматизированных системах управления предприятиями и сети Интернет наблюдается значительный рост объемов полнотекстовой информации, хранящейся в электронном виде. Это приводит к необходимости повышения требований к ее организации, качеству и скорости обработки. В связи с этим тема диссертационной работы, посвященная задачам повышения качества поиска в текстовых массивах, является актуальной.

В рамках этого общего направления с целью повышения эффективности обработки информации, управления и системного анализа в диссертации выделяется конкретная актуальная задача построения системы качественного патентного поиска на базе методов синтаксического анализа.

Цель и задачи диссертационной работы

В качестве цели диссертационной работы выбирается исследование особенностей документооборота в области патентного поиска, моделировании процессов синтаксического разбора и создании моделей принятия решения при выборе патентов аналогов. Для достижения поставленных целей исследование разбивается на задачи:

  • зучение информационных потоков и особенностей патентного поиска;
  • изучение различных грамматик, позволяющих описать синтаксическую структуру предложения;
  • создание методов и алгоритмов частичного синтаксического анализа текста на русском языке.
  • создание программного комплекса, выполняющего поиск и выделение чанков с именами существительными из предложения.
  • разработка эвристик, улучшающих точность работы программного комплекса. создание прототипа системы принятия решения при
  • выборе патентов аналогов для апробации разработанного метода.

  Содержание работы

Диссертация состоит из введения, трех глав, заключения и приложений.

В первой главе проведен подробный анализ современного состояния синтаксического анализа естественных текстов и информационно-поисковых систем, который позволяет сделать вывод о необходимости предложения новых подходов к поиску. В главе описаны основные различия между различными типами информационных систем, рассмотрены различные технологии, с помощью которых в последние годы повышалось качество синтаксического анализа. Опираясь на результаты проведенного анализа, автор обосновывает перспективность применения частичного синтаксического анализа (чанкинга) для  повышения качества информационного поиска.

Во второй главе содержатся основные результаты диссертационной работы, заключающиеся в математической постановке задачи принятия решения в области патентного поиска, а также задачи частичного синтаксического анализа с использованием эвристик трех групп. Автор описывает использование блочного подхода при работе синтаксического анализатора, который позволяет проводить настройку каждого блока независимо друг от друга, что дает возможность эффективно решать широкий круг задач, опирающийся на необходимость проведения частичного синтаксического анализа текстов на естественном языке.

В третьей главе описывается программный комплекс поддержки принятия решения, в состав которого входит модуль проведения частичного синтаксического анализа. Рассматривается шесть методик для проведения патентного поиска,  выбирается наилучшая из них. Для определения качества выполняемого синтаксического анализа проводится расчет результирующей меры F1. Описываются дополнительные модули программного комплекса.

Научная новизна и практическая ценность

В качестве научной новизны, в первую очередь, выделяется Модель  и алгоритм принятия решения на основе синтаксического анализа в задачах обработки патентной информации и Математическая постановка задачи частичного синтаксического анализа в логико-математической и расширенной нотации.

Научную новизну также представляют усовершенствованная модель частичного синтаксического анализа, основанная на блочном подходе; эвристики, улучшающие качество синтаксического анализа; экспериментально выявленный вклад каждой эвристики в результаты синтаксического анализа.

Все предлагаемые решения  являются новыми и оригинальными. Научные публикации соискателя и его диссертационная работа представляют первый опыт исследований подобного рода.

Практическая ценность работы состоит в применения ее результатов при разработке различных систем для работы с текстом на естественном языке, в том числе информационных систем патентного поиска. Областью применения и последующего развития результатов работы является актуальные на сегодня прикладные задачи компьютерной лингвистики: интеллектуальный поиск, человеко-машинное взаимодействие, обработка массивов текстовых данных.

 

Личный вклад автора в разработку проблем, выносимых на защиту

В диссертации отмечены все случаи заимствования разработок, принадлежащих соавторам, с которыми были написаны научные работы, а также приведены ссылки на источники использованных в исследовательских целях материалов. Личный вклад автора наиболее четко представлен в разработке:

  • Модели и алгоритмов принятия решения патентным поверенным в области патентного поиска при выборе патентов-аналогов.
  • Модели частичного синтаксического анализа, основанной на блочном подходе.
  • Эвристик, улучшающих качество синтаксического анализа.
  • Математической постановки задачи частичного синтаксического анализа в логико-математической и расширенной нотации.
  • Разработке программного комплекса «FindChunk».

Недостатки диссертационной работы

Недостатками работы считаю следующее:

  • В работе недостаточно внимания уделено ограничениям, при которых может применяться частичный синтаксический анализ.
  • Недостаточно подробно описана методика применения блочного подхода при проведении синтаксического анализа.
  • Недостаточно обосновано использование первого типа эвристик, сужающих размеры анализируемых конкордансов, для области патентного поиска. Не учтена мультиязычная специфика международных патентов, проявляющаяся в искажениях при дословном переводе формул изобретения.

Заключение

Считаю, что диссертационная работа В.А. Буштедта представляет собой законченное научное исследование, посвященное решению актуальной проблемы. Диссертация оформлена в соответствии с необходимыми требованиями, получила практическое внедрение и апробацию. Основные положения диссертации, ее результаты полно отражены в опубликованных работах автора. Указанные ранее недостатки не снижают положительной оценки выполненного исследования.

Все это дает основание для общего вывода о том, что представленная диссертация «Модель принятия решения на основе синтаксического анализа в задачах обработки патентной информации», в которой содержится решение задачи, имеющей существенное значение для производственной сферы, в полной мере отвечает требованиям ВАК России к кандидатским диссертациям, а ее автор – Буштедт Владислав Андреевич – заслуживает присвоения ученой степени кандидата технических наук по специальности 05.13.01 –  «Системный анализ, управление и обработки информации (в производственной сфере)».

 

 © НОК CLAIM, 2006-2012. Замечания, вопросы и сведения об ошибках просим сообщать в форуме или присылать администратору сайта.

OZON.ru Rambler's Top100