CLAIM – научно-образовательный кластер

Филиппович Андрей Юрьевич

 

Отзыв официального оппонента

на диссертационную работу

Бодрова Даниила Александровича
на тему «Диалоговые алгоритмы поиска и навигации в автоматизированной системе текстового документооборота металлургического предприятия», представленной на соискание ученой степени кандидата технических наук по специальности 05.13.01 — «Системный анализ, управление и обработка информации (металлургия)»

 

Актуальность проблемы

На сегодняшний день в автоматизированных системах управления предприятиями и сети Интернет наблюдается значительный рост объемов полнотекстовой информации, хранящейся в электронном виде. Это приводит к необходимости повышения требований к ее организации, качеству и скорости обработки. В связи с этим тема диссертационной работы, посвященная задачам повышения качества поиска в текстовых массивах, является актуальной.

В рамках этого общего направления с целью повышения эффективности управления и системного анализа в диссертации выделяется конкретная актуальная задача разработки диалоговых алгоритмов поиска и навигации в автоматизированной системе текстового документооборота металлургического предприятия.

Цель и задачи диссертационной работы

В качестве цели диссертационной работы выбирается исследование различных диалоговых (интерфейсных) механизмов поиска, основанных на изменении поисковых запросов, разработка и апробация диалоговых моделей фокусировки и расширения поиска в системах документооборота металлургических предприятий, а также исследование возможностей применения частотных зависимостей для помощи пользователям в формулировании запросов при патентном поиске.

Для достижения поставленных целей исследование разбивается на задачи:

  • анализ имеющихся подходов к организации интерфейса поисковых систем, выявление их узких мест и направления развития;
  • разработка диалоговых решений для повышения эффективности поиска, основанных на методах фокусировки, расширения и переформулирования запроса;
  • разработка диалоговых решений для повышения эффективности поиска, основанных на частотных моделях;
  • разработка формальной постановки задач расширения и фокусировки поиска, создание программного обеспечение для их решения;
  • Оценка эффективности предложенных методов разрешения многозначности, фокусировки поиска, навигации по онтологиям при использовании в системах документооборота металлургических предприятий, патентного поиска, сети Интернет.

  Содержание работы

Диссертация состоит из введения, четырех глав и заключения.

В первой главе проведен анализ современного состояния информационно-поисковых систем, который позволяет сделать вывод о необходимости предложения новых подходов к поиску. В главе описаны основные различия между различными типами информационных систем, рассмотрены различные технологии, с помощью которых в последние годы повышалось качество информационного поиска.

Во второй главе содержатся основные результаты работы, заключающиеся в формальной постановке задачи поиска с использованием технологий разрешения многозначности. Предложенный автором математический аппарат достаточно подробно описывает тексты на естественном языке, включая проблемы лексической и коммуникативной многозначности. В работе сформулирован и описан алгоритм работы поисковой системы основанной на интерактивном взаимодействии с пользователем для разрешения многозначности. В главе описана постановка задачи поиска как нечеткой многокритериальной задачи принятия решений и наглядно показано преимущество предлагаемого подхода над традиционными интерфейсами поисковых систем.

В третьей главе описан предлагаемый автором подход к навигации по лексическим онтологиям с использований частных зависимостей. Онтологическая сеть является достаточно мощным инструментом описания семантики текстов, однако большинство средств для работы с онтологиями слишком сложны для неподготовленных пользователей. Автор предлагает методы облегчения навигации в онтологической сети за счет подсказки пользователю перспективных направлений навигации. Автором рассмотрены альтернативные способы визуализации частотной информации, что хорошо проиллюстрировано прототипом навигационного приложения.

В четвертой главе автор выявляет факторы, влияющие на эффективность применения предлагаемых им подходов, а также влияние на эффективность применения методов в различных прикладных областях. Автор делает вывод, что предлагаемые подходы в большей степени ориентированы на профессиональных пользователей, а не на неподготовленных.

Научная новизна и практическая ценность

В качестве научной новизны, в первую очередь, выделяется формальная постановка задачи расширения и фокусировки поиска в интерфейсном модуле поисковой машины, основанной на использовании лексического значения; разработка интерфейсной модели поисковой машины, основанной на технологиях разрешения многозначности;

Научную новизну также представляют подтверждение возможности и эффективности применения частотных показателей при работе с лексическими онтологиями, и математическое описание различных частотных факторов для использования в пользовательском интерфейсе.

Все предлагаемые решения являются новыми и оригинальными. Научные публикации соискателя и его диссертационная работа представляют первый опыт исследований подобного рода.

Практическая ценность теоретических аспектов диссертации состоит в математических моделях, алгоритмах поиска и навигации. Практическая ценность прикладных аспектов состоит в разработанных программных компонентах, результатах проведенных экспериментов. Областью применения и последующего развития результатов работы является актуальные на сегодня прикладные задачи компьютерной лингвистики: интеллектуальный поиск, человеко-машинное взаимодействие, обработка массивов текстовых данных.

Личный вклад автора в разработку проблем, выносимых на защиту

В диссертации отмечены все случаи заимствования разработок, принадлежащих соавторам, с которыми были написаны научные работы, а также приведены ссылки на источники использованных в исследовательских целях материалов. Личный вклад автора наиболее четко представлен в разработке:

  • математической модели пользовательского интерфейса к поисковой системе, основанной на технологиях разрешения многозначности;
  • диалогового алгоритма решения задачи информационного поиска, основанного на технологиях разрешения многозначности;
  • математических моделей использования частотных факторов при навигации в лексических онтологиях.

Недостатки диссертационной работы

Недостатками работы считаю следующее:

  • В работе не рассматриваются подходы, связанные с поисковыми запросами к системам управления базами данных на естественном или ограниченно-естественном языке.
  • В работе рассматриваются математические модели с использованием частотных факторов, однако не достаточно внимание уделено модели Мандельброта и закону Бредфорда.
  • В научном исследовании особое внимание уделяется вопросам разрешения многозначности, но не оценивается возможность повышения эффективности обработки за счет использования частотно-семантических методов и словарей.  

Заключение

Считаю, что диссертационная работа Бодрова Д.А. представляет собой законченное научное исследование, посвященное решению актуальной проблемы. Диссертация оформлена в соответствии с необходимыми требованиями, получила практическое внедрение и апробацию. Основные положения диссертации, ее результаты полно отражены в опубликованных работах автора. Указанные ранее недостатки не снижают положительной оценки выполненного исследования.

Все это дает основание для общего вывода о том, что представленная диссертация «Диалоговые алгоритмы поиска и навигации в автоматизированной системе текстового документооборота металлургического предприятия», в которой содержится решение задачи, имеющей существенное значение для металлургической отрасли, в полной мере отвечает требованиям ВАК России к кандидатским диссертациям, а ее автор – Бодров Даниил Александрович – заслуживает присвоения ученой степени кандидата технических наук по специальности 05.13.01 – «Системный анализ, управление и обработки информации (металлургия)».

 

 © НОК CLAIM, 2006-2012. Замечания, вопросы и сведения об ошибках просим сообщать в форуме или присылать администратору сайта.

OZON.ru Rambler's Top100