CLAIM – научно-образовательный кластер

МЕТОДЫ АВТОМАТИЧЕСКОГО ФОРМИРОВАНИЯ ГИПЕРССЫЛОК ПРИ СОЗДАНИИ ЭЛЕКТРОННЫХ ВЕРСИЙ АССОЦИАТИВНЫХ СЛОВАРЕЙ

Методы автоматического формирования гиперссылокиих реализация входят соответственно в методическое и программное обеспечение Автоматизированной системы научных исследований ассоциативных экспериментов (АСНИ АЭ), которая создается в рамках проекта «АСНИ динамики ассоциативно-вербальной модели языкового сознания русских как индикатора образа России в новейшей истории и современности» при поддержке гранта РГНФ № 06-04-03803в в рамках конкурса 2006-8 гг. «Образ России в современном мире».

Основное направление исследований – изучения стимульно-реактивного (ассоциативного) режима работы языкового сознания, материальным отражением которого является ассоциативно-вербальная сеть современного русского языка (АВС), зафиксированная в следующих словарях:

  • «Русский ассоциативный словарь»,

  • «Словарь ассоциативных норм русского языка А.А. Леонтьева»

  • «Славянский ассоциативный словарь»

  • «Ассоциации информационных технологий: эксперимент на русском и французском языках»

Для повышения эффективности и возможностей исследования в рамках проекта создаются электронные версии перечисленных ассоциативных словарей на базе web -технологий. Эффективное использование и решение исследовательских задач во многом зависит от удобной навигации по отдельным статьям словарей – вершинам АВС. Основными целями использования гиперссылок (механизмов перехода между вершинами АВС) являются поиск нужной статьи и анализ связей.

Поиск статьи

В случае поиска нужной статьи из-за специфики словарных текстов достаточно составления активного содержания с переходами к необходимым заголовочным словам, а также возможность возврата или быстрого перехода к оглавлению. Если использовать в качестве электронного формата статическую HTML ? разметку, то вторая возможность уже реализована во всех современных Web -браузерах (Internet Explorer, Netscape Navigator, Mozilla Firefox и др.), а первая – может быть обеспечена автоматически при добавлении оглавления в текстовом редакторе MS Word и сохранении в формате HTML .

Таким образом, для реализации функции поиска статьи от оглавления метод автоматического формирования гиперссылок состоит из следующих этапов:

  • Разметка (форматирование) заголовочных слов уникальным стилем.

  • Настройка правил формирования оглавления.

  • Добавление автоматически формируемого содержания.

  • Сохранение документа (текста словаря) в формате HTML .

При создании web -ресурса на базе технологий динамического формирования HTML -страниц необходимо использовать другой метод автоматической генерации гиперссылок. Это связано с тем, что, во-первых, в качестве источника данных берется не сверстанная в текстовом редакторе версия ассоциативного словаря, а электронная БД. Во-вторых, переход к нужной статье с использованием динамического формирования HTML -страниц осуществляется в два этапа:

  • поиск по заголовочному слову нужной записи в БД;

  • считывание данных, формирование HTML -страницы для выбранной статьи и передача ее браузеру клиента (удаленного пользователя).

Таким образом, при использовании динамического HTML отсутствует необходимость добавления специальной разметки (установки «якорей») для всех заголовочных слов (как в предыдущем варианте), однако требуется написание специальной программы (скрипта) формирования страницы. Подобный метод автоматического формирования гиперссылок можно схематично представить следующим образом:

  • Установка курсора БД на первую запись

  • Цикл по всем записям

    • Считывание заголовочного слова Word1

    • Размещение слова Word 1 на web -странице оглавления с добавлением ссылки вида:
      <a href="http:// www. philippovcih.ru/ShowArticle.asp?Word1"> Word1</a>

    • Переход к новой записи БД.

Исследование ассоциативно-вербальной сети

Поиск связей и цепочек ассоциаций в АВС может быть организован несколькими способами:

  • Поэтапный переход по узлам сети, управляемый пользователем .

  • Автоматическое построение множества всех возможных цепочек (путей) в АВС от выбранного источника . Вариант из-за большого количества возможных путей и способов их построения требует серьезных вычислительных и емкостных ресурсов. Кроме того, значительное количество результатов автоматического построения цепочек в свою очередь требует эффективного и удобного механизма навигации.

  • Автоматическое (или автоматизированное) построение множества цепочек, удовлетворяющих определенным условиям . Например, кратчайшему расстоянию в АВС с учетом «стоимости» переходов, определяемых частотой, направленностью, коэффициентом удаленности от источника и другими параметрами.

Из рассмотренных способов только первый требует обязательной реализации гиперссылок, а для остальных – они играют вспомогательную роль, т.е. могут использоваться для навигации в результатах построения цепочек.

При большом количестве слов, рассматриваемых в качестве стимулов и реакций, в ассоциативных словарях построение стандартных HTML -ссылок потребуется практически для всех слов, что потенциально приводит к следующим недостаткам:

  • Увеличение размера формируемых HTML -страниц в несколько раз.

  • Падение скорости формирования страницы.

  • Ухудшение функций визуализации (эргономики).

  • Множество вариантов перехода (например, к стимулу или к реакции) требует создания нескольких ссылок или вызова дополнительной формы выбора.

Учитывая приведенные недостатки, целесообразно разработать более гибкий механизм построения гиперссылок, для чего можно воспользоваться средствами современных браузеров, которые позволяют обрабатывать системные сообщения. Эти сообщения передаются браузеру при возникновении событий операционной системы, связанных с нажатием различных комбинаций элементов клавиатуры и манипуляторов.

Подобный метод автоматического формирования гиперссылок может использоваться также для локальных версий и компонент АСНИ АЭ. Впервые для лингвистических БД он был апробирован в 1998 году в среде СУБД Paradox 5.0 (в ее формате созданы все экспериментальные БД АЭ) при создании АСНИ по картотеке русского языка XI - XVII вв. (см. приложение). Схематично указанный метод формирования гиперссылок можно описать следующим образом:

  • Активация обработчика выделенных событий (соответствующий java -скрипт должен включаться в HTML -код при формировании страниц статей ассоциативных словарей).

  • Определение слова (словосочетания), которое должно использоваться в качестве параметра для перехода, т.е. как гиперссылка.

  • Если переход возможен, то добавление нового элемента (стимула или реакции) в ассоциативную цепочку, отображаемую в статусной строке или другом элементе экранной формы.

  • Если переход невозможен, то указание в статусной строке соответствующего комментария.

Основным недостатком указанного метода является сложность или даже невозможность определения в общем случае, что нужно использовать в качестве гиперссылки слово или словосочетание. Эта проблема во многом решается за счет табличного представления списков стимулов и реакций (каждой гиперссылке соответствует одна ячейка) или пунктуационного разделения запятыми или другими знаками препинания.

Дополнительным преимуществом описанного метода является возможность подключения лемматизатора, стеммера, переводчика и других опциональных компонент.

 

Приложение. Текст программы на языке PalObject ,
реализующий описанный выше метод перехода по cсылке в среде СУБД Paradox .

 

method mouseDouble(var eventInfo MouseEvent)

; метод вызова формы по ссылке гипертекста

 

var

slovo string

symbol string

lili uiobject

forma Form

tabl Tcursor

name_form string

dlina_slova longint

istina logical

endvar

slovo=""

 

;проверка: стоит ли указатель на слове или нет

active.action(SelectRight)

symbol= Описание .SelectedText

if symbol<>" " and ansicode(symbol)<>13 then active.action(SelectLeft)

 

;продвижение курсора (указателя) влево до пробела или ...

while symbol<>" " and ansicode(symbol)<>13 and symbol<>""

if active.cursorpos=0 then quitloop endif

active.action(MoveLeft)

active.action(SelectRight)

symbol= Описание .SelectedText

active.action(SelectLeft)

endWhile

;возвращение на один знак, т.к. last symbol =" "

; active.action(MoveRight)

 

;продвижение курсора (указателя) вправо до пробела или ...

while symbol<>" " and ansicode(symbol)<>13 and symbol<>""

active.action(MoveRight)

active.action(SelectRight)

symbol= Описание .SelectedText

active.action(SelectLeft)

slovo=slovo+symbol

endWhile

 

slovo=slovo.rtrim() ;удаляет пробел из конца строки

endif

Silka=slovo

 

;получение информации о форме, которую нужно вызвать

tabl.open("ssylka.db")

tabl.locate(" Ссылка ",slovo)

name_form=tabl. Вид

tabl.close()

name_form=name_form+".fsl"

 

if forma.open(name_form) then ; открывает forma

message("Для возврата следует закрыть форму")

lili.attach(forma) ;связь с объектом формой siteForm

lili.locate("Ссылка",slovo) ;поиск нужного значения

forma.wait() ;данная форма становится неактивной

; до возврата из Sitenote

slovo=""

endif

endmethod mouseDouble;

 

 © НОК CLAIM, 2006-2012. Замечания, вопросы и сведения об ошибках просим сообщать в форуме или присылать администратору сайта.

OZON.ru Rambler's Top100