CLAIM – научно-образовательный кластер |
|||||||||||||||||||
|
|||||||||||||||||||
АСНИ АССОЦИАТИВНЫХ ЭКСПЕРИМЕНТОВ
Аннотация Рассматриваются компоненты автоматизированной системы научных исследований ассоциативных экспериментов (АЭ), в числе которых Электронные версии ассоциативных словарей; системы проведения интерактивных и визуальных АЭ; система анализа ассоциативно-вербального поля. Особое внимание уделяется решению исследовательской задачи моделирования и анализа языкового сознания россиян, а также разработке м етодики фильтрации шумов в электронных АЭ.
Abstract The article is devoted to Automated system for scientific research in the field of associative experiments (AE) and its components: Electronic versions of associative dictionaries, subsystems for analysis associative-verbal fields, organizing interactive and visual web-based AE. The article is discussing tasks and problems of developing methodic of filtering noises during interactive AE and using automated system for modeling and analysis language consciousness of Russians.
Ассоциативный эксперимент (АЭ) является одним из самых распространенных методов психолингвистики для оценки особенностей восприятия человека и изучения его языкового сознания. Своей популярностью он обязан относительной простоте организации небольшого эксперимента и оценки полученных результатов. Однако для проведения массовых экспериментов и глубокого анализа ассоциативных полей требуются специальные инструменты подготовки исходных и обработки результирующих данных, среди которых наибольшее применение нашли такие средства автоматизации, как программы для генерации анкет, лингвистические редакторы, базы данных, пакеты статистического анализа и др. В большинстве случаев подобные инструменты разнородны и трудно интегрируются друг с другом, что приводит к необходимости разрабатывать специальные программы-конвертеры и адаптировать системы более общего назначения. Задача преодоления недостатков таких решений является одной из главных предпосылок для создания Автоматизированной системы научных исследований ассоциативных экспериментов (АСНИ АЭ) . Второй важной предпосылкой для создания комплексной информационной системы является бурное развитие современных информационных технологий, которые открывают дверь не только для автоматизации рутинных операций, но и предлагают новые возможности по организации самих экспериментов: значительное расширение аудитории за счет постоянно растущего количества пользователей сети Интернет, высокая динамика наполнения баз данных АЭ, новые формы и режимы анкетирования и т.д. Третьей предпосылкой является рост интереса к прикладному использованию ассоциативных полей для проведения рекламных компаний, анализа текстов выступлений, контекстного поиска информации, автоматического перевода, построения семантических сетей и онтологий.
Моделирование и анализ языкового сознания россиян Несмотря на большое количество предпосылок и значительный объем наработок, отправной точкой для начала работ по созданию АСНИ АЭ послужила задача исследования динамики ассоциативно-вербальной модели языкового сознания, отвечающей за формирование образа России в современном мире. Данный проект направлен на решение фундаментальной проблемы, касающейся нескольких смежных научных дисциплин (семиотики, лингвистики, психологии, культурологии, социологии), – моделирования и анализа языкового сознания россиян определенного поколения (конец ХХ в. – начало ХХ I в.). В рамках исследования предполагается, что АЭ можно рассматривать как способ овнешнения языкового сознания, а ассоциативный тезаурус, составленный на основе репрезентативной выборки, является моделью сознания «усредненного» носителя русского языка. Основное направление исследований – изучения стимульно-реактивного (ассоциативного) режима работы языкового сознания, отражением которого является ассоциативно-вербальная сеть современного русского языка (АВС), зафиксированная в следующих словарях:
Они позволяют изучать системность и содержание образа мира россиян в динамике последних десятилетий. Дополнительно в рамках проекта рассматриваются ассоциативные словари, которые отражают межкультурные аспекты и в перспективе могут способствовать уточнению особенностей сознания русских:
Проанализировав исторические тенденции формирования обыденного образа мира россиян, можно сравнить результаты с данными по другим культурам и исследовать связь языка и культуры, а также роль языка в процессе формирования этнического менталитета россиян в современном мире. Особ ое внимание уделяется аудитории и лексике, связанной с современными информационными технологиями, т.к. в настоящее время наблюдается активное смещение коммуникативного взаимодействия, особенно среди молодежи, в новую информационную среду. В качестве основного планируемого результата проекта по моделированию и анализу языкового сознания россиян планируется создание базы данных «Ассоциативный образ россиян носителей русской культуры» в среде Интернет и инструментально-программной среды для автоматизации исследований языкового сознания русских, которые позволят:
Функциональные подсистемы АСНИ АЭ При разработке АСНИ АЭ основой упор сделан на web -технологии, которые позволяют расширить круг пользователей системы и сделать доступным решение задач через Интернет. Вместе с тем, используются и традиционные ( desktop ) технологии, необходимость создания которых обуславливается следующими причинами:
АСНИ АЭ является экспериментальной разработкой, которая постоянно развивается и дополняется новыми модулями и данными. На текущий момент ней выделено несколько основных и перспективных подсистем:
Электронные версии ассоциативных словарей. Основное назначение этой подсистемы состоит в представлении изданных печатных словарей в новой современной форме – в виде HTML -ресурса. Для повышения эффективности работы со словарями разрабатывается web-ориентированная база данных АСНИ АЭ и дополнительные возможности работы с ней, которые в перспективе будут доступны для широкого круга пользователей сети Интернет. В состав подсистемы входят следующие компоненты:
Система анализа ассоциативно-вербального поля. Основное назначение этой подсистемы состоит в информационной поддержке деятельности исследователя (или другого пользователя) по анализу ассоциативно-вербальной сети (поля) с использованием общих или специально разработанных технологий. В настоящее время реализована и открыта для доступа тестовая версия компоненты поиска ассоциативных цепочек, использующая стандартные средства запросных систем на базе SQL . Помимо этого разрабатываются специальные алгоритмы поиска кратчайших цепочек стимул-реакция, построенные на базе современных парадигм в области искусственного интеллекта, связанных с генетическими алгоритмами, нейронными сетями и т.д.
Система проведения визуального ассоциативного эксперимента. Данная подсистема позволяет выйти за рамки возможностей традиционного вербального эксперимента за счет использования в качестве стимулов (реакций) графических изображений или видеороликов. Основными компонентами системы являются:
Система психолингвистического анализа текстов. Данная подсистема является одним из основных инструментов для проведения прикладных исследований, направленных на решение следующих типовых задач:
Прочие компоненты и подсистемы. К числу дополнительных компонент, которые пока только проектируются или не могут быть реализованы автономно, относятся следующие перспективные подсистемы:
Система проведения интерактивного ассоциативного эксперимента Основное назначение этой подсистемы АСНИ состоит в автоматизации рутинных операций АЭ, т.к. необходимость вручную формировать, распечатывать и вносить в базу данных результаты экспериментов требует серьезных временных, организаторских и материальных затрат. Кроме того, как показывает практика, из-за неразборчивости почерка регулярно возникают ошибки ввода и опечатки операторов. Традиционная (бумажная) технология дополнительно накладывает ограничение на удаленность респондентов и создает сложности при сохранении условий проведения экспериментов и обработки материалов, приходящих по почте. Эти ограничения могут быть частично устранены за счет использования современных ИТ и создания web-ориентированной системы проведения интерактивных ассоциативных экспериментов, которые обладают следующими неоспоримыми преимуществами:
Значительное уменьшение временных и материальных затрат достигается тем, что при проведении эксперимента в Интернет нет необходимости вручную подготавливать анкеты, распечатывать их, организовывать централизованное распространение, заполнение и сбор анкет. Также исключается этап ввода анкет в базу данных специальными операторами – вместо этого, стимулы вводятся в базу данных самим респондентом. Возможность прохождения анкетирования одновременно большому числу респондентов является очень важным преимуществом, т.к.позволяет многократно сократить сроки проведения эксперимента и увеличить его аудиторию. Использование системы проведения интерактивного АЭ для решения задач гранта РГНФ по исследованию ассоциативно-вербальной модели языкового сознания русских как индикатора образа России в новейшей истории и современности позволит дополнительно решить следующие задачи:
Создание условий для непрерывного пополнения данных потенциально дает возможность:
Несмотря на множество преимуществ, web -ориентированная версия имеет также ряд недостатков, которые требуют разработки специальных методов и подходов:
В настоящее время в среде Интернет доступна вторая версия программы, которая во многом является экспериментальной и содержит следующие функциональные возможности:
В дальнейшем в программе планируется добавить следующие функции:
Возможность генерации разнообразных анкет. В настоящей версии программы доступен лишь минимальный функционал – каждый эксперимент содержит список стимулов и в каждой анкете любой стимул встречается ровно один раз. В будущих версиях необходимо реализовать возможность генерации анкет, т.е. из общего списка стимулов в анкету должно попадать только заданное количество с указанной вероятностью появления. Планируется также ввести механизм ограничений, который позволяет сделать так, чтобы стимулы не встречались в экспериментах больше определенного количества раз.
Визуальные настройки отображения эксперимента. В новой версии планируется добавить следующие возможности визуальной настройки:
Учет пользователей и групп пользователей. В дальнейшем должна быть предусмотрена расширенная система полномочий, включающая авторизацию и аутентификацию пользователей. Как минимум, должны быть созданы и настроены следующие роли:
Развитый инструмент вывода результатов и статистических данных об экспериментах . В текущей версии система может только формировать статистику об относительной частоте реакций в разрезе экспериментов, но в будущем планируется реализация следующих отчетов, составляющих основу прямого и обратного ассоциативных словарей:
Все статистики могут быть представлены в разрезе одного или всех экспериментов с возможностью разбиения респондентов по различным критериям на группы (пол, возраст, сфера деятельности, родной язык и т.д.).
Методика фильтрации «шумов» в электронных АЭ Одним из важнейших факторов, от которых зависит валидность ассоциативного эксперимента (АЭ), является «уровень шума» в ответах респондентов. В общем случае под шумом следует понимать ответы на анкету, которые получены не по правилам эксперимента, или некорректно рассчитанные статистические показатели для группы участников. При проведении экспериментов через Интернет уровень шума существенно возрастает из-за меньшего контроля со стороны организаторов и наличия дополнительных возможностей у респондентов. В связи с этим важной задачей при создании АСНИ АЭ является разработка методов фильтрации (уменьшения и устранения) шумов. Все шумы можно разбить на две укрупненные группы. К первой из них относятся сознательно задаваемые респондентом неверные ответы, а ко второй — случайные факторы, вызванные ошибками и особенностями проведения АЭ. К случайным шумам можно отнести следующее:
«Сознательные шумы» зависят от целей, преследуемых респондентами, и условий (механизмов) ассоциативного эксперимента. Их условно можно разделить на следующие виды: Деструктивные цели, вызванные желанием навредить эксперименту и снизить его валидность. Они могут быть вызваны следующими причинами:
Методы фильтрации шумов можно условно разделить на три группы в зависимости от применимости на различных этапах проведения АЭ:
К первой группе относятся методы, которые направлены на устранение шумов и обеспечения валидности эксперимента за счет оригинальной организации процесса анкетирования и специальной подготовки исходных данных. Одной из наиболее сложных задач АЭ – ограничение влияния предшествующих в анкете стимула, реакции или их группы на последующие ответы. В настоящее время для этого широко используются методы случайной генерации последовательности стимулов в анкете. Они достаточно эффективно работают для частотных реакций общего характера, однако при проведении прикладных АЭ для исследования отдельных аспектов в рекламных целях или для тематического (например, анализа стимульного ряда «образа России») этого оказывается недостаточно. Компьютерная реализация позволяет расширить возможности организации ассоциативного эксперимента следующим образом:
Ко второй группе относятся методы и решения, которые определяют для интерактивных АЭ окружающее информационное пространство и функциональные возможности пользователя (респондента). Для борьбы с орфографическими ошибками можно использовать стандартные подходы шрифтового или цветового выделения ошибочных и неизвестных слов. Основным недостатком такого решения является необходимость использования (или даже разработки) специализированных орфографических модулей, спеллеров и т.д. Дополнительную сложность представляет значительный объем соответствующих программных модулей и баз данных, который не позволяет осуществлять проверку данных на компьютере клиента и требует передачи данных на сервер, что приводит к дополнительным временным затратам. В качестве альтернативы или дополнения можно использовать списковые элементы компьютерного интерфейса ( ListBox , ComboBox и др.), которые позволяют выбирать ответы из раскрывающегося списка и автоматически фильтровать возможные варианты с учетом набранных первых букв слова. Недостатком такого метода является потенциальная опасность «программирования» возможных ответов, сужая их визуальным рядом, простой и скоростью выбора. Для борьбы с омонимией слов необходимо предусмотреть специальные механизмы уточнения семантики стимулов и реакций. В первом случае (для стимулов) можно воспользоваться дополнительными пояснениями, представленными в виде текстового сообщения или графического образа. Во втором случае (для реакций) нужно в информационной системе интерактивного АЭ реализовать возможность ввода пояснений. Более сложным решением является предварительное составление списков слов с возможной омонимией и реализацией возможности ввода или выбора соответствующего значения на экранной форме. Основными недостатками описанных решений являются:
Одним из вариантов решения проблем омонимии – проведение специальных АЭ, результаты которых можно использовать для уточнения данных более общих исследований. Частой проблемой проведения АЭ является различие времени реакции респондентов. При анкетировании группы людей и нормировании среднего времени ответа это приводит к тому, что отдельные участники опроса не успевают давать ответы. Актуальна и обратная ситуация, когда избыток времени приводит к формированию вторичных ассоциаций, нарушая цели и методику проведения эксперимента. В рамках компьютерного эксперимента можно частично решить эту проблему за счет предварительной персональной настройки эксперимента для каждого респондента. Для этого необходимо разработать тестовый ряд стимулов или специальные задания для проверки скорости реакции. Использование компьютерного АЭ позволяет вести учет времени ответов, а в последующем с помощью статистических методов осуществлять выявление аномалий и фильтрации шумов. Организация эксперимента в компьютерной среде (в сети Интернет) создает дополнительные сложности, связанные с различной степенью компьютерной компетентности респондента, средств коммуникации (ноутбук, КПК, телефон и т.д.), пропускной способности канала связи, возможностью параллельной работы над другими задачами, неконтролируемыми внешними факторами (фоновые музыка, видеоряд и т.д.). Некоторые параметры среды можно определить автоматически (скорость соединения, тип программного средства и т.д.) и учитывать в последующем, но часть характеристик пользователь должен указать самостоятельно при настройке своего профиля. Чтобы уменьшить количество отвлекающих факторов можно предложить соответствующие эргономические (размер экранных форм) и программные решения (например, фоновый звук нейтрального характера). Вместе с тем следует более разносторонне отнестись к задаче устранения внешних факторов, т.к. это может привести к созданию искусственных лабораторных условий эксперимента, которые не встречаются в реальной жизни респондента. Как следствие результаты эксперимента могут оказаться оторванными от действительности и не отражать реальную ассоциативно-вербальную сеть.
Третья группа методов фильтрации шумов направлена на использование уже полученных результатов ассоциативных экспериментов. Эти методы в первую очередь направлены на фильтрацию статистических отклонений, вызванных теми или иными причинами. Одной из наиболее распространенных задач агрегирования результатов АЭ является подсчет частотности ассоциаций для различных групп, сформированных по половозрастному, географическому, профессиональному или другому принципу. При выполнении подсчетов возникают две основные трудности: экстраполяция частотных характеристик на основе малого числа опрошенных респондентов в конкретной группе и неравномерное количество представителей различных групп. Для решения этих проблем необходимо изучение динамики изменений свойств ассоциативного поля при увеличении количества опрашиваемых. Исследования, проведенные Черкасовой Г.А., показали, что частотность реакций в ассоциативных экспериментах подчиняется гиперболическому закону, близкому по своим характеристикам к закону Ципфа и Мандельброта. Это означает, что использование простых масштабирующих коэффициентов в общем случае недопустимо. Подводя итог, можно отметить большое разнообразие шумов и методов их фильтрации. Для их эффективного использования требуется разработка специальной методики, которая учитывает особенности конкретного ассоциативного эксперимента. Предлагаемая методика построена по модульному принципу, т.е. подразумевает контекстное использование предложенных методов фильтрации, и включает следующие основные этапы:
Разработки ведутся при поддержке гранта РГНФ № 06-04-03803в «АСНИ динамики ассоциативно-вербальной модели языкового сознания русских как индикатора образа России в новейшей истории и современности» в рамках конкурса 2006-8 гг. «Образ России в современном мире» Основная страница АСНИ АЭ в Интернет находится по адресу http://www.philippovich.ru/Projects/ASIS/ К аудиальным аспектам можно отнести использование в рамках АЭ живой речи, мелодий, звуков, фоновой музыки, а также наработок в области фоносемантического анализа. Черкасова Г.А. Исследования статистических характеристик ассоциативных словарей // Языковая личность: текст, словарь, образ мира. К 70-летию чл.-корр. РАН Юрия Николаевича Караулова: Сб. статей. - М.: Изд-во РУДН, 2006. С. 378-388.]
|
|||||||||||||||||||
© НОК CLAIM, 2006-2012. Замечания, вопросы и сведения об ошибках просим сообщать в форуме или присылать администратору сайта. |
|