|
Проект РГНФ (№12-04-12039)
Информационная система когнитивных экспериментов (ИСКЭ)
Information system for cognitive experiments
Научные проблемы, решаемые в рамках проекта
Проект направлен на решение фундаментальной проблемы, касающейся нескольких смежных научных дисциплин (когнитивной лингвистики, компьютерной лингвистики, когнитивной психологии, психолингвистики, культурологии, социологии) – проблемы типологии знаний, их объема, качества, оперирования ими в масштабе русской языковой личности и построения экспериментальной программируемой компьютерной системы, моделирующей механизмы работы языкового сознания.
Сфера использования проекта — это учебные и научные институты филологического и технического (специальности: информатика и вычислительная техника, информационные системы и технологии) профиля Министерства образования и науки РФ и РАН, Институт русского языка им. В.В.Виноградова, ИЯ РАН, МГЛУ, МГТУ им. Н.Э.Баумана, МГУП им. Ивана Федорова. Круг пользователей — отечественные и зарубежные исследователи, изучающие вербальное сознание носителя русского языка-культуры, филологи, лексикографы, преподаватели, аспиранты, студенты, разработчики новых информационных технологий и средств человеко-машинного коммуникативного взаимодействия, информационно-поисковых, справочных, обучающих систем.
Содержание проекта
Конкретная задача, которая решается проектом в рамках названной проблемы, – построение информационной системы для поддержки эмпирических исследований (условное название — Информационная система когнитивных экспериментов — ИСКЭ) и теоретической разработки вопроса о типах знания, выделение в их числе минимальной единицы знания (когнемы), более крупных единиц (концептов), использование понятий живые знания, остаточные знания, обязательные знания (рецепт), факультативные знания (ретушь), личностное знание, потенциальное знание, профессиональные знания, лингвокультурные знания. Последнее задает ограничения содержательного плана, поскольку фактический материал исследования поставляется массовым экспериментом с носителями языка-культуры в условиях использования ими языка обиходно-повседневного общения. Построение ИСКЭ позволяет установить размерности языкового сознания. Объем усредненного личностного знания определяется также экспериментально: показателем уровня насыщения базы знаний является прекращение появления новых когнем в материалах опроса испытуемых. Предположительное количество записей в базе, отражающее усредненный объем личностного знания, должно достигать тридцати тысяч.
Качество знаний языковой личности устанавливается на основе: а) разнообразия предметных областей действительности, к которым они относятся; б) соотношения в их числе обязательных и факультативных.
В ИСКЭ моделируются процессы оперирования в ходе эксперимента знаниями со стороны языковой личности, включая следующие шаги:
- Установление когнемы на основе заданного смысла;
- Построение ассоциативной цепочки для данной когнемы на основе ассоциативно-вербальной сети.
- Перестройка цепочки в пропозицию.
- Преобразование пропозиции в дискурс.
- Квалификация эквивалентности – полной или асимметричной – между исходной формулой смысла и итоговым дискурсом.
Прикладные аспекты использования ИСКЭ охватывают круг задач, связанных с модернизацией приемов поиска информации, организацией на новых основаниях контроля профессиональных знаний, а также с проблемами обучения русскому языку и культуре иноязычных пользователей. Устройство самой ИСКЭ конструируется изоморфно структуре минимальной единицы знания, что и позволяет найти возможность согласования принципов оперирования сетевыми структурами, в которых существуют минимальные единицы знания, со структурами координатно-иерархическими, относящимися к концептуальному уровню. Программно-моделирующая подсистема ИСКЭ (когнайзер) состоит из пяти компонентов, выполняющих следующие когнитивные функции: смысловую, которая оформляется как гипертекст; операционную, содержащую перечень способов задания смысла, которыми пользуется русская языковая личность; знаковую, которая охватывает всю совокупность установленных в эксперименте когнем; предметную, переводящую зафиксированное элементарное знание на концептуальный уровень; и качественно-оценочную, устанавливающую релевантность/нерелевантность (обязательность/факультативность) конкретной когнитивной единицы для языковой личности. При построении когнайзера в качестве инструментария исследования различных размерностей языкового сознания, так же как и его содержательных характеристик предполагается использовать три типа компьютерных моделей: формально-логические, нейросетевые и эволюционные.
Методы и подходы
Программный комплекс ИСКЭ ориентирован на использование стандартного пользовательского интерфейса и исполнение на персональном компьютере пользователя. В качестве архитектуры выбрана двухуровневая клиент-серверная технология. Создание программного комплекса предлагается с использованием кросс-платформенных, свободно-распространяемых программных средств и компонентов:
- Платформа реализации прикладного программного обеспечения Java SE 6.0;
- Интегрированная среда разработки NetBeans IDE 6.9;
- Реляционная СУБД PostgreSQL 8.4
- Дополнительные компоненты: XStream – сериализация данных в XML; Graphviz – визуализация графов ; Guava – библиотека динамических структур данных с быстрым доступом; Apache Common Math – библиотека математических функций, матричные операции и статистическая обработка.
В числе используемых методов предлагаются новые, которые касаются и теоретического и экспериментального подходов. В теоретическом плане это перенесенный на когнитивную проблематику метод лингвистического конструирования, который предполагает создание нового исследовательского объекта, обладающего свойствами изучаемой реальности, и возможность проводить исследования на этом новом объекте, так сказать в лабораторных условиях. Разработанный авторами метод осознавания позволяет путем последовательности формальных процедур устанавливать эквивалентность или ее отсутствие у двух разных способов выражения одного и того же содержания – при порождении и при понимании смысла. Алгоритмизация этих процедур позволяет разработать программу для компьютерной реализации осознавания. В целом методология, применяемая к разработке теоретических проблем в проекте, как и технология проведения массового лонгитюдного эксперимента, обработка и интерпретация его результатов не имеют аналогов в отечественной и мировой науке.
Разработка ИСКЭ
- Интеграция ранее разработанных макетных версий компонентов ИСКЭ, доведение их пользовательских характеристик до эксплуатационного уровня.
- Интеграция базы данных ИСКЭ с лексикографическими базами (словарями синонимов, антонимов и др.)
- Расширение базы знаний лингвокультурного тезауруса (компонента ИСКЭ) до 30000 уникальных когнем.
- Программная (компьютерная) реализация моделей функционирования языкового сознания.
- Экспериментальные исследования эффективности вариантов программной реализации моделей.
- Адаптация программных реализаций моделей языкового сознания в обучающие системы.
Теоретические исследования с использованием ИСКЭ
- Теоретическая разработка на основе иерархии <когнема-концепт-суперконцепт-концептосфера> типологии знаний. Операциональная разработка понятий: живые знания, остаточные знания, обязательные знания (рецепт), факультативные знания (ретушь), личностное знание, потенциальное знание, профессиональные знания, лингвокультурные знания.
- Формализованное описание функционирования инструментального средства компьютерного моделирования языкового сознания, включающее в себя:
- формально-логическое описание (на основе синкопированных алгебраических выражений) ассоциативных отношений вербальных единиц смыслопорождающей (стимульно-реактивной) компоненты языкового сознания — формально-логическая модель;
- описание генетических алгоритмов знакопорождения в ассоциативно-вербальной сети — эволюционная модель;
- описание знакопорождающей компоненты языкового сознания, как процедуры настройки (обучения) нейросетевой модели ассоциативно-вербальной сети — нейросетевая модель.
- Сравнительный анализ моделей. Динамические исследования размерностей моделей:
- компонентные квантитативные исследования изменения содержания когнем, концептов, суперконцептов и концептосфер;
- структурные исследования смысло- и знако-порождающей способностей (возможностей) моделей типов знания (обязательного, факультативного, потенциального, остаточного, личностного и др.).
Список публикаций
2011
- И.В. Ружицкий. От символической картины мира к тезаурусу (о возможности реконструирования языковой личности Достоевского) // Материалы I Международной научно-практической интернет-конференции «Русский язык@Литература@Культура: актуальные проблемы изучения и преподавания в России и за рубежом». 5–12 октября, 23–7 декабря 2009 г. – 0,3 п. л.
- Е.А. Выломова. Ассоциативный эксперимент и вербальное сознание человека. // Сборник тезисов докладов общеуниверситетской конференции "Студенческая научная весна - 2011". Том XI, Часть 2, М.:Изд-во МГТУ им. Н.Э.Баумана.
2010
- А.В. Сиренко. Информационная технология анализа результатов ассоциативных экспериментов: переход от веб-ориентированной к локальной информационной системе. / Жизнь языка в культуре и социуме. Материалы конференции. Москва,14-15 апреля 2010 г. // Ред.коллегия: Е.Ф.Тарасов (отв.ред.) Н.В.Уфимцева, В.П.Синячкин, О.В.Балясникова, Д.В.Маховиков. — М.: Издательство "Эйдос", 2010. — С.118-119.
- A. Panchenko. Could We Automatically Reproduce Semantic Relations of an Information Retrieval Thesaurus? // In the proceedings of RuSSIR 2010.
- А.И. Панченко. Построение информационно-поискового тезауруса из корпуса текстов предметной области.// Жизнь языка в культуре и социуме. Материалы конференции. Москва,14-15 апреля 2010 г. // Ред.коллегия: Е.Ф.Тарасов (отв.ред.) Н.В.Уфимцева, В.П.Синячкин, О.В.Балясникова, Д.В.Маховиков. — М.: Издательство "Эйдос", 2010. — С.113-114.
- Ю.Н. Филиппович. Анализ текста и ассоциативно-вербальная сеть // Жизнь языка в культуре и социуме. Материалы конференции. Москва,14-15 апреля 2010 г.// Ред.коллегия: Е.Ф.Тарасов (отв.ред.) Н.В.Уфимцева, В.П.Синячкин, О.В.Балясникова, Д.В.Маховиков. — М.: Изд. "Эйдос", 2010. — С.243-245.
- А.А. Проскурнин, Ю.Н. Филиппович. Методы представления, автоматизированного выявления и анализа декларативных знаний человека о предметной области в компьютерных системах контроля знаний // Проблемы полиграфии и издательского дела. – 2010. – № 2. – С. 71-78.
- Г.А. Черкасова. Исследование ядра ассоциативно-вербальной сети русского ассоциативного тезауруса // Жизнь языка в культуре и социуме. Материалы конференции. Москва,14-15 апреля 2010 г. — М.: Изд. "Эйдос", 2010. — С.246-249с.
- И.В. Ружицкий. Лингводидактические аспекты концепции языковой личности // Материалы Всероссийской научно-практической конференции «Словесник. Учитель. Личность» 29 ноября 2009 года г. Чебоксары. Чебоксары: Чуваш. гос. пед. ун-т, 2010. – С. 12–18.
2009
- Ю.Н. Караулов, Ю.Н. Филиппович. Лингвокультурное сознание русской языковой личности. Моделирование состояния и функционирования. – М., 2009: Издательский центр «Азбуковник». –336 c.
- А.А. Проскурнин, Ю.Н. Филиппович. Структурный анализ персональных знаний с использованием системы нечеткого логического вывода// Научная школа для молодых ученых "Компьютерная графика и математическое моделирование (visual computing)": тезисы и доклады. М.-2009 г.
- А.В. Сиренко. Алгоритмы поиска в ассоциативно-вербальных сетях психолингвистических экспериментов// Научная школа для молодых ученых "Компьютерная графика и математическое моделирование (Visual Computing)": тезисы и доклады. М.-2009 г.
- И.В. Ружицкий. Россия и русские в восприятии инокультурной языковой личности: к проекту создания словаря гештальтов // МОВА І КУЛЬТУРА. (Науковий журнал). Киев, Видавничий Дім Дмитра Бураго, 2009. Вып. 11. Т. XIII (125). – С. 129–135.
- И.В. Ружицкий. От символической картины мира к тезаурусу (о возможности реконструирования языковой личности Достоевского) // Материалы I Международной научно-практической интернет-конференции «Русский язык@Литература@Культура: актуальные проблемы изучения и преподавания в России и за рубежом». 5–12 октября, 23–7 декабря 2009 г. – 0,3 п. л.
2008
- Ю.Н. Караулов. Три концептосферы русского языкового сознания и три «реальности» мира // Русский язык и культура в формировании единого социокультурного пространства России. Санкт- Петербург , 2008, стр.307 – 317.
- Ю.Н. Караулов. Современные источники формирования русской языковой личности // Пятый межвузовский семинар по лингвострановедению. Часть 1. Языки в аспекте лингвострановедения. Москва, 2008 С.9-27.
- Ю.Н. Караулов. Когнитивная лингвистика и сетевая организация языкового сознания // IV Международная научная конференция «Русский язык в языковом и культурном пространстве Европы и мира: Человек. Сознание. Коммуникация. Интернет». Варшава, 2008. С.93.
- Ю.Н. Караулов. Языковая личность в когнитивной перспективе // Актуальные проблемы русского языка и методики его преподавания. М., 2008, стр.17 – 31.
- И.В. Ружицкий. Презумпция негативной оценки в восприятии России и русских инокультурной языковой личностью // Русское слово в русском мире 2008: Россия и русские в восприятии инокультурной языковой личности / Под ред. И.В. Ружицкого, Ю.Н. Караулова, О.В. Евтушенко. М.: ЦП «Васиздаст», 2008. – С 5–21; 196–229 / 14,5 п.л.
- И.В. Ружицкий. Презумпция негативной оценки в восприятии России и русских инокультурной языковой личностью // Русское слово в русском мире 2008: Россия и русские в восприятии инокультурной языковой личности / Под ред. И.В. Ружицкого, Ю.Н. Караулова, О.В. Евтушенко. М.: ЦП «Васиздаст», 2008. – С 5–21; 196–229 / 14,5 п.л.
2007
- Ю.Н. Филиппович. Моделирование языкового сознания // Интеллектуальные технологии и системы. Сборник учебно-методических работ и статей аспирантов и студентов. Выпуск 9 / Сост. и ред. Ю.Н.Филипповича. — М.: Изд-во НОК CLAIM, 2007.— C.7-36.
- Ю.Н. Филиппович. Моделирование работы лингвокультурного когнайзера русского языка // Вопросы психолингвистики, 2007, № 6, С. 123-143.
- А.И. Панченко. Инструментальное средство для анализа ассоциативных сетей // Интеллектуальные технологии и системы. Сборник учебно-методических работ и статей аспирантов и студентов. Выпуск 9 / Сост. и ред. Ю.Н.Филипповича. — М.: Изд-во НОК CLAIM, 2007. — C.169-204.
- А.В. Сиренко. Лингвокультурный тезаурус русского языка // Интеллектуальные технологии и системы. Сборник статей аспирантов и студентов. Выпуск 9 // Сост. и ред. Ю.Н. Филипповича. М.: Изд-во НОК CLAIM, 2007..— C.264-277.
2006
- Ю.Н. Филиппович. Аспекты информационной технологии когнитивного эксперимента создания лингвокультурного тезауруса // Интеллектуальные технологии и системы. Сборник учебно-методических работ и статей аспирантов и студентов. Вып. 8 // Сост. и ред. Ю.Н.Филипповича. — М.: Изд-во НОК CLAIM, 2006.— C.7-32.
- Ю.Н. Филиппович. Ассоциативные алгебраические выражения вербальных формул смысла. // Речевая деятельность. Языковое сознание. Общающиеся личности. XV Международный симпозиум по психолингвистике и теории коммуникации. Тезисы докладов. Москва, 30 мая – 2 июня 2006 г. — Калуга: ИП Кошелев А.Б. (Издательство «Эйдос»), 2006. С. 312–314.
- Ю.Н. Филиппович. Эскиз информационной технологии лингвокультурного тезауруса // Язык. Сознание. Культура. Сборник статей / Под ред. Н.В.Уфимцевой, Т.Н.Ушаковой. — М.– Калуга: ИП Кошелев А.Б. (Издательство «Эйдос»), 2006.— С. 319–334.
- А.В. Сиренко. База данных лингвокультурного тезауруса русского языка / Интеллектуальные технологии и системы. Сборник учебно-методических работ и статей аспирантов и студентов. Выпуск 8 // Сост. и ред. Ю.Н.Филипповича. — М.: Изд-во НОК CLAIM, 2006.— C.268-278.
|