Анализ потребности в специалистах
по компьютерной лингвистике и семиотике
Традиционный подход к оценке потребностей в специалистах состоит в организации
опроса промышленных организаций и статистической обработки полученных результатов.
Теоретически данный метод состоятелен, апробирован на различных уровнях государственного
и корпоративного управления как в промышленности (шире - в народном хозяйстве),
так и в системе образования на преподавательском и управленческом уровнях. Данные
опроса могут быть уточнены оценками востребованности (пожеланиями, предположениями
и фактическими ощущениями) студентов и выпускников. Существенные поправки в
оценки потребностей вносят различные мероприятия типа "Ярмарок вакансий",
"Дни открытых дверей на предприятиях", другие рекламные акции и агитационные
мероприятия, а также конкретные "приглашения на работу" в форме газетных
и настенных объявлений, адресных рассылок и т.п. Из результатов этих кампаний
логически выводятся потенциальные потребности в специалистах и динамика их изменений.
В целом традиционная система оценок потребности в специалистах инструментально
эффективна и оправдана, обладает большим числом достоинств и восприимчива к
нововведениям, структурным и содержательным изменениям, как в промышленности,
так и в образовании. Однако ее использование в проводимой НИР оказалось ограниченной
по следующим причинам:
во-первых, ресурсные (временные, организационные, материальные) ограничения
не позволили провести репрезентативные исследования традиционными методами опроса
и контент-анализа, поэтому были исследованы лишь характерные случаи востребованности
специалистов;
во-вторых, предлагаемая специальность "Компьютерная лингвистика и семиотика"
относится к впервые осознаваемым и в большей степени потенциальным потребностям
промышленности обработки данных, в связи с чем, оценки потребности носят предположительный
характер;
в-третьих, в рамках проводимой НИР не удалось разработать эффективный инструментарий
опроса, позволяющий сделать наиболее заметными (узнаваемыми) знания, навыки
и умения специалистов по компьютерной лингвистике и семиотике в сравнении с
теми их возможностями, которые органически унаследованы от других специальностей
направления 654600.
Из традиционных методов оценки потребности в специалистах были использованы:
а) оценки возможных запросов на подготовку специалистов для проведения НИОКР
в нескольких организациях (ГУФП Российский НИИ "Космического приборостроения",
Института авиационной и космической медицины МО РФ, ГУФП "Центральный научно-исследовательский
институт комплексной автоматизации", Института русского языка им.В.В.Виноградова
РАН, Институт языкознания РАН);
б) анализ приглашений на работу и содержательных требований к специалистам по
газетным публикациям, частным и корпоративным предложениям, "ярмаркам вакансий"
в МГТУ им.Н.Э.Баумана и МГУП;
в) оценки потенциальных способностей выпускников различных курсов подготовки
и переподготовки кадров на примере двух вузов - МГТУ им.Н.Э.Баумана и МГУП;
Основные результаты анализа потребности в специалистах по компьютерной лингвистике
и семиотике, полученные традиционными методами следующие:
1. Практически все ведущиеся и перспективные НИОКР в традиционно "компьютерных"
подразделениях перечисленных выше организаций, ориентированы на разработку в
числе других задач: а) информационных технологий и конкретных систем взаимодействия
пользователей-заказчиков с программной продукцией в специальных естественно-языковых
и знаковых формах общения; б) лингвистического обеспечения и, прежде всего,
специальных языков; в) на исследование естественно-языкового (текстового) описания
предметной области; г) разработку и написание технической (пользовательской)
документации и help-систем. При этом предполагается выделение этих задач в деятельность
специальных подразделений, групп или отдельных исполнителей без совмещения с
другими обязанностями. Общая ориентировочная потребность составляет для этих
организаций до 10-ти чел. на три года (РНИИКП - 2-3 чел., ИАКМ - 2 чел., ЦНИИКА
- 2 чел., ИРЯ РАН - 1 чел., ИЯ РАН - 1 чел.) на контрактной основе из расчета
полной занятости и конкуренции на рынке труда государственных организаций.
2. В рамках исследований настоящей НИР были проанализированы 360 предложений
работы в компьютерных фирмах промышленности обработки данных региона Москвы.
Из них: - более 50% содержали требования к профессиональным знаниям умениям
и навыкам, которыми обладают потенциальные специалисты по компьютерной лингвистике
и семиотике наряду с другими специалистами направления 654600 (знание формальных,
специальных и естественных языков, программных систем, конкретных информационных
технологий, знаний и навыков общения и поведения и др.); - 20% предложений включали
требования к приглашаемым на работу, ориентировавших выпускников специальностей
220100-220400 на дополнительное приобретение знаний и навыков, которые включены
в специальные дисциплины и дисциплины специализации "компьютерных лингвистов
и семиотиков". Можно условно считать, что потребность на 360 рабочих мест
в специалистах рассматриваемой специальности в регионе Москвы составляет 180
чел. - "без преимуществ в сравнении с другими специалистами", и 36
чел. - "с преимуществами…".
3. В трети всех учебных курсов, организованных в целях повышения квалификации
в МГТУ им.Н.Э.Баумана и МГУП 75% учебного времени уделено приобретению знаний
и навыков, относящихся к специальным дисциплинам рассматриваемой специальности.
При продолжительности курсов в среднем 6 недель расчетное годовое число слушателей
100-200 человек. Можно считать, что годовая потребность переподготовки кадров
по специальности соответствует этому количеству выпускников курсов.
При оценке потребности промышленности или всего народного хозяйства в специалистах,
обладающих определенным набором знаний, навыков и умений, важны представления
о перспективных инженерных разработках, которые могут оказаться результатом
их деятельности; приоритетных научных исследованиях или их направлениях; фантазийные
построения конкретных людей и ожидания общества, которые могут воплотиться в
реалии, благодаря науке и производству.
Инженерные разработки. Современное состояние инженерных разработок в областях
промышленности обработки данных и информационных технологий таково, что на стадии
тестирования в ведущих фирмах производителях компьютерных программ находятся
множество новых программных продуктов, предназначенных для существенного повышения
эффективности коммуникативного взаимодействия людей как непосредственно между
собой, так и посредством созданных для различных целей информационных моделей
их образов и знаний. Во всех случаях коммуникации речь идет о технической (аппаратно-программной)
реализации семиотических и лингвистических систем. Речевая спецификация взаимодействия
с вычислительной техникой требует информационных (словарно-тезаурусных) и программных
(лингвистическипроцессорных) решений для различных естественно-языковых культур,
претендующих на сохранение и существование на очередном эволюционном витке развития
человеческих коммуникаций. Имеющийся опыт человечества в использовании средств
коммуникации показывает, что, "перейдя Рубикон" - начав печатать свои
мысли и речь, оно обрекло на забвение многие языки и культуры. Отсутствие даже
некоторое время какого-либо языка по другую сторону новой пограничной реки -
представления мысли и речи в ЭВМ, может привести к еще более катастрофическим
результатам.
Вещь, какими бы обыденными или фантастическими свойствами она ни обладала, всегда
именуется ее создателем, и через имя свое становится доступной разуму других
людей. Никакие переводы или толкования не смогут более точно, чем на языке родителя
описать или объяснить суть созданной вещи. В настоящее время множество русскоязычных
лингвистических систем и технологий, конкретных продуктов промышленности обработки
данных созданы и предлагаются для использования и распространения, основываясь
на знаниях иностранных языков (английского языка). Адаптация этих средств для
русскоязычной языковой среды, создание русскоязычных баз знаний и полиязычных
информационных технологий, представляются прежде всего инженерными задачами.
Необходим инженерный корпус разработчиков и эксплуатационщиков языковых систем.
Оценка необходимого количества инженеров - не менее, чем количество компьютерных
лингвистов работающих в англоязычной языковой среде.
Научные исследования. Компьютерная лингвистика и семиотика - это разделы научного
направления "искусственный интеллект", которое представляет собой
комплекс современных научных методологий описания и моделирования интеллектуальной
деятельности человека, по обстоятельствам ставшего основой или центром интеграции
различных научных направлений изучения природы, человека и общества. "Кадровую
мощность" раздела научного направления возможно оценить непосредственно,
например по доли научных грантов как в России, так и за ее пределами. При этом
следует учитывать количество поддержанных заявок (это возможности) и поданных
(это потребности). Три основные научные области следует рассматривать для компьютерных
лингвистов и семиотиков в качестве поля действия: первое, современный язык (языки)
и культура; второе, история языка и культуры; третье, язык как система мышления.
В рамках первых двух областей специалистами исследователями должны быть обеспечены
практически все области лингвистики и филологии. Третья область - это комплексные
исследования на стыках нескольких наук: лингвистики, психологии, генетики и
др. Структура научных исследований может быть задана более подробно. Предлагается
ее определить путем вычленения направлений научной специальности "Теоретические
основы информатики" (05.13.17). Для МГТУ им.Н.Э.Баумана из опыта работы
можно предложить 2-3 аспиранта в год на инженерный выпуск до 50 человек. Таким
образом, количество подготавливаемых специалистов должно обеспечивать выбор
одного аспиранта из 15-25 человек, завершающих учебу в вузе.
Фантазийные построения. Научные прогнозы достижений человечества и научно-фантастические
и футуристические проекты позволяют в качестве первоочередных задач подготовки
специалистов назвать: познание эмпирических законов распознавания и синтеза
полисенсорных образов; построения эффективных систем перевода; создание глобальных
систем хранения и доступа к знаниям; создание языковых, музыкальных, литературных
и др. информационных фондов; построение виртуальных систем развлечения, научных
исследований, обучения и образования. Все эти проекты потребуют инженерного
и научного кадрового обеспечения, а также для эксплуатации и сопровождения результатов
их реализации. Необходимо накопить этот кадровый потенциал, путем формирования
потребности и интереса у молодежи в видах деятельности, сориентированной на
семиотические и лингвистические объекты.
В настоящее время наиболее реальной базой для фантазийных проектов являются
эмпирические исследования и наблюдения, проделанные в лингвистике и семиотике.
Наиболее вероятно, что в разработках лингвистических и семиотических изделий
будет доминировать словарно-тезаурусная компонента, реализованная на основе
современных концепций баз данных и перспективных ее обобщениях и уточнениях.
Это предопределяет трудоемкость работ и потребность в трудовых ресурсах. Можно
предположить, что вопросами лингвистического и семиотического конструирования
и эксплуатацией его объектов через 15-20 лет будет заниматься до 5% инженерного
потенциала общества.
Концепция подготовки специалистов
Предлагаемая концепция подготовки специалистов по компьютерной лингвистике и
семиотике основывается на ряде принципов, зарекомендовавших себя в практике
учебно-научной деятельности многих поколений преподавателей. Назовем те из них,
которые используются для построения и реализации ГОС и учебного плана предлагаемой
специальности.
Ориентация на основные научные направления. Данный принцип первый и главный.
Необходимо создать такую систему организации передачи знаний студентам, которая
представляла бы собой многоуровневую иерархическую систему поддержки выбранных
научных направлений. Предлагается ориентироваться на научную специальность "Теоретические
основы информатики" 05.13.17. Вся система организации изучаемых предметов
должна быть направлена на приобретение студентами знаний, навыков и умений,
которые способствовали бы появлению научных открытий, теорий и разработок. Система
подготовки должна строиться по принципу научной школы, ориентироваться на ученого-лидера
и его учеников-сподвижников. Необходимо организационно и методически для выбранных
научных направлений выстроить пирамиду идей, проектов, знаний, навыков, умений.
Первичной должна быть цель подготовки ученого, вторичная - инженера. Такая очередность
целей обусловлена, прежде всего, настоящим состоянием национальной промышленности
обработки данных.
Модульность. Предлагаемый образовательный стандарт представляет собой современную
модель знаний о реальном мире, той ее части, которая описывает предметную область
условно именуемую "Информатика и вычислительная техника". Вся система
знаний организована иерархически. Компонентами системы являются: элементы знаний
(конкретные понятия и наименования, умения, деятельностные приемы); модули знаний
(специальные понятия, технологии и навыки); дисциплины = базы знаний (системы
предметных понятий = предметные тезаурусы, типовые технологии и навыки); учебно-научные
комплексы = фонды знаний (понятийные картины мира = универсальные тезаурусы,
технологии, виды деятельности).
Инженерия широкого профиля. Данный принцип находит свое выражение в разнообразной
номенклатуре дисциплин, включенных в учебный план и областей приложения знаний
и навыков специалистов.
Концепция рабочих тетрадей. Этот принцип положен в основу организации самостоятельной
работы студентов. Ориентирует фиксацию его образовательной деятельности в виде
технологии овладения знаниями и навыками в утвержденной форме. Формула рабочей
тетради имеет следующий вид:
{комплект рабочих тетрадей
{рабочая тетрадь по дисциплине (=типовая технология)
{занятие (=процедура) - название, цель (=приобретение практического навыка),
список задач, результат (=форма отчетности и способ оценивания), контрольные
задачи-варианты,
{задача (=операция) - формулировка (=сделать…, выполнить…, решить…), последовательность
деятельности, результат (=форма отчетности и способ оценивания),
{задание (=прием, навык) - формулировка (=сделать…, выполнить…, решить…), пример
выполнения (=условия, действия, результат), контрольные задания-варианты}}}}}.
Деятельностная оценка знаний, навыков и умений. Принцип предполагает оценку
знаний, навыков и умений по результатам деятельности, на основе рабочих тетрадей,
а также участия студентов в аудиторной работе. Трудоемкость и временные затраты
на учебный труд являются основными критериями в оценке знаний. Достижение заранее
специфицированного результата в заданный период времени является основанием
для наивысших качественных оценок. Предлагается рейтинговая или бальная оценка,
сочетающая количественные и качественные шкалы. Правила оценивания должны быть
зафиксированы на начальном периоде обучения, и сохраняться до его завершения.
Максимально возможное количество набранных баллов должно значительно (на 30-50%)
превышать количество баллов, необходимых для наивысшей качественной оценки.
Тестовый контроль знаний, навыков и умений. Данный принцип контроля предлагается
использовать только как средство самообучения и самоконтроля, а также как средство
выявления типовых показателей обучающихся, или для формирования типовых реакций
и решений.
Перманентная диахроническая переподготовка. В процессе срока обучения необходимо
освоение нескольких поколений идей, систем знаний, технических (аппаратных и
программных) средств. Специалист должен приобрести навыки и умения работы не
только на новых и новейших системах, но и на устаревших и изношенных. Понимание
исторической преемственности идей и их реализаций является основанием для формирования
потребности в получении нового знания и обновления старого. Отсутствие исторического
знания в технике сдерживает процессы творения истории, т.е. созидания новых
технических решений.
Социальная и профессиональная ориентация. Содержание учебного процесса должно
учитывать индивидуальную социальную и профессиональную привязку обучаемых. Это
должно находить выражение в ориентации индивидуальных заданий студентам на соответствующие
предметные области и типовую деятельность членов конкретных социальных групп.
Индивидуальность образовательной траектории - компромисс способности студентов
и возможности образовательных технологий. Учет индивидуальных учебных способностей
студентов находит выражение в предлагаемом ГОС в следующих формах: во-первых,
ГОС представляет собой минимальный набор требований к подготовке специалистов,
предложенные в отчете и настоящей статье программы учебных дисциплин содержательно
существенно шире их кратких описаний; во-вторых, ГОС содержит вариативную составляющую
курсов по выбору и факультативов, которые представлены в двух-трех вариантах;
в-третьих, в ГОС предложены дополнительные дисциплины.