Компьютерная Лингвистика

 

Виды учебных работ

Объем работ, час

 

Всего

Выделено на дисциплину

86

Аудиторная работа

50

Лекции

34

Семинары

16

Самостоятельная работа

35

домашнее задание

10 (14)

самостоятельная проработка курса

и подготовка к контрольным работам

25

Виды отчетности по дисциплине

 

рубежный контроль

 

(в том числе)      № 1.  РК1 (8)

 

                             № 2.  РК2 (12)

 

зачет

зач

экзамен

экз

В скобках указаны недели выполнения работ по учебному графику

 

Раздел 1. Цели и задачи дисциплины.

Целью изучения дисциплины является приобретение знаний о составе и структуре лингвистического обеспечения современных АСОИУ, а также методах и приемах его проектирования.

В результате изучения материала данной дисциплины студенты должны:

Знать: состав и структуру лингвистического обеспечения современных АСОИУ; классификацию и основные характеристики систем коммуникативного взаимодействия; состав профессиональных знаний о ЕЯ, методы проектирования компонент лингвистического обеспечения АСОИУ; состав и структуру современных информационных систем и машин поиска; методы автоматического индексирования и реферирования информации; интеграции формальных моделей представления знаний.

Уметь: разрабатывать компоненты лингвистического обеспечения АСОИУ; использовать программные и информационные средства компьютерной лингвистики для проектирования и разработки лингвистического обеспечения АСОИУ; использовать информационные системы и поисковые машины.

Иметь навыки: использования естественного языка для формирования (выражения) информационных потребностей для работы в Internet.

Иметь представление: о математических методах и моделях прикладной лингвистики, современном ее состоянии и тенденциях развития, в том числе о палеографии, шрифтографии, текстологии, лексикографии и лексикологии, фонетики, лингвогеографии и диалектологии.

Данная дисциплина базируется на всех ранее прочитанных учебных курсах.

 

Раздел 2. Содержание дисциплины.

Лекции (34 часа)

Компьютерная лингвистика. (8 часов) Математические методы и модели прикладной лингвистики (классификация). Области использования: палеография, рукописное письмо, скоропись, шрифтография, текстология, лексикография и лексикология, экспериментальная фонетика, лингвогеография и диалектология, издательское дело и редактирование.

Лингвистическое обеспечение. (10 часов) Определение ГОСТ. Структура и состав ЛО ИС. Информационные и программные средства ЛО. Организация лингвистического обеспечения в ИС. Цикл редакционно-издательской подготовки технических документов: редактирование (научное, литературное), корректурные процессы, макетирование и верстка.

Средства компьютерной лингвистики. (16 часов) Конструкторы шрифтов и специальных знаковых элементов. Математические методы и программы оптического распознавания печатных и рукописных текстов. Лингвистические компоненты текстовых процессоров: встроенные словари; программы автоматического переноса слов; орфографические, синтаксические и стилистические редакторы. Электронные словари. Обучающие лингвистические системы. Системы автоматического перевода.

 

Pаздел 3. Aудитopный и внeaудитopный пpaктикум.

3.A. Aудитopный пpaктикум

Лабораторные занятия (16 часов).

Занятие 1-3.   Исследование текстовых процессоров.

Занятие 4-6.   Распознавание текстов.

Занятие 7-8.   Исследование систем автоматического перевода.

3.Б. Bнeaудитopный пpaктикум.

Самостоятельная работа.

3.Б.1. Проработка материалов лекций и практических занятий. Результаты самостоятельной работы должны быть оформлены в виде конспекта в рабочей тетради.

3.Б.2. Домашнее задание.

 

Раздел 4. Учебно-методические материалы по дисциплине.

4.1. Литература.

а) Основная литература

Ю.Филиппович, А.Филиппович. Компьютерная лингвистика. М.: МГУП, 2002.— книга в комплекте с CD ROM. — проект.

А. Соломоник. Семиотика и лингвистика. М.: Молодая гвардия, 1995.

Ю.И.Шемакин. Начала компьютерной лингвистики. М.: Изд.-во МГОУ АО «Роснаука», 1992.

Организация Взаимодействия человека с техническими средствами АСУ. В 7 кн. Кн.2. Языковые средства взаимодействия человека с ЭВМ. Практическое пособие/ Ю.Н.Филиппович, Е. В.Родионов, Г.А.Черкасова; Под ред. В.Н.Четверикова. - М.: Высш.шк.,1990.

Э.В.Попов. Общение с ЭВМ на естественном языке. М.: Наука, 1982.

 

б) Дополнительная литература

Электронные учебные пособия CD ROM:

Ю.Филиппович. Компьютерная лингвистика — учебно-методический комплекс.М.: МГУП, 2000.— CD ROM издание.

Ю.Филиппович. Метафоры информационных технологий: анализ статей компьютерных журналов. / Серия «Компьютерная лингвистика». Вступ. Статья Ю.Н.Караулова. М.: МГУП, 2002.— книга в комплекте с CD ROM.

Ю.Филиппович, Г.Черкасова, Д.Дельфт, Ассоциации информационных технологий: эксперимент на русском и французском языках. / Серия «Компьютерная лингвистика». Вступ. Статья Н.В.Уфимцевой. М.: МГУП, 2002.— книга в комплекте с CD ROM.

Ю.Филиппович, А.Прохоров. Семантика информационных технологий: опыты словарно-тезаурусного описания. / Серия «Компьютерная лингвистика». Вступ. Статья А.И.Новикова. М.: МГУП, 2002.— книга в комплекте с CD ROM.

Ю.Филиппович, А.Филиппович. Электронный Указатель источников Древнерусской рукописной картотеки и Словаря русского языка XI–XVII вв. . / Серия «Компьютерная лингвистика». М.: МГУП, 2002.— книга в комплекте с CD ROM.

 

4.2 Средства обеспечения освоения дисциплины

Программные пакеты:

OCR-системы (FineReader и др.);

конструкторы шрифтов (Fontographer 4.0 и др.);

программы автоматического перевода;

MS Office: MS Word 2000;

Специальное информационное и программное обеспечение:

- Интерлекс, DIALEX, LemmaLex, Andrew Tools,..

дополнительный справочный материал  переводные и толковые словари по соответствующей ПО (вычислительная техника, базы данных и др.  существующие как в виде полиграфических изданий, так и в виде электронных версий, например, КОНТЕКСТ — фирма ИНФОРМАТИК,  STYLUS LINGUA COLLECTION — фирма STYLUS) и др.

 

Раздел 5. Материально – техническое обеспечение дисциплины

Практические занятия должны проводиться в специализированной аудитории, оснащенной современными персональными компьютерами и программным обеспечением в соответствии с тематикой изучаемого материала. Число рабочих мест в аудитории должно быть таким, чтобы обеспечивалась индивидуальная работа студента на отдельном персональном компьютере. Аудитория также должна быть оснащенной современным компьютером с подключенным к нему проектором с видеотерминала на настенный экран, или иным аналогичным по функциональному назначению оборудованием.

 

Вопросы рейтингового контроля знаний студентов

по дисциплине "Компьютерная лингвистика"

Лингвистическое обеспечение ИС.

Определение ЛО по ГОСТ.

Структура и состав ЛО ИС.

Информационные и программные средства ЛО.

Организация лингвистического обеспечения в ИС.

Редакционно-издательская подготовка документов ИС.

Цикл редакционно-издательской подготовки документов ИС.

Редактирование (научное, литературное).

Корректурные процессы.

Макетирование.

Верстка.

Компьютерная лингвистика.

Классификация матметодов и моделей прикладной лингвистики.

Палеография.

Рукописное письмо.

Скоропись.

Шрифтография.

Лексикография. 

Текстология.

Лексикография.

Лексикология.

Экспериментальная фонетика.

Лингвогеография.

Диалектология.

Средства компьютерной лингвистики.

Конструкторы шрифтов и специальных знаковых элементов.

Математические методы и программы оптического распознавания печатных и рукописных текстов.

Лингвистические компоненты текстовых процессоров.

Встроенные словари.

Программы автоматического переноса слов.

Орфографические редакторы.

Синтаксические и стилистические редакторы.

Электронные словари.

Обучающие лингвистические системы.

Системы автоматического перевода.

 

Домашнее задание

 

Цель задания:

Приобретение практических навыков разработки материалов представления и рекламы информационно-программного изделия.

Задачи задания:

1. Анализ использования тропов в научно-технических текстах (статьях "компьютерного журнала").

2. Анализ использования тропов в рекламе аппаратных и программных средств вычислительной техники.

3. Разработка модели метафорического описания аппаратного или программного средства (изделия) вычислительной техники.

4. Разработка рекламного текста для информационно-программного изделия.

5. Анализ использования  идиом в научно-технических текстах (статьях "компьютерного журнала").

6. Анализ использования сленга в текстах предметной области «Информационные технологии» (на материале статей журнала «Хакер»).

7. «Перевод» статьи из журнала «Хакер» на язык без сленговых слов и выражений.

8. Написание технического текста с использованием сленга. 

 

Методические указания по выполнению задач:

Задача 1. Должны быть проанализированы научно-технические тексты с целью выявления в них примеров использования тропов. В качестве научно-технических текстов могут использоваться статьи в таких журналах как Computer Week, PC Week, Computer Reseller News, PC Magazine, Computer World, Hard&Soft, LAN и др.(журнал следует согласовать с преподпвателем). Необходимо рассмотреть не менее трех статей и найти не менее 10 примеров использования тропов. Должны быть найдены следующие основные типы тропов: метафора, метонимия, литота, синекдоха, олицетворение, гипербола и др. Выявленные тропы должны быть приведены в отчете в контексте предложения. Тропам  должны быть сопоставлены разделы рубрикатора справочника “Кто есть кто на компьютерном рынке России”, выпускаемом фирмой SK Communications International совместно с журналом PC Magazine / Russian Edition. Результаты анализа (сведения об использовании тропов в научно-технических текстах) должны быть сведены в таблицу с полями: троп, тип тропа, цель использования, прямое значение — определение из словаря с его библиографическим описанием (для метафоры), переносное значение (для метафоры), раздел рубрикатора, цитата (троп контексте предложения), библиографическое описание источника (статьи из журнала с указанием страницы цитирования).

Задача 2. Должны быть проанализированы рекламные тексты с целью выявления в них примеров использования тропов. В качестве рекламных текстов могут использоваться  рекламные материалы основных традиционных компьютерных выставок сентября–декабря: SofTool, Netcom, “Банк и офис”, “Информатика”, Internet&Intranet Expo, “Мультимедиа Экспо”, “Дизайн и компьютер”— рекомендуется посетить данные выставки, ярмарки и салоны во внеучебное  время. Рекламные тексты могут быть взяты из компьютерных журналов. Необходимо рассмотреть рекламные материалы по одному изделию вычислительной техники. Рекламные материалы выбранного изделия должны содержать его тропеические образы. Достаточным является рассмотрение не менее 10 тропов. В отчетных материалах обнаруженные тропы  должны быть приведены в контексте предложения. Для каждого тропа следует  привести цель использования, а для метафоры прямое и переносное значения  Результаты анализа должны быть сведены в таблицу с полями: изделие, троп, тип тропа, цель использования, прямое значение — определение из словаря с его библиографическим описанием (для метафоры), переносное значение (для метафоры), раздел рубрикатора, цитата (троп контексте предложения), библиографическое описание источника (статьи из журнала с указанием страницы цитирования).

Задача 3. Должна быть разработана модель метафорического образа информационно-программного изделия или аппаратного средства вычислительной техники. В качестве информационно-программного изделия рекомендуется рассматривать ранее разработанные исполнителем изделия, например, в рамках курсовых проектов или выпускной бакалаврской работы. В этом случае они должны быть отнесены к одному из классов рубрикатора справочника “Кто есть кто на компьютерном рынке России”. Возможно рассмотрение и любого другого существующего или вымышленного изделия. Модель метафорического образа изделия может объединять изделие с предметами из одной или более семантических сфер "картины мира". В качестве "картины мира" следует использовать модель, описанную в книге Ю.Н.Филипповича «Метафоры информационных технологий». Модель метафорического образа информационно-программного изделия может быть представлена в виде таблицы произвольной формы.

Задача 4. Должен быть разработан макет рекламного листка информационно-программного изделия. В тексте рекламного листка должно использоваться не менее трех метафорических образов компонентов изделия и его функций. В качестве изделия может быть выбрано любое информационно-программное изделие. Метафоры должны быть подчеркнуты. В пояснении к тексту должно быть приведено обоснование использования выбранных метафор их прямое и переносное значение.

Задача 5. Должны быть проанализированы научно-технические тексты с целью выявления в них примеров использования идиом. В качестве научно-технических текстов могут использоваться статьи в таких журналах как Computer Week, PC Week, Computer Reseller News, PC Magazine, Computer World, Hard&Soft, LAN и др.(журнал следует согласовать с преподпвателем). Необходимо рассмотреть не менее трех статей и найти не менее 20 примеров использования идиом. Должны быть найдены три основных типа идиом: лексическая, синтаксическая, морфологическая. Выявленные идиомы должны быть приведены в отчете в контексте предложения. Результаты анализа (сведения об использовании идиом в научно-технических текстах) должны быть сведены в таблицу с полями: идиома, тип идиомы, значение, цитата (идиома в контексте предложения), библиографическое описание источника (статьи из журнала с указанием страницы цитирования).

Задача 6. Должны быть проанализированы тексты статей журнала «Хакер» с целью выявления в них примеров использования компьютерного сленга. Необходимо рассмотреть не менее трех статей и найти не менее 10 примеров использования сленговых выражений и слов. Выявленные примеры должны быть приведены в отчете в контексте предложения. Результаты анализа (сведения об использовании сленга в научно-технических текстах) должны быть сведены в таблицу с полями: слово/выражение, буквальное значение, значение (перевод), цитата (слово/выражение в контексте предложения), библиографическое описание источника (статьи из журнала с указанием страницы цитирования).

Задача 7. Должен быть выбран текст (фрагмент статьи журнала «Хакер»), содержащий сленговые выражения и слова, объемом не более одной страницы и преобразован в текст, не содержащий сленговых выражений и слов. Должен быть составлен переводной словарь данного текста.

Задача 8. Должен быть выбран или составлен текст (например, фрагмент документа ЕСПД «Руководство оператора» или «Программа и методика испытания» или др.), объемом не более одной страницы и преобразован в текст, содержащий сленговые выражения и слова. Должен быть составлен переводной словарь данного текста.

Оформление домашнего задания.

Результаты и рабочие материалы выполнения домашнего задания должны быть представлены в виде пояснительной записки в печатной и электронной формах. Электронная форма результатов и рабочих материалов домашнего задания представляется на CDRW (возможно совместно с материалами курсовой работы по дисциплине “Семиотика информационных технологий”).

Пояснительная записка должна быть оформлена в соответствии с требованиями, предъявляемыми к оформлению отчетов по НИР. При этом должны выполняться требования соответствующих ГОСТ.

Объем пояснительной записки оформленного домашнего задания должен составлять не более 40000 знаков (1.0 а.л.). Записка сдается в напечатанном виде и в виде файла форматов *.doc *.rtf . Текстовая часть должна содержать ссылки на используемую литературу с указанием страниц издания. Список используемой литературы приводится в соответствии с требованиями ГОСТ. Текст оформленного домашнего задания не должен содержать орфографических ошибок, сносок, буквиц. Текст должен быть отформатирован с параметрами: отступы  — нулевые, красная строка — 1 см,  межстрочный интервал — одинарный, выравнивание — по ширине. Все страницы текста должны содержать верхний колонтитул с фамилией и шифром группы исполнителя работы, а также нумерацию страниц с размещением над колонтитулом по центру. Размер основного шрифта — 12.

В записке рекомендуется иметь восемь разделов, заголовки которых должны соответствовать формулировкам задач домашнего задания. Литература.

В восьми разделах, посвященных выполненным задачам домашнего задания, приводятся основные результаты исследования в виде таблиц,  расчетов и пояснительных текстов.

В разделе "Литература" указываются использованные источники.

Пояснительная записка сдается в стандартных полиэтиленовых файлах, собранных в папку по задачам.

Рабочие материалы курсовой работы сдаются на CDRW. Все файлы должны быть собраны в папку с именем GG_NN_X (GG — номер группы 91, 92, 93, 94; NN — номер студента в списке группы; Х — номер версии). В папке должен быть файл Readme.txt, содержащий описание всех папок и файлов работы. Файл пояснительной записки должен иметь имя, соответствующее шифру курсовой работы GG_NN_Х.doc. Рабочие материалы должны быть сгруппированы по задачам. В случае размещения материалов домашнего задания на одном диске с материалами курсовой работы и рабочими тетрадями должны быть сформированы папки: DZ — домашнее задание, KR — курсовая работа, RTL — рабочая тетрадь по дисциплине «Компьютерная лингвистика», RTS — рабочая тетрадь по дисциплине “Семиотика информационных технологий”. Имена папок должны быть добавлены как префиксы в имена папки и файла GG_NN_X .

Не допускается использование архиваторов и автоматического запуска каких-либо файлов, размещенных на диске. Файлы не должны содержать вирусов.

Апробация домашнего задания.

Для апробации домашнего задания у преподавателя необходимо сдать для анализа и оценки: пояснительную записку компакт диск.

Зачет домашнего задания осуществляется при условии полного и качественного выполнения всех задач.

Срок сдачи домашнего задания 16 неделя семестра.

 

Рабочая тетрадь

для самостоятельной работы

 

Тема

 

Оценка

Примечания

1. Самостоятельная работа над материалом лекций

1.1. Конспект материалов (1:4)

 

 

 

1.2. Словарь определений (30х2)

 

 

 

2. Самостоятельная работа над материалом практических занятий

2.1. Разработка шрифтовых элементов

 

 

 

2.2. Исследование системы оптического распознавания текстов

 

 

2.3. Исследование системы автоматического перевода.

 

 

2.4. Исследование поисковой машины (индивидуально по заданию преподавателя).

 

 

Дата сдачи заданий   ....…………………....

(срок сдачи заданий 16 неделя).

 

1. Самостоятельная работа над материалом лекций

 

1.1. Конспект материалов

Цели работы:

Расширение знаний лекционного материала.

Приобретение практических навыков конспектирования научных литературных источников.

Задача работы: написание конспекта лекционных материалов.

Форма отчетности: рукописный конспект лекционных материалов.

Методические указания по выполнению задачи:

Объем рукописного конспекта должен составлять одну четвертую часть (0.25) лекционных материалов, полно отражать их содержание. Конспект должен содержать: библиографическое описание источника (материала), собственно конспект материала, список цитированной в конспекте литературы. Возможно включение в конспект собственных замечаний и комментариев, которые должны быть явно выделены.

Конспект должен быть написан разборчиво и аккуратно, представлен на листах формата А4 и удовлетворять следующим требованиям:

строки конспекта должны быть горизонтальны, без перекосов (за исключением схем, рисунков, таблиц и т.п.);

на одной странице должно быть не более    строк;

размеры полей в мм.: верхнее — 20, нижнее — 25, левое — 35, правое —10.

В случае отсутствия навыков аккуратного и разборчивого письма, рекомендуется предварительно изготовить шаблон (разлиновать лист бумаги) и при написании конспекта использовать его.

 

1.2. Словарь определений

Цели работы:

Расширение знаний лекционного материала.

Приобретение практических навыков определения (толкования) понятий предметной области.

Задача работы: написание определений основных понятий, использованных в лекционных материалах.

Форма отчетности: список определений (толкований) понятий.

Методические указания по выполнению задачи:

Из лекционных материалов должны быть выделены 60 основных понятий (30 — из раздела лекционного курса «Компьютерная лингвистика» и 30 — из раздела «Системы общения») и приведены их определения. Определения могут быть даны самостоятельно или взяты из каких-либо источников, в том числе и из словарей и энциклопедий. В случае заимствованного определения должно быть дано библиографическое описание источника. При этом должна быть указана страница цитирования (за исключением электронных изданий).

Словарь определений должен быть представлен в печатном и электронном (файл MS Word — Словарь терминов. doc) виде в форме таблицы с полями: номер, понятие, определение, источник. Таблица должна быть разделена на две части, соответственно разделам лекционного курса.

Файл словаря определений должен быть помещен в папку «Рабочая тетрадь» и записан на компакт диск.

 

2. Самостоятельная работа над материалом практических занятий

 

2.1. Разработка шрифтовых элементов.

Цель работы:

Приобретение практических навыков разработки эмблемы и логотипа названия фирмы и торговой марки информационно-программного изделия с использованием программ класса «конструктор шрифтов».

Задачи работы:

1. Разработка эмблемы фирмы (фирменного знака);

2. Разработка логотипа названия фирмы и торговой марки информационно-программного изделия;

3. Разработка личного экслибриса или вензеля.

Форма отчетности:

Задача 1

— результаты анализа (сведения о фирмах): название, реквизиты, вид деятельности (изделия и услуги), продукция;

— варианты разработанной эмблемы фирмы, сведения о фирме, обоснование выбора окончательного варианта.

Задача 2

— результаты анализа (сведения об информационно-программных изделиях): название, краткое описание, фирменный знак или логотип;

— варианты разработанных фирменного знака или логотипа информационно-программного изделия, краткое описание, обоснование выбора окончательного варианта. Шрифтовые элементы логотипа представляются в виде ttf-файла.

Задача 3

— результаты анализа (сведения о субъекте);

— варианты разработанных личных экслибрисов или вензелей. Шрифтовое исполнение экслибриса или вензеля представляется в виде ttf-файла.

 

Методические указания по выполнению задач:

Задача 1. Разрабатываемая эмблема фирмы должна быть оригинальной и отражать особенности  деятельности фирмы, ее создания и организации.

Перед разработкой эмблемы должно быть установлено название фирмы, которое может быть придумано или заимствовано у уже существующих фирм. Одновременно с названием фирмы необходимо  придумать или заимствовать основные сведения о ней. Рекомендуется ознакомиться с названиями фирм, представленных на компьютерном рынке России и сведениями о них, которые приведены в справочной литературе, например в справочнике “Кто есть кто на компьютерном рынке России”, выпускаемом фирмой SK Communications International совместно с журналом PC Magazine / Russian Edition.

Должны быть разработаны не менее трех вариантов названия фирмы, приведены примеры названий фирм с аналогичными характеристиками и сведения о них, приведено описание сведений одного из разработанных вариантов.

Далее следует разработать эскизные варианты эмблемы (не менее трех), различающиеся своими графическими и текстовыми элементами. Из разработанных вариантов эмблемы должен быть выбран один – окончательный.

Задача 2. Разрабатываемый логотип названия фирмы или торговой марки информационно-программного изделия должен быть оригинальным и может отражать особенности  деятельности фирмы, ее создания и организации; особенности предметной области, которая интегрируется информационно-программным изделием; особенности самого информационно-программного изделия или процесса его создания и использования.

Перед разработкой логотипа информационно-программного изделия, должно быть установлено его название. которое может быть придумано или заимствовано у уже существующих информационно-программных изделий. Одновременно с названием информационно-программного изделия необходимо также придумать или заимствовать основные сведения о нем. Рекомендуется ознакомиться с названиями информационно-программных изделий, представленных на компьютерном рынке России и сведениями о них, которые приведены в  литературе (материалах и каталогах основных традиционных компьютерных выставок сентября–декабря: SofTool, Netcom, “Банк и офис”, “Информатика”, Internet&Intranet Expo, “Мультимедиа Экспо”, “Дизайн и компьютер”— рекомендуется посетить данные выставки, ярмарки и салоны во внеучебное время; материалах и каталогах других компьютерных выставок, проводившихся ранее; справочниках; периодических компьютерных журналах: Computer Week, PC Week, Computer Reseller News, PC Magazine, Computer World, Hard&Soft, LAN и др.).  

Должны быть разработаны не менее трех вариантов названия информационно-программного изделия, приведены примеры названий информационно-программных изделий с аналогичными характеристиками и сведения о них, приведено краткое описание сведений об информационно-программном изделии, для которого разрабатывается логотип.

Далее следует разработать эскизные варианты логотипа (не менее трех), различающиеся своими шрифтовыми элементами.

Из разработанных вариантов логотипа должен быть выбран один – окончательный.

Шрифтовые элементы окончательного варианта логотипа должны быть реализованы как элементы ttf и оформлены в виде шрифтовых файлов. Разработка шрифтовых элементов логотипа должна быть выполнена с использованием программ, относящихся к классу “конструкторов шрифтов” (например, FontoGrapher — профессиональный редактор шрифтов и др.)

Задача 3. Разрабатываемый экслибрис или вензель должны быть оригинальными и могут отражать особенности личных качеств разработчика, а также предметов, процессов и ситуаций, на которые направлена его деятельность, как в прошлом и настоящем (результаты деятельности), так и в будущем (цели).

Перед разработкой личного экслибриса или вензеля должны быть найдены три примера, установлена их принадлежность персонам и приведены краткие сведения о них.

Должны быть разработаны не менее трех вариантов личного экслибриса или вензеля.. Из разработанных вариантов должен быть выбран один – окончательный. Выбор следует пояснить.

Шрифтовые элементы окончательного варианта экслибриса или вензеля должны быть реализованы как элементы ttf и оформлены в виде шрифтовых файлов. Разработка шрифтовых элементов экслибриса или вензеля должна быть выполнена с использованием программ, относящихся к классу “конструкторов шрифтов” (например, FontoGrapher — профессиональный редактор шрифтов и др.)

 

2.2. Исследование системы оптического распознавания текстов

Цель занятия:

Приобретение практических навыков использования для ввода текстовой информации программ класса «системы оптического распознавания текстов».

Задачи занятия:

Разработка технологического процесса ввода текстовой информации.

Анализ ошибок распознавания.

Исследование эффективности технологического процесса ввода информации.

Форма отчетности:

Технологическая документация. Материалы анализа и исследования, содержащие: исходный текст (ксерокопию), сканированный результат, распознанный текст, отредактированный текст; описание систематических ошибок, причин их возникновения, и методов устранения, количественные значения характеристик технологического процесса использования систем оптического распознавания текстов для их ввода.

Методические указания по выполнению задач:

Перед выполнением данного задания рекомендуется выполнить лабораторные работы, представленные в методических материалах.

Для выполнения задания необходимо подобрать «плохой» печатный текст (книга, изданная до 1980 г., машинопись, ксерокопия низкого качества и др.) объемом 3-и страницы, без формул, таблиц, рисунков и т.п., содержание которого соответствует предметной области «Информационные технологии».

Текст должен быть отсканирован и распознан с использованием таких систем как, например FineReader, CuneiForm и т.п.

Задача1. При разработке технологического процесса ввода текстовой информации должны быть выделены и описаны этапы, процедуры и отдельные операции. Технологический процесс должен быть представлен в виде схемы. Технологическая документация представляет собой: схему технологического процесса ввода текстовой информации; описание технологического процесса (этапы, процедуры и операции);

Задача 2. В процессе проведения анализа ошибок распознавания должны быть выявлены систематические ошибки, сделаны предположения о причинах их появления и описаны действия по их устранению.

Задача 3.  Исследование эффективности технологического процесса ввода информации состоит в определении временных затрат на выполнение этапов, процедур и отдельных операций.

 

2.3. Исследование системы автоматического перевода

Цель занятия:

Приобретение практических навыков использования для перевода иностранных текстов программ класса «системы автоматического перевода».

Задачи занятия:

1. Исследование характеристик словаря системы автоматического перевода;

2. Исследование характеристик лингвистического процессора системы автоматического перевода.

Форма отчетности:

Материалы исследования, содержащие:

Исходные тексты на иностранном языке, переводы системы, отредактированные переводы, словники, количественные значения характеристик перевода.

Методические указания по выполнению задач:

Перед выполнением данного задания рекомендуется выполнить лабораторные работы, представленные в методических материалах.

Для выполнения задания необходимо подобрать в сети Internet короткую статью (сообщение) на одном из европейских языков объемом до 6000 знаков (1–3 страницы), содержание которой соответствует предметной области «Информационные технологии».

Задача 1. Выполнить перевод подобранной статьи с использованием 2-х или 3-х каких-либо систем автоматического перевода. Возможно использование таких программ как  Stylus, Сократ, WebTranSite и др. Выписать и подсчитать количество непереведенных слов. Сформировать на основе полученных данных оценки качества систем автоматического перевода.

Задача 2. Выполнить перевод подобранной статьи с использованием 2-х или 3-х каких-либо систем автоматического перевода. Возможно использование таких программ как  Stylus, Сократ, WebTranSite и др. Выписать и подсчитать количество переведенных слов и словосочетаний семантически «неправильно». Подсчитать количество предложений переведенных синтаксически и семантически «неправильно». Дать «правильный» перевод. Сформировать на основе полученных данных оценки качества систем автоматического перевода.