В рамках семинара была прочитана лекция "Анализ тональности текстов", которая базируется на кратком курсе "Extracting social meaning and sentiment", прочтенном в рамках летней школы по логике, языку и информатике NASSLLI'2012.
Рассмотрены примеры выделения информации об эмоциональной окраске слов и словосочетаний при помощи алгоритмов машинного обучения. В качестве исходных данных использовались записи пользователей различных социальных сетей. Анализ данных и построение математических моделей проводились в среде R.
Видео этой части семинара не представлено! |
В рамках семинара была прочитана лекция о метриках семантической близости слов, которые успешно применяются при решении многих задач Автоматической Обработки Текста (АОТ), таких как извлечение отношений, расширение поисковых запросов, разрешение омонимии и поиск семантически подобных текстов. Данная лекция начинается с обзора классических подходов к семантической близости основанных на семантических сетях, словарях и корпусах текстов. Далее представлены две новые метрики близости. Первая основана на лексико-синтаксических шаблонах и корпусе текстов. Она обладает точностью сопоставимой с метриками основанными на WordNet. Вторая объединяет 16 разнородных метрик и обучена на множестве семантических отношений из словаря. Эксперименты показывают что данная метрика значительно превосходит по точности и полноте большинство существующих подходов. Лекция завершается обзором двух систем АОТ в которых применяются разработанные метрики.
Страница проекта - serelex.it-claim.ru
|