3. СТРУКТУРА ЛИНГВИСТИЧЕСКОЙ БД
Название таблицы: |
DICTKEY |
|
Описание: Таблица предназначена для хранения списка базовых слов и формальных атрибутов словарных статей семантического словаря. |
||
Атрибут |
Тип атрибута |
Комментарий |
RecordID |
NUMBER |
Номер записи. Первичный ключ |
Keyword |
STRING |
Базовое слово |
ExplainCount |
NUMBER |
Число толкований по базовому слову |
ExampleCount |
NUMBER |
Число эксцерпций по базовому слову |
FormCount |
STRING |
Число словоформ у базового слова |
Название таблицы: |
DICTEXP |
|
Описание: Таблица предназначена для хранения толкований базовых слов в семантическом словаре |
||
Атрибут |
Тип атрибута |
Комментарий |
RecordID |
NUMBER |
Номер записи. Первичный ключ |
KeywordID |
NUMBER |
Ссылка на DICTKEY.RecordID |
Explain |
BLOB |
Текст дефиниции |
Название таблицы: |
DICTEXM |
|
Описание: Таблица предназначена для хранения эксцерпций базовых слов в семантическом словаре |
||
Атрибут |
Тип атрибута |
Комментарий |
RecordID |
NUMBER |
Номер записи. Первичный ключ |
KeywordID |
NUMBER |
Ссылка на DICTKEY.RecordID |
Example |
BLOB |
Текст эксцерпции |
Название таблицы: |
EXMPNT |
|
Описание: Таблица предназначена для хранения информации об указателях на эксцерпции. |
||
Атрибут |
Тип атрибута |
Комментарий |
RecordID |
NUMBER |
Первичный ключ. Ссылка на DICTEXM.RecordID |
TextName |
STRING |
Путь к файлу |
LineNo |
NUMBER |
Сквозной номер строки |
PageNo |
NUMBER |
Номер страницы |
PageLineNo |
NUMBER |
Номер строки на странице |
Название таблицы: |
WORDFORM |
|
Описание: Таблица предназначена для хранения словоформ |
||
Атрибут |
Тип атрибута |
Комментарий |
RecordID |
NUMBER |
Номер записи. Первичный ключ |
KeywordID |
NUMBER |
Ссылка на DICTKEY.RecordID |
Wordform |
STRING |
Словоформа |
Название таблицы: |
TEXTTBL |
|
Описание: Таблица предназначена для хранения информации об обработанных текстах |
||
Атрибут |
Тип атрибута |
Комментарий |
RecordID |
NUMBER |
Номер записи. Первичный ключ |
TextName |
STRING |
Имя текста |
TextPath |
STRING |
Путь к файлу |
TextCheck |
BOOLEAN |
|
Название таблицы: |
FREQTBL |
|
Описание: Таблица предназначена для хранения частотных словников |
||
Атрибут |
Тип атрибута |
Комментарий |
WordformID |
NUMBER |
Ссылка на WORDFORM.RecordID |
TextID |
NUMBER |
Ссылка на TEXTBL.RecordID |
Frequency |
NUMBER |
Абсолютная частота |
Название таблицы: |
PAIRFREQ |
|
Описание: Таблица предназначена для хранения частотной информации о парных словосочетаниях |
||
Атрибут |
Тип атрибута |
Комментарий |
FirstID |
NUMBER |
Ссылка на WORDFORM.RecordID |
SecondID |
NUMBER |
Ссылка на WORDFORM.RecordID |
TextID |
NUMBER |
Ссылка на TEXTBL.RecordID |
Frequency |
NUMBER |
Абсолютная частота |
Название таблицы: |
MORFO |
|
Описание: Таблица предназначена для хранения информации о кзавиокончаниях |
||
Атрибут |
Тип атрибута |
Комментарий |
RecordID |
NUMBER |
Номер записи |
MorfCode |
NUMBER |
Идентификатор морфологической единицы |
MorfData |
STRING |
Морфологическая единица |
Название таблицы: |
SEMOTREE |
|
Описание: Таблица предназначена для хранения информации о тезаурусе “определяющее-определяемое” |
||
Атрибут |
Тип атрибута |
Комментарий |
RecordID |
NUMBER |
Номер записи |
MasterID |
NUMBER |
Индентификатор “определяющего”. Ссылка на DICTKEY.RecordID |
SlaveID |
NUMBER |
Индентификатор “определяемого”. Ссылка на DICTKEY.RecordID |
TreeType |
NUMBER |
Тип тезауруса (по толкованиям или по эксцерпциям) |
Strenth |
NUMBER |
Не используется |
Название таблицы: |
DICTCLST |
|
Описание: Таблица предназначена для хранения информации об ареале термина |
||
Атрибут |
Тип атрибута |
Комментарий |
BaseKey |
NUMBER |
Номер базового слова. Ссылка на DICTKEY.RecordID |
RecordID |
NUMBER |
Порядковый номер слова в ареале |
KeywordID |
NUMBER |
Слово в ареале. Ссылка на DICTKEY.RecordID |
MinLen |
NUMBER |
Расстояние до базового слова |
Название таблицы: |
DICTDEF |
|
Описание: Таблица предназначена для хранения информации о “коэффициентах определенности” базовых слов |
||
Атрибут |
Тип атрибута |
Комментарий |
KeywordID |
NUMBER |
Номер базового слова. Ссылка на DICTKEY.RecordID |
Masters |
NUMBER |
Число “определяющих” слов |
ChildSum |
NUMBER |
Общее число “определяемых” для всех “определяющих” слов |
AveFactor |
NUMBER |
“Коэффициент определенности” |
Название таблицы: |
СORRMATX |
|
Описание: Таблица предназначена для хранения информации о корреляционных матрицах частот естественно-языковых единиц. |
||
Атрибут |
Тип атрибута |
Комментарий |
MasterID |
NUMBER |
Номер базового слова. Ссылка на DICTKEY.RecordID |
SlaveID |
NUMBER |
Номер базового слова. Ссылка на DICTKEY.RecordID |
M_COUNT |
NUMBER |
Частота для MasterID |
S_COUNT |
NUMBER |
Частота для SlaveID |
Value |
NUMBER |
Число фрагментов |
Название таблицы: |
DICTCORR |
|
Описание: Таблица предназначена для хранения информации о корреляционной семантической сети |
||
Атрибут |
Тип атрибута |
Комментарий |
MasterID |
NUMBER |
Номер базового слова. Ссылка на DICTKEY.RecordID |
SlaveID |
NUMBER |
Номер базового слова. Ссылка на DICTKEY.RecordID |
Rxy |
NUMBER |
Корреляционное отношение |
Kv |
NUMBER |
Коэффициент корреляции |
ValCount |
NUMBER |
Число значений в корреляционной матрице |
Название таблицы: |
NETCLUST |
|
Описание: Таблица предназначена для хранения информации о семантическом ареале |
||
Атрибут |
Тип атрибута |
Комментарий |
BaseKey |
NUMBER |
Номер базового слова. Ссылка на DICTKEY.RecordID |
RecordID |
NUMBER |
Порядковый номер слова в ареале |
KeywordID |
NUMBER |
Слово в ареале. Ссылка на DICTKEY.RecordID |
MinLen |
NUMBER |
Расстояние до базового слова |