3. СТРУКТУРА ЛИНГВИСТИЧЕСКОЙ БД

Название таблицы:

DICTKEY

Описание:

Таблица предназначена для хранения списка базовых слов и формальных атрибутов словарных статей семантического словаря.

Атрибут

Тип атрибута

Комментарий

RecordID

NUMBER

Номер записи. Первичный ключ

Keyword

STRING

Базовое слово

ExplainCount

NUMBER

Число толкований по базовому слову

ExampleCount

NUMBER

Число эксцерпций по базовому слову

FormCount

STRING

Число словоформ у базового слова

 

Название таблицы:

DICTEXP

Описание:

Таблица предназначена для хранения толкований базовых слов в семантическом словаре

Атрибут

Тип атрибута

Комментарий

RecordID

NUMBER

Номер записи. Первичный ключ

KeywordID

NUMBER

Ссылка на DICTKEY.RecordID

Explain

BLOB

Текст дефиниции

 

Название таблицы:

DICTEXM

Описание:

Таблица предназначена для хранения эксцерпций базовых слов в семантическом словаре

Атрибут

Тип атрибута

Комментарий

RecordID

NUMBER

Номер записи. Первичный ключ

KeywordID

NUMBER

Ссылка на DICTKEY.RecordID

Example

BLOB

Текст эксцерпции

 

Название таблицы:

EXMPNT

Описание:

Таблица предназначена для хранения информации об указателях на эксцерпции.

Атрибут

Тип атрибута

Комментарий

RecordID

NUMBER

Первичный ключ. Ссылка на DICTEXM.RecordID

TextName

STRING

Путь к файлу

LineNo

NUMBER

Сквозной номер строки

PageNo

NUMBER

Номер страницы

PageLineNo

NUMBER

Номер строки на странице

 

Название таблицы:

WORDFORM

Описание:

Таблица предназначена для хранения словоформ

Атрибут

Тип атрибута

Комментарий

RecordID

NUMBER

Номер записи. Первичный ключ

KeywordID

NUMBER

Ссылка на DICTKEY.RecordID

Wordform

STRING

Словоформа

 

Название таблицы:

TEXTTBL

Описание:

Таблица предназначена для хранения информации об обработанных текстах

Атрибут

Тип атрибута

Комментарий

RecordID

NUMBER

Номер записи. Первичный ключ

TextName

STRING

Имя текста

TextPath

STRING

Путь к файлу

TextCheck

BOOLEAN

 

 

Название таблицы:

FREQTBL

Описание:

Таблица предназначена для хранения частотных словников

Атрибут

Тип атрибута

Комментарий

WordformID

NUMBER

Ссылка на WORDFORM.RecordID

TextID

NUMBER

Ссылка на TEXTBL.RecordID

Frequency

NUMBER

Абсолютная частота

 

Название таблицы:

PAIRFREQ

Описание:

Таблица предназначена для хранения частотной информации о парных словосочетаниях

Атрибут

Тип атрибута

Комментарий

FirstID

NUMBER

Ссылка на WORDFORM.RecordID

SecondID

NUMBER

Ссылка на WORDFORM.RecordID

TextID

NUMBER

Ссылка на TEXTBL.RecordID

Frequency

NUMBER

Абсолютная частота

 

Название таблицы:

MORFO

Описание:

Таблица предназначена для хранения информации о кзавиокончаниях

Атрибут

Тип атрибута

Комментарий

RecordID

NUMBER

Номер записи

MorfCode

NUMBER

Идентификатор морфологической единицы

MorfData

STRING

Морфологическая единица

 

Название таблицы:

SEMOTREE

Описание:

Таблица предназначена для хранения информации о тезаурусе “определяющее-определяемое”

Атрибут

Тип атрибута

Комментарий

RecordID

NUMBER

Номер записи

MasterID

NUMBER

Индентификатор “определяющего”. Ссылка на DICTKEY.RecordID

SlaveID

NUMBER

Индентификатор “определяемого”. Ссылка на DICTKEY.RecordID

TreeType

NUMBER

Тип тезауруса (по толкованиям или по эксцерпциям)

Strenth

NUMBER

Не используется

 

Название таблицы:

DICTCLST

Описание:

Таблица предназначена для хранения информации об ареале термина

Атрибут

Тип атрибута

Комментарий

BaseKey

NUMBER

Номер базового слова. Ссылка на DICTKEY.RecordID

RecordID

NUMBER

Порядковый номер слова в ареале

KeywordID

NUMBER

Слово в ареале. Ссылка на DICTKEY.RecordID

MinLen

NUMBER

Расстояние до базового слова

 

Название таблицы:

DICTDEF

Описание:

Таблица предназначена для хранения информации о “коэффициентах определенности” базовых слов

Атрибут

Тип атрибута

Комментарий

KeywordID

NUMBER

Номер базового слова. Ссылка на DICTKEY.RecordID

Masters

NUMBER

Число “определяющих” слов

ChildSum

NUMBER

Общее число “определяемых” для всех “определяющих” слов

AveFactor

NUMBER

“Коэффициент определенности”

 

Название таблицы:

СORRMATX

Описание:

Таблица предназначена для хранения информации о корреляционных матрицах частот естественно-языковых единиц.

Атрибут

Тип атрибута

Комментарий

MasterID

NUMBER

Номер базового слова. Ссылка на DICTKEY.RecordID

SlaveID

NUMBER

Номер базового слова. Ссылка на DICTKEY.RecordID

M_COUNT

NUMBER

Частота для MasterID

S_COUNT

NUMBER

Частота для SlaveID

Value

NUMBER

Число фрагментов

 

Название таблицы:

DICTCORR

Описание:

Таблица предназначена для хранения информации о корреляционной семантической сети

Атрибут

Тип атрибута

Комментарий

MasterID

NUMBER

Номер базового слова. Ссылка на DICTKEY.RecordID

SlaveID

NUMBER

Номер базового слова. Ссылка на DICTKEY.RecordID

Rxy

NUMBER

Корреляционное отношение

Kv

NUMBER

Коэффициент корреляции

ValCount

NUMBER

Число значений в корреляционной матрице

 

Название таблицы:

NETCLUST

Описание:

Таблица предназначена для хранения информации о семантическом ареале

Атрибут

Тип атрибута

Комментарий

BaseKey

NUMBER

Номер базового слова. Ссылка на DICTKEY.RecordID

RecordID

NUMBER

Порядковый номер слова в ареале

KeywordID

NUMBER

Слово в ареале. Ссылка на DICTKEY.RecordID

MinLen

NUMBER

Расстояние до базового слова