Г.В.Носовский, А.Т.Фоменко. Империя (Части 4-7) -
549 >
Использование же связей типа L_0 позволяет ``выжать'' из
хронологического списка ту информацию о его структуре, которая на
глаз не видна и определить дубликаты даже в том случае если все
имена, используемые в них, попарно различны.
Для всех рассмотренных нами хронологических списков
использование связей L_0, L_1 и L_2 приводило к одному и тому же
виду ответа (обнаруживались одни и те же системы дубликатов).
Поэтому мы будем иногда говорить просто о связи L, подразумевая
под этим одну из связей L_0, L_1 или L_2.
p3'3'5
5. РАЗЛИЧЕНИЕ ЗАВИСИМЫХ И НЕЗАВИСИМЫХ ПАР
ОПРЕДЕЛЯЮЩИХ ОКРЕСТНОСТЕЙ В ХРОНОЛОГИЧЕСКИХ СПИСКАХ ИМЕН
Перейдем к описанию способа определения порогов в множестве
значений связи $L(\Delta_r, \Delta_s)$, разделяющих зависимые и независимые пары
определяющих окрестностей $\Delta_r, \Delta_s$. Приводимые ниже рассуждения
имеют КАЧЕСТВЕННЫЙ характер. Они оправдываются aposteriori, так
как позволяют получить более четкую картину структуры списка.
Важно, что наиболее существенные черты этой картины
оказываются (во всех рассмотренных нами реальных примерах)
нечуствительными не только к выбору параметров модели $k$ и $p$ (а
также к приведенным выше изменениям в определении самой связи,
что уже отмечалось), но и к колебаниям указанных порогов.
Пусть дан хронологический список имен Х. Зафиксируем для
него параметры модели $(k, p)$ и построим набор гистограмм частот
появления значений связи $L_0(\Delta_r, \Delta_s)$ ($L_1$ или $L_2$),
при условии, что
значение $O(\Delta_r, \Delta_s)$
постоянно (для каждой из гистограмм оно свое).
В рассмотренных нами реальных списках все эти гистограммы имели
вид приблизительно как на рис. 28.
В КАЧЕСТВЕ ЗНАЧЕНИЯ ПОРОГА, ОТДЕЛЯЮЩЕГО СВЯЗЬ $L_0$ ($L_1$, $L_2$)
