
In the lifetime data analysis, the obtained samples of observations turn out to be censored, as a rule. Moreover, there is often such a situation when selection of devices (or individuals) into a sample is carried out according to some condition on the lifetime. In this case, the obtained lifetime data are truncated. In this paper, the problem of construction of parametric proportional hazards model, introduced by Cox, on the basis of left truncated and right censored data has been considered. Selection of factors, influencing significantly on the survival function, is carried out on the basis of the semiparametric model, in which the lifetime distribution is supposed to be unknown. The Wald test is used for testing hypothesis on equality of regression parameters to zero. By means of computer simulation methods, the distributions of Wald statistic for testing the parametric hypotheses for the Cox model from left truncated and right censored data have been studied. The convergence of the distributions of the Wald statistic to the corresponding chi-squire distribution has been analyzed for various censoring degrees. An approach for testing goodness-of-fit of the parametric Cox model from left truncated and right censored data on the basis of Cox Snell residuals, which under true hypothesis belong to the standard exponential distribution, has been proposed. For testing the hypothesis of exponential distribution of residuals, the modified Kolmogorov, Cramer von Mises Smirnov and Anderson Darling goodness-of-fit tests are suggested to be used. On the basis of the obtained statistical regularities, we have carried out the statistical survival analysis of nonnative-born population in the north regions of industrial development. On the basis of semiparametric proportional hazards model, the predicting factors, significantly influencing on the lifetime of people in the North are determined. Then, the baseline hazard rate function corresponding to the generalized gamma distribution is parameterized. The goodness-of-fit of the obtained parametric Cox model is tested.
В задачах анализа данных типа времени жизни, полученные выборки наблюдений, как правило, являются цензурированными справа. Кроме того, часто возникает ситуация, когда в выборку попадают только те объекты (индивидуумы), продолжительность жизни которых удовлетворяет некоторому условию. В этом случае полученные данные являются усеченными. Рассматривается задача построения модели пропорциональных интенсивностей Кокса по усеченным слева и цензурированным справа данным. На основе полупараметрической модели, в которой распределение продолжительности жизни предполагается неизвестным, проводится отбор факторов, оказывающих статистически значимое влияние на функцию выживаемости. Для проверки гипотезы о равенстве регрессионных параметров данной модели нулю используется критерий Вальда. Методами компьютерного моделирования исследуется сходимость распределения статистики критерия Вальда к соответствующему предельному χ2-распределению при различной степени цензурирования. Предлагается подход к проверке гипотезы о согласии с параметрической моделью пропорциональных интенсивностей по усеченным слева и цензурированным справа выборкам на основе остатков Кокса Снелла, которые, в случае верности нулевой гипотезы, подчиняются стандартному экспоненциальному распределению. Для проверки гипотезы предлагается воспользоваться модифицированными критериями согласия Колмогорова, Крамера Мизеса Смирнова и Андерсона Дарлинга. Приводится пример применения полученных результатов для статистического анализа выживаемости некоренного населения в районах промышленного освоения Севера. На основе полупараметрической модели пропорциональных интенсивностей Кокса выявляются прогностические факторы, значимо влияющие на продолжительность жизни людей. Далее вводится параметризация базовой функции интенсивности, соответствующая обобщенному гамма-распределению. Проверяется статистическая гипотеза об адекватности полученной параметрической модели.
УСЕЧЕННЫЕ СЛЕВА ДАННЫЕ,ЦЕНЗУРИРОВАННЫЕ ДАННЫЕ,МОДЕЛЬ ПРОПОРЦИОНАЛЬНЫХ ИНТЕНСИВНОСТЕЙ КОКСА,КРИТЕРИЙ ВАЛЬДА,НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ,ФУНКЦИЯ ВЫЖИВАЕМОСТИ,ОБОБЩЕННОЕ ГАММА-РАСПРЕДЕЛЕНИЕ,LEFT TRUNCATED DATA,CENSORED DATA,COX PROPORTIONAL HAZARD MODEL,WALD TEST,NONPARAMETRIC GOODNESS-OF-FIT TESTS,SURVIVAL FUNCTION,GENERALIZED GAMMA DISTRIBUTION
УСЕЧЕННЫЕ СЛЕВА ДАННЫЕ,ЦЕНЗУРИРОВАННЫЕ ДАННЫЕ,МОДЕЛЬ ПРОПОРЦИОНАЛЬНЫХ ИНТЕНСИВНОСТЕЙ КОКСА,КРИТЕРИЙ ВАЛЬДА,НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ,ФУНКЦИЯ ВЫЖИВАЕМОСТИ,ОБОБЩЕННОЕ ГАММА-РАСПРЕДЕЛЕНИЕ,LEFT TRUNCATED DATA,CENSORED DATA,COX PROPORTIONAL HAZARD MODEL,WALD TEST,NONPARAMETRIC GOODNESS-OF-FIT TESTS,SURVIVAL FUNCTION,GENERALIZED GAMMA DISTRIBUTION
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
