Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XLVI Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 07 июня 2018 г.)

Наука: Математика

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Ханжин А.Н. МНОЖЕСТВЕННЫЕ ФУНКЦИИ ОЦЕНКИ СКЛОННОСТИ ДЛЯ НАБЛЮДАТЕЛЬНЫХ КОГОРТ, С ЧРЕЗМЕРНО ОТКРЫТЫМИ СУБЪЕКТАМИ // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. XLVI междунар. студ. науч.-практ. конф. № 11(46). URL: https://sibac.info/archive/meghdis/11(46).pdf (дата обращения: 29.11.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

МНОЖЕСТВЕННЫЕ ФУНКЦИИ ОЦЕНКИ СКЛОННОСТИ ДЛЯ НАБЛЮДАТЕЛЬНЫХ КОГОРТ, С ЧРЕЗМЕРНО ОТКРЫТЫМИ СУБЪЕКТАМИ

Ханжин Алексей Николаевич

студент, факультет «Информационных и развивающих образовательных систем и технологий» ФГБОУ ВО «Самарский государственный архитектурно-строительный университет»

РФ, г. Самара

Тимофеев Алекснадр Вадимович

научный руководитель,

канд. экон. наук, доцент межвузовской кафедры «Информационных и развивающих образовательных систем и технологий» ФГБОУ ВО «Самарский государственный архитектурно-строительный университет»

РФ, г. Самара

Радомский Владимир Маркович

научный руководитель,

канд. техн. наук, доцент межвузовской кафедры «Информационных и развивающих образовательных систем и технологий» ФГБОУ ВО «Самарский государственный архитектурно-строительный университет»

РФ, г. Самара

1. Введение

Наблюдательные когортные исследования с подвергнутыми избыточной выборке испытуемыми подвергаются, в частности, исследованиям в области общественного здравоохранения и политики здравоохранения для оценки причинно-следственных связей. Эта конструкция позволяет исследователям изучать многочисленные результаты для редких стратегий, реализуемых в небольших географических регионах по сравнению с целевой популяцией, которые трудно измерить [1]. Следствием условной выборки является то, что она создает когорты, где распределение подверженных предметов отличается от исходной совокупности. Последовательная оценка поверхности реакции не влияет на эту избыточную выборку экспонированных предметов. Однако функция оценки склонности (т. е. вероятность экспозиции с учетом базовых ковариаций) нацелена на не параметрический не идентифицируемый параметр.

2 Задача статистической оценки

Задача задачи статистической оценки для функции оценки склонности, следовательно, должна учитывать смещение, налагаемое субъектами выборки, обусловленное воздействием E. Без потери общности, мы рассматриваем двоичный E 2 f0; 1g и вектор базовых ковариантов X. Проведем выбор из условного распределения X, учитывая, что E = 1 и условное распределение X задано E = 0. Таким образом, наблюдаемые данные O в когортном исследовании с подвергнутыми избыточной съемке испытуемыми приведены

 

где C - количество неэкспонированных «контрольных» субъектов для каждого испытуемого, а P - распределение вероятности, содержащееся в непараметрической модели M. Если бы наблюдения были выборочно выбраны из базового распределения вероятности P случайным образом, без кондиционирования на E, наша наблюдаемая структура данных будет определяться как

где верхний индекс F представляет собой чертеж из «полного» распределения данных P F. Хотя наша наблюдаемая структура данных O, взятая из P ∈ M, отличается от OF ∼ P F ∈ MF, мы представляем методологию в разделе 3.

3 Методология

Предпосылка нашей методологии для функций сложенной функции оценки зависит от знания вероятности воздействия в исходной совокупности: w = P F (E = 1). Это значение может быть получено, например, из баз данных реестра, информации переписи или других источников регулирования. Предлагаем использование w, такое, что = P F (E = 1 j X) становится идентифицируемым, и мы имеем оценку:

Здесь экспонированные предметы получают весовые коэффициенты наблюдения w, а экспонированные объекты получают весовые коэффициенты наблюдения (1 w) C1. Эта форма взвешивания для учета условного отбора экспонированных предметов достаточно гибкая. 

4. Симуляция

Мы разработали набор симуляций, в которых мы меняли количество подвергнутых воздействию объектов  (n ∈ {200, 500, 1000}) и не подвергали «контролю» на каждый случай (C ∈ {1, 2})для каждого n, что приводило к шести общим размерам выборки (N ∈ {400, 600, 1000, 1500, 2000, 3000}) для наших когорт. Мы также нарисовали случайные выборки с одинаковым общим размером выборки N, чтобы обеспечить сопоставление производительности с выборкой, которая не является условной по статусу экспоненты. Конструкция имитируемой популяции, из которой были взяты эти когорты, была адаптирована из [2], потому что они не изучали чрезмерно подвергнутые воздействию экспонированные предметы. Мы создали смоделированную популяцию, у которой было девять базовых ковариаций X = (Xb: b = 1;:::; 9) с каждым Xb Bern (0: 5). Вероятность воздействия в этой моделируемой популяции составляла 0,37. Обратите внимание, что когда C = 2, отношение экспонированных и неэкспонированных субъектов в когорте аналогично, хотя и не идентично отношению к исходной популяции. 

Таблица1. 

Оценка симуляций

 

Оценка производительности сфокусирована на смещении, среднеквадратичной ошибке (MSE) и относительной эффективности. предвзятость была измерена относительно истинной индивидуальной вероятности pi = P F (Ei = 1 | Xi), присвоенный каждому наблюдение i в генерации E, описанной выше. Таким образом, мы оценили:

Этот выбор для метрик оценки был обусловлен необходимостью последовательных оценок функции оценки склонности для оценщиков причинно-следственных эффектов, которые используют этот параметр неудобства

 

Рисунок 1. График смещения процентов

 

Рисунок 2. Графики (MSE)

 

Наши результаты продемонстрировали, что взвешивание наблюдения с известным w имеет гораздо более низкое смещение, чем невзвешенные сложенные функции оценки склонности для C = 1 и C = 2 для разных размеров выборки, как показано на рисунке 1. Уклон взвешенной функции был аналогичен наблюдаемому, в произвольно отобранной когорте. Сложенные функции оценки склонности с весами «w плюс ошибка» по-прежнему были нетривиально менее предвзятыми для PF (E = 1 j X), когда C = 1. Когда C = 2, функции с w 10% имели аналогичное или немного худшее смещение к невзвешенному функции. Результаты MSE на рисунке 2 показывают, что в то время как значения уменьшались, как и ожидалось, по мере увеличения размеров выборки, уровни функций оценки невзвешенных уровней удержания уровней оставались выше, чем взвешенные функции во всех настройках. Разница в уровнях (MSE) была меньше при C = 2, хотя относительная эффективность для функций оценки взвешенной склонности увеличивалась по мере увеличения размера выборки для C = 1 и C = 2. Логистическая регрессия (glm колебалась от 0,29 до 0,41. Другими индивидуальными алгоритмами, которые хорошо выполнялись, были три оштрафованных регрессии (glmnet, 2 f0; 0: 5; 1g), получая вес от 0,15 до 0,20. Алгоритмы, которые искали в пространстве параметров нелинейно принимаемые веса от 0,00 до 0,04.

5. Заключение

В этой статье были предложены весовые коэффициенты наблюдения, основанные на вероятности экспозиции в методах счисления сложенной склонности для когортных исследований, с более подверженными выборке испытуемых. Мы обнаружили, что этот метод превосходил невзвешенные оценки и выполнял так же, как и произвольно отобранные когорты, в отношении смещения и дисперсии. При анализе чувствительности с использованием весовых коэффициентов, оцененных с существенной погрешностью, показатели по-прежнему были значительно лучше, чем невзвешенные показатели удержания в штабелированном состоянии. Гибкость этого метода для когорт с перенаправленными экспонированными объектами имеет большой потенциал для функций оценки склонности как компонент в оценке. Таким образом, непосредственная область будущей работы заключается в разработке и изучении обоснованности и эффективности оценок причинно-следственных эффектов, двойного робастного машинного обучения, когда они включают в себя взвешенные функции счисления с уклоном. 

 

Список литературы:

  1. K.J. Rothman and S. Greenland. Modern Epidemiology. Lippincott, Williams & Wilkins, 2nd edition, 1998.
  2. S. Rose and M.J. van der Laan. Why match? Investigating matched case-control study designs with causal effect estimation, 5(1), 2009.
  3. S. Geisser. The predictive sample reuse method with applications. J Am Stat Assoc. 1975.
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.