Строение и функции молекул ДНК и РНК

Из истории теоремы пифагора Краткое сообщение о теореме пифагора

Самые знаменитые русские в мире

Примерное расписание логопедических занятий

Презентация на тему: «Всё о Лондоне»

Урок географии "Австралия

Практическое руководство по магии

Этнический состав южной америки

Равноускоренное движение: формулы, примеры

Значение слова мальчиш-кибальчиш в литературной энциклопедии Кто написал сказку о мальчише кибальчише

Веселые герои мультфильма чаггингтон

Счетный материал «Математические кораблики Дидактические игры с математическим деревянным корабликам

Эрнан Кортес: Завоевание Мексики Фернандо кортес что открыл

Есенина Внеклассная работа по литературе

Княжества северо-восточной руси Коренными жителями Залесского края являлись угро-финские племена: мурома, меря, весь

Асимптотические обозначения времени выполнения программ. Оценки снизу, сверху, асимптотически точные

В современных условиях интерес к анализу данных постоянно и интенсивно растет в совершенно различных областях, таких как биология, лингвистика, экономика, и, разумеется, IT. Основу этого анализа составляют статистические методы, и разбираться в них необходимо каждому уважающему себя специалисту в data mining.

К сожалению, действительно хорошая литература, такая что умела бы предоставить одновременно математически строгие доказательства и понятные интуитивные объяснения, встречается не очень часто. И данные лекции , на мой взгляд, необычайно хороши для математиков, разбирающихся в теории вероятностей именно по этой причине. По ним преподают магистрам в немецком университете имени Кристиана-Альбрехта на программах «Математика» и «Финансовая математика». И для тех, кому интересно, как этот предмет преподается за рубежом, я эти лекции перевел . На перевод у меня ушло несколько месяцев, я разбавил лекции иллюстрациями, упражнениями и сносками на некоторые теоремы. Замечу, что я не профессиональный переводчик, а просто альтруист и любитель в этой сфере, так что приму любую критику, если она конструктивна.

Вкратце, лекции вот о чем:


Условное математическое ожидание

Эта глава не относится непосредственно к статистике, однако, идеальна для старта её изучения. Условное математическое ожидание - это наилучший выбор для предсказания случайного результата на основе уже имеющейся информации. И это тоже случайная величина. Здесь рассматриваются его различные свойства, такие как линейность, монотонность, монотонная сходимость и прочие другие.

Основы точечного оценивания

Как оценить параметр распределения? Какой для этого выбрать критерий? Какие методы при этом использовать? Эта глава позволяет ответить на все эти вопросы. Здесь вводятся понятия несмещенной оценки и равномерно несмещенной оценки с минимальной дисперсией. Объясняется, откуда берутся распределение хи-квадрат и распределение Стьюдента, и чем они важны при оценивании параметров нормального распределения. Рассказывается, что такое неравенство Рао-Крамера и информация Фишера. Также вводится понятие экспоненциального семейства, многократно облегчающего получение хорошей оценки.

Байесовское и минимаксное оценивания параметров

Здесь описывается иной философский подход к оценке. В данном случае параметр считается неизвестным потому, что он является реализацией некой случайной величины с известным (априорным) распределением. Наблюдая результат эксперимента мы рассчитываем так называемое апостериорное распределение параметра. На основе этого, мы можем получить Байесовскую оценку, где критерием является минимум потерь в среднем, или минимаксную оценку, минимизирующую максимально возможные потери.

Достаточность и полнота

Эта глава имеет серьезное прикладное значение. Достаточная статистика - это функция от выборки, такая что достаточно хранить только результат этой функции для того, чтобы оценить параметр. Таких функций много и среди них выделяют так называемые минимальные достаточные статистики. Например, для оценки медианы нормального распределения достаточно хранить лишь одно число - среднее арифметическое по всей выборке. Работает ли это также для других распределений, например, для распределения Коши? Как достаточные статистики помогают в выборе оценок? Здесь вы можете найти ответы на эти вопросы.

Асимптотические свойства оценок

Пожалуй, самое важное и необходимое свойство оценки - это её состоятельность, то есть стремление к истинному параметру при увеличении размера выборки. В этой главе рассказывается какими свойствами обладают известные нам оценки, полученные описанными в предыдущих главах статистическими методами. Вводятся понятия асимптотической несмещенности, асимптотической эффективности и расстояния Кульбака-Лейблера.

Основы тестирования

Кроме вопроса о том, как оценить неизвестный нам параметр, мы должны каким-то образом проверить, удовлетворяет ли он требуемым свойствам. Например, проводится эксперимент, в ходе которого испытывается новое лекарство. Как узнать, выше ли вероятность выздоровления с ним, нежели чем с использованием старых лекарств? В этой главе объясняется, как строятся подобные тесты. Вы узнаете, что такое равномерно наиболее мощный критерий, критерий Неймана-Пирсона, уровень значимости, доверительный интервал, а также откуда берутся небезызвестные критерий Гаусса и t-критерий.

Асимптотические свойства критериев

Как и оценки, критерии должны удовлетворять определенным асимптотическим свойствам. Иногда могут возникнуть ситуации, когда нужный критерий построить невозможно, однако, используя известную центральную предельную теорему, мы строим критерий, асимптотически стремящийся к необходимому. Здесь вы узнаете, что такое асимптотический уровень значимости, метод отношения правдоподобия, и как строятся критерий Бартлетта и критерий независимости хи-квадрат.

Линейная модель

Эту главу можно рассматривать как дополнение, а именно, применение статистики в случае линейной регрессии. Вы разберетесь в том, какие оценки хороши и в каких условиях. Вы узнаете, откуда взялся метод наименьших квадратов, каким образом строить критерии и зачем нужно F-распределение.

ЭФФЕКТИВНОСТЬ АСИМПТОТИЧЕСКАЯ КРИТЕРИЯ

Понятие, позволяющее осуществлять в случае больших выборок количественное двух различных статистич. критериев, применяемых для проверки ложной и той же статистич. гипотезы. Необходимость измерять эффективность критериев возникла в 30-40-е гг., когда появились простые с точки зрения вычислений, но лнеэффективные

Математическая энциклопедия. - М.: Советская энциклопедия . И. М. Виноградов . 1977-1985 .

Смотреть что такое "ЭФФЕКТИВНОСТЬ АСИМПТОТИЧЕСКАЯ КРИТЕРИЯ" в других словарях:

    Коэффициент корреляции - (Correlation coefficient) Коэффициент корреляции это статистический показатель зависимости двух случайных величин Определение коэффициента корреляции, виды коэффициентов корреляции, свойства коэффициента корреляции, вычисление и применение… … Энциклопедия инвестора

    Методы математич. статистики, не предполагающие знания функционального вида генеральных распределений. Название непараметрические методы подчеркивает их отличие от классических параметрических методов, в к рых предполагается, что генеральное… … Математическая энциклопедия

    Процесс представления информации в определенной стандартной форме и обратный процесс восстановления информации по ее такому представлению. В математич. литературе кодированием наз. отображение произвольного множества Ав множество конечных… … Математическая энциклопедия

Определение . Направление, определяемое ненулевым вектором называется асимптотическимнаправлением относительно линии второго порядка, если любая прямая этого направления (то есть параллельная вектору ) либо имеет с линией не более одной общей точки, либо содержится в этой линии.

? Сколько общих точек может быть у линии второго порядка и прямой асимптотического направления относительно этой линии?

В общей теории линий второго порядка доказывается, что если

То ненулевой вектор ( задаёт асимптотическое направление относительно линии

(общий критерий асимптотического направления ).

Для линий второго порядка

если , то нет асимптотических направлений,

если то существует два асимптотических направления,

если то существует только одно асимптотическое направление.

Полезной оказывается следующая лемма (критерий асимптотического направления линии параболического типа ).

Лемма . Пусть - линия параболического типа.

Ненулевой вектор имеет асимптотическое направление

относительно . (5)

(Задача. Доказать лемму.)

Определение . Прямая асимптотического направления называется асимптотой линии второго порядка, если эта прямая либо не пересекается с , либо содержится в ней.

Теорема . Если имеет асимптотическое направление относительно , то асимптота, параллельная вектору , определяется уравнением

Заполняем таблицу.

ЗАДАЧИ .

1. Найти векторы асимптотических направлений для следующих линий второго поря дка:

4 - гиперболического типа два асимптотических направления.

Воспользуемся критерием асимптотического направления:

Имеет асимптотическое направление относительно данной линии 4 .

Если =0, то =0, то есть - нулевой. Тогда Поделим на Получаем квадратное уравнение: , где t = . Решаем это квадратное уравнение и находим два решения: t = 4 и t = 1. Тогда асимптотические направления линии .

(Можно рассмотреть два способа, так как линия – параболического типа.)

2. Выясните, имеют ли оси координат асимптотические направления относительно линий второго порядка:

3. Напишите общее уравнение линии второго порядка, для которой

а) ось абсцисс имеет асимптотическое направление;

б) Обе оси координат имеют асимптотические направления;

в) оси координат имеют асимптотические направления и О – центр линии.

4. Напишите уравнения асимптот для линий:

а) ng w:val="EN-US"/>y=0"> ;

5. Докажите, что если линия второго порядка имеет две непараллельные асимптоты, то их точка пересечения является центром данной линии.

Указание: Так как есть две непараллельные асимптоты, то существует два асимптотических направления, тогда , а, значит, линия – центральная.

Запишите уравнения асимптот в общем виде и систему для нахождения центра. Всё очевидно.

6.(№920) Напишите уравнение гиперболы, проходящей через точку А(0, -5) и имеющей асимптоты х – 1 = 0 и 2х – y + 1 = 0.

Указание . Воспользуйтесь утверждением предыдущей задачи.

Домашнее задание . , №915(в,д,е), №916 (в,г,д), №920 (если не успели);

Шпаргалки;

Силаев, Тимошенко. Практические задания по геометрии,

1 семестр. С.67, вопросы 1-8, с.70, вопросы 1-3 (устно).

ДИАМЕТРЫ ЛИНИИ ВТОРОГО ПОРЯДКА.

СОПРЯЖЕННЫЕ ДИАМЕТРЫ.

Дана аффинная система координат .

Определение. Диаметром линии второго порядка, сопряженным вектору не асимптотического направления относительно , называется множество середин всех хорд линии , параллельных вектору .

На лекции доказано, что диаметр – это прямая и получено её уравнение

Рекомендации : Показать (на эллипсе), как строится (задаём не асимптотическое направление; проводим [две] прямые этого направления, пересекающие линию; находим середины отсекаемых хорд; проводим через середины прямую – это и есть диаметр).

Обсудить:

1. Почему в определении диаметра берётся вектор не асимптотического направления. Если не могут ответить, то попросите построить диаметр, например, для параболы.

2. Любая ли линия второго порядка имеет хотя бы один диаметр? Почему?

3. На лекции доказано, что диаметр – это прямая. Серединой какой хорды является точка М на рисунке?


4. Посмотрите на скобки в уравнении (7). Что они напоминают?

Вывод: 1) каждый центр принадлежит каждому диаметру;

2) если существует прямая центров, то существует единственный диаметр.

5. Какое направление имеют диаметры линии параболического типа? (Асимптотическое)

Доказательство (наверно, на лекции).

Пусть диаметр d, заданный уравнением (7`) сопряжен вектору не асимптотического направления. Тогда его направляющий вектор

(-(), ). Покажем, что этот вектор имеет асимптотическое направление. Воспользуемся критерием вектора асимптотического направления для линии параболического типа (см.(5)). Подставляем и убеждаемся (не забываем, что .

6. Сколько диаметров у параболы? Их взаимное расположение? Сколько диаметров у остальных линий параболического типа? Почему?

7. Как построить общий диаметр некоторых пар линий второго порядка (см. вопросы 30, 31 далее).

8. Заполняем таблицу, обязательно делаем рисунки.

1. . Напишите уравнение множества середин всех хорд, параллельных вектору

2. Напишите уравнение диаметра d, проходящего через точку К(1,-2) для линии .

Этапы решения :

1-й способ .

1. Определяем тип (чтобы знать, как ведут себя диаметры этой линии).

В данном случае линия центральная, тогда все диаметры проходят через центр С.

2. Составляем уравнение прямой, проходящей через две точки К и С. Это и есть искомый диаметр.

2-й способ .

1. Записываем уравнение диаметра d в виде (7`).

2. Подставив в это уравнение координаты точки К, находим зависимость между координатами вектора, сопряженного диаметру d.

3. Задаём этот вектор, учитывая найденную зависимость, и составляем уравнение диаметра d.

В данной задаче вычислять проще вторым способом.

3. . Напишите уравнение диаметра, параллельного оси абсцисс.

4. Найдите середину хорды, отсекаемой линией

на прямой x + 3y – 12 =0.

Указание к решению : Конечно, можно найти точки пересечения данных прямой и линии , а затем – середину полученного отрезка. Желание сделать так отпадает, если взять, к примеру, прямую с уравнением х +3у – 2009 =0.

Диссертация

Поэтому одним из путей развития проверки статистических гипотез стал путь «эмпирического» построения критериев, когда конструируемая статистика критерия основана на определенном принципе, остроумной идее или здравом смысле, но оптимальность ее не гарантирована. Для того, чтобы оправдать применение подобных статистик при проверке гипотез против определенного класса альтернатив, чаще всего методом...

  • 1. Вспомогательные сведения
    • 1. 1. Сведения из теории С/- и V- статистик
    • 1. 2. Определение и вычисление бахадуровской эффективности
    • 1. 3. О больших уклонениях II- и V- статистик
  • 2. Критерии симметрии Барингхауза-Хенце
    • 2. 1. Введение
    • 2. 2. Статистика
    • 2. 3. Статистика
  • 3. Критерии экспоненциальности
    • 3. 1. Введение
    • 3. 2. Статистика Я
    • 3. 3. Статистика п
  • 4. Критерии нормальности
    • 4. 1. Введение
    • 4. 2. Статистика В^
    • 4. 3. Статистика В^п
    • 4. 4. Статистика В|)П
  • 5. Критерии согласия с законом Коши
    • 5. 1. Введение
    • 5. 2. Статистика
    • 5. 3. Статистика

Асимптотические свойства критериев симметрии и согласия, основанных на характеризациях (реферат, курсовая, диплом, контрольная)

В настоящей диссертации строятся и исследуются критерии согласия и симметрии, основанные на характеризационных свойствах распределений, а также вычисляется их асимптотическая относительная эффективность для ряда альтернатив.

Построение статистических критериев и изучение их асимптотических свойств является одной из важнейших задач математической статистики. При проверке простой гипотезы против простой альтернативы задача решается с помощью леммы Неймана-Пирсона, которая, как известно, дает оптимальный (наиболее мощный) критерий в классе всех критериев заданного уровня. Это критерий отношения правдоподобия.

Однако для более трудных и важных для практики задач проверки гипотез, связанных либо с проверкой сложных гипотез, либо с рассмотрением сложных альтернатив, равномерно наиболее мощные критерии существуют редко, а роль критерия отношения правдоподобия существенно меняется. Статистику отношения правдоподобия обычно не удается вычислить в явном виде, она теряет свойство оптимальности, а ее распределение неустойчиво к изменениям статистической модели. Более того, статистик часто вообще не может определить вид альтернативы, без чего построение параметрических критериев теряет смысл.

Поэтому одним из путей развития проверки статистических гипотез стал путь «эмпирического» построения критериев, когда конструируемая статистика критерия основана на определенном принципе, остроумной идее или здравом смысле, но оптимальность ее не гарантирована.

Типичными примерами таких статистик являются статистика знаков, статистика х2 Пирсона (1900), статистика Колмогорова (1933), измеряющая равномерное расстояние между эмпирической и истинной функцией распределения, ранговый коэффициент корреляции Кендалла (1938) или статистика Бикела-Розенблатта (1973), основанная на квадратичном риске ядерной оценки плотности . В настоящее время математическая статистика располагает многими десятками «эмпирических» статистик для проверки гипотез согласия, симметрии, однородности, случайности и независимости, и в литературе постоянно предлагаются все новые и новые статистики такого типа. Огромная литература посвящена изучению их точных и предельных распределений, оценкам скорости сходимости, большим уклонениям, асимптотическим разложениям и т. д.

Для того, чтобы оправдать применение подобных статистик при проверке гипотез против определенного класса альтернатив, чаще всего методом статистического моделирования вычисляют их мощность. Однако для любого состоятельного критерия мощность с ростом объема выборки стремится к единице, и потому не всегда информативна. Более глубокий анализ сравнительных свойств статистик может быть осуществлен на основе понятия асимптотической относительной эффективности (АОЭ). Различные подходы к вычислению АОЭ предлагались Э. Питменом, Дж. Ходжесом и Э. Леманом, Р. Бахадуром, Г. Черновым и В. Калленбергом в середине XX в., результаты развития теории АОЭ к середине 90-х годов подведены в монографии . Общепринято мнение, что синтез новых критериев должен сопровождаться не только анализом их свойств, но и вычислением АОЭ для того, чтобы оценить их качество и дать обосно ванные рекомендации по их использованию на практике.

В настоящей работе используется идея построения критериев на основе характеризации распределений свойством равнораспределенности. Ха-рактеризационная теория берет свое начало из работы Д. Пойа, опубликованной в 1923 г. Затем она развивалась в работах И. Марцинкевича, С. Н. Бернштейна, Э. Лукача, Ю. В. Линника, A.A. Зингера, Ж. Дармуа, В. П. Скитовича, С.Р. Pao, A.M. Кагана, Я. Галамбоша, С. Котца, Л. Б. Клебанова и многих других математиков. Литература по этому вопросу велика, и в настоящее время существует несколько монографий, посвященных характеризациям, например, , , , , , , .

Идея построения статистических критериев на основе характериза-ций свойством равнораспределенности принадлежит Ю. В. Линнику , . В конце обширной работы он писал: «. можно поставить вопрос о построении критериев согласия выборки со сложной гипотезой, основанных на одинаковой распределенности двух соответствующих статистик gi (xi> .хг) и д2{х, ¦¦¦хг) и на сведении, таким образом, вопроса к критерию однородности.»

Вернемся к классической теореме Пойа , чтобы объяснить на конкретном примере, как может действовать такой подход. В простейшем варианте эта теорема формулируется следующим образом.

Теорема Пойа. Пусть X и Y две независимые и одинаково распределенные центрированные с. в. Тогда с. в. (X + Y)//2 и X одинаково распределены в том и только том случае, когда закон распределения X нормальный.

Предположим, что мы имеем выборку из центрированных независимых наблюдений Xi, ., Хп и хотим проверить (сложную) нулевую гипотезу о принадлежности распределения этой выборки к нормальному закону со средним 0 и некоторой дисперсией. Построим по нашей выборке обычную эмпирическую функцию распределения (ф.р.) п

Fn (t) = п-^ВД

Gn (t) = п~2? ВД + Xj < iv^}, t <= R1. i, j=l

В силу теоремы Гливенко-Кантелли, справедливой и для V-статисти-ческих эмпирических ф.р. , при больших п функция Fn (t) равномерно сближается с ф.р. F (t) = Р (Х < t), а функция Gn (t) равномерно сближается с G (t) = ЦХ + У < tV2). Поскольку при нулевой гипотезе F = G, то Fn (t) близка к Gn (t), и критерий значимости можно основывать на подходящем функционале Тп от разности Fn (t) — Gn (t). Напротив, при альтернативе (то есть при нарушении нормальности) по теореме Пойа F ф G, что приводит к большим значениям Тп и позволяет отвергнуть нулевую гипотезу, обеспечивая состоятельность критерия.

Однако эта конструкция, основывающаяся на идее Ю. В. Линника, почти не получила развития, возможно, ввиду технических трудностей при построении и анализе получающихся критериев. Другая причина состоит, вероятно, в том, что характеризации распределений свойством равнораспределенности немногочисленны и редко встречаются.

Нам известны лишь немногие работы, посвященные в той или иной мере развитию идеи Ю. В. Линника. Это работы Барингхауза и Хенце и Мульере и Никитина , о которых будет сказано ниже. Имеются и работы, в которых критерии согласия для конкретных распределений также строятся на основе характеризаций, но не на основе равнораспределенности, например, , , , , , , , .

Наиболее часто в литературе встречается использование характериза-ции экспоненциального распределения различными вариантами свойства отсутствия памяти , , , , , , .

Следует отметить, что почти во всех этих работах (кроме разве лишь и ) АОЭ рассматриваемых критериев не вычисляется и не обсуждается. В настоящей диссертации мы не только исследуем асимптотические свойства известных и предлагаемых нами критериев, основанных на характеризациях, но и вычисляем их локальную точную (или приближенную) АОЭ по Бахадуру.

Дадим теперь определение понятию АОЭ. Пусть {Тп} и {1^} - две последовательности статистик, построенные по выборке Х,., Хп с распределением Рд, где в € 0 С Я1, и проверяется нулевая гипотеза Но: 9 € во С в против альтернативы А: в € ©-х = ©-6о. Пусть Мт (а, Р,0) — минимальный объем выборки Х[,., Хп, для которого последовательность {Тп} с заданным уровнем значимости, а > 0 достигает мощности /3 < 1 при альтернативном значении параметра в € (c)1- Аналогично вводится в). Относительной эффективностью критерия, основанного на статистике Тп, по отношению к критерию, основанному на Уп, называется величина равная обратному отношению указанных выборочных объемов:

Поскольку относительная эффективность как функция трех аргументов не поддается вычислению в явном виде даже для самых простых статистик, то принято рассматривать пределы:

Птет, у (а,/?, 0), Нтет, у (а,/3,0).

В первом случае получается АОЭ по Бахадуру, второй предел определяет АОЭ по Ходжесу-Леману, а третий приводит к определению АОЭ по Питмену. Поскольку в практических приложениях наиболее интересны именно случаи малых уровней значимости, высоких мощностей и близких альтернатив, то все три определения представляются обоснованными и естественными.

В данной работе для сравнения критериев мы будем пользоваться АОЭ по Бахадуру. Для этого есть несколько причин. Во-первых, питме-новская эффективность пригодна в основном для асимптотически нормальных статистик, и при этом условии совпадает с локальной баха-дуровской эффективностью , . Мы же рассматриваем не только асимптотически нормальные статистики, но и статистики квадратичного типа, для которых предельное распределение при нулевой гипотезе резко отличается от нормального, так что питменовская эффективность неприменима. Во-вторых, АОЭ по Ходжесу-Леману непригодна для исследования двусторонних критериев , , поскольку все они оказываются асимптотически оптимальными, а для односторонних критериев эта АОЭ обычно локально совпадает с бахадуровской АОЭ . В третьих, недавно был достигнут значительный прогресс в области больших уклонений для тестовых статистик, что является решающим при вычислении АОЭ по Бахадуру. Мы имеем в виду большие уклонения и— и V—статистик, описанные в недавних работах и .

Перейдем теперь к обзору содержания диссертации. Первая глава носит вспомогательный характер. В ней излагаются необходимые теоретические и технические сведения из теории 11-статистик, теории больших уклонений и теории асимптотической эффективности по Бахадуру.

Глава 2 посвящена построению и исследованию критериев для проверки гипотезы симметрии. Барингхауз и Хенце в предложили идею построения критериев симметрии, основанных на следующей элементарной характеризации.

Пусть X и У — н.о.р.с.в., имеющие непрерывную ф.р. Тогда |Х| и |тах (Х, У)| одинаково распределены тогда и только тогда, когда X и У симметрично распределены относительно нуля.

Эту характеризацию мы используем для построения новых критериев симметрии. Вспомним, что несколько классических критериев симметрии (см. , гл.4) основаны на характеризации симметрии еще более простым свойством равнораспределенности X и —X.

Вернемся к характеризации Барингхауза-Хенце. Пусть Х, ., Хп наблюдения, имеющие непрерывную ф.р. <7. Рассмотрим проверку гипотезы симметрии:

Н0: ОД = 1 — <3(-:г) V я (Е Я1. Это сложная гипотеза, поскольку вид С? не уточняется. В качестве альтернатив мы рассмотрим параметрическую альтернативу сдвига, т. е. G (x-0) = F (x — в), в > 0- скошенную (skew) альтернативу , т. е. д (х-в) = 2f (x)F ($x), в > 0- лемановскую альтернативу , т. е. G (x-, 6) = F1+e (x), 6 > 0 и альтернативу загрязнения , т. е. G{x-6) = (1 — 6) F{x) + 6Fr+1(x), в > 0, г > 0, где F (x) и f (x) являются ф.р. и плотностью некоторого симметричного распределения.

В соответствии с указанной выше характеризацией строится эмпирическая ф.р., основанная на |Xj|,., Хп, п

Hn (t) = n~2 J2 Цтах (Х^Хк)<г}. На основе этих функций составляются статистики: лоо ):

Пусть X uY — неотрицательные и невырожденные н.о.р.с.в., имеющие дифференцируемую в нуле ф.р. F, и пусть 0 < а < 1. Тогда X и min (^, —) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Помимо построения самого критерия согласия и изучения его асимптотических свойств, представляют интерес вычисление АОЭ нового критерия и исследование ее зависимости от параметра а.

Второе обобщение этой характеризации принадлежит Дезу . Мы сформулируем его на основе более поздних работ , :

Пусть Xi, ., Хт, т ^ 2 — неотрицательные и невырожденные н.о.р. с.в., имеющие дифференцируемую в нуле ф.р. F. Тогда статистики Х и т minpfi, ., Хт) одинаково распределены тогда и только тогда, когда F есть ф.р. экспоненциального закона.

Пусть Хх,., Хп — независимые наблюдения, имеющие ф.р. Основываясь на сформулированных выше характеризациях, мы можем проверить гипотезу экспоненциальности Но, которая состоит в том, что (7 есть ф.р. экспоненциального закона.Р, против альтернативы Н, состоящей в том, что С Ф? при слабых дополнительных условиях.

В соответствии с данными характеризациями строятся эмпирическая ф.р. п = пВД < О (°-0−3) 1 и -статистические ф.р. п-2 ± (* ^ < 4} + ^{тш (?, < «}), 1 П

Мы предлагаем основывать критерии для проверки экспоненциаль-ности на статистиках: пкп = - с&bdquo-(*)] аоп{1).

В качестве альтернатив мы выбираем стандартные альтернативы, используемые в литературе по проверке экспоненциал ьности: альтернативу Вейбулла с д{х) = (в + 1) хеехр (—х1+в), х ^ 0- альтернативу Макехама с д{х) = (1 + 0(1 — ехр (—х))) ехр (—х — 0(ехр (-х) — 1 + х)), х ^ 0- альтернативу линейности функции интенсивности отказов с д (х) = (1 + вх) ехр[—ж — ^вх2], х^О.

Для предложенных выше двух статистик выписываются предельные распределения при нулевой гипотезе:

Теорема 3.2.1 Для статистики И£ при п —* оо имеет место соотношение где Дз (а) определена в (3.2.2). Теорема 3.3.1 Для статистики п при п —> оо имеет место соотношение

Щ0,(т + 1)2А1(т)), где Д4 (т) определена в (3.3.6).

Поскольку обе статистики зависят от параметров, а и т, то мы устанавливаем, при каких значениях параметров АОЭ по Бахадуру достигают своих максимумов и находим эти значения. Кроме того, мы строим альтернативу, при которой максимум достигается в точке, а ф ½.

Четвертая глава посвящена проверке гипотезы о нормальности. Существует множество характеризаций нормального закона как одного из центральных законов теории вероятностей и математической статистики, и две монографии, посвященные исключительно этому вопросу , . Мы рассмотрим слегка упрощенный вариант известной характери-зации из и :

Пусть Хг, Х2, ., Хт — центрированные н.о.р.с.в., имеющие ф.р. о константы а, а-2,., ат таковы, что 0 < а* < 1 и = 1. Тогда статистики Х и одинаково распределены тогда и только тогда, когда F (x) = Ф (х/а), то есть F — ф.р. нормального закона с нулевым средним и некоторой дисперсией, а > 0.

Пусть Х, ., Хп выборка с ф.р. G. Основываясь на этой характериза-ции, мы можем проверить основную гипотезу Я0, которая состоит в том, что G есть ф.р. нормального закона Фа (х) = Ф (х/а), против альтернативы Hi, состоящей в том, что G ф Фа. Строится обычная эмпирическая ф.р. Gn и V-статистическая ф.р. п ^

Bm, n (t) = п~т (Е 1 + - + < *}),

1.¿-т=1 с

Здесь и в дальнейшем символ, а означает суммирование по всем перестановкам индексов. Критерии для проверки нормальности могут быть основаны на следующих статистиках:

В, п = Г dGn (t), J —00 оо

BmAt)-Gn (t)]dGn (t), оо

Bin = Г конечна в интервале \t\ < Н /28/).

Вопрос о вероятностях больших уклонений статистик от неограниченного числа fir, а также произвольных разделимых статистик, не удовлетворяющих условию Крамера, оставался открытым. Это не позволяло окончательно решить задачу построения критериев для проверки гипотез в обобщенных схемах размещения с наибольшей скоростью стремления к нулю вероятности ошибки первого рода при иесближающихся альтернативах в классе критериев, основанных на статистиках вида (0.4). Актуальность диссертационного исследования определяется необходимостью завершить решение указанной задачи.

Целью диссертационной работы является построение критериев согласия с наибольшим значением индекса критерия (нижнего индекса критерия) для проверки гипотез в схеме выбора без возращения в классе критериев, которые отклоняют гипотезу Щ{п, N) при $.<>,■ ■)><*. (0-7) где ф - функция от счетного количества аргументов, и параметры п, N изменяются в центральной области.

В соответствии с целью исследования были поставлены следующие задачи:

Исследовать свойства энтропии и информационного расстояния Куль-бака - Лейблера - Санова для дискретных распределений со счетным количеством исходов;

Исследовать вероятности больших уклонений статистик вида (0.4);

Исследовать вероятности больших уклонений симметричных разделимых статистик (0.3), не удовлетворяющих условию Крамера;

Найти такую статистику, что построенный на ее основе критерий согласия для проверки гипотез в обобщенных схемах размещения имеет наибольшее значение индекса в классе критериев вида (0.7).

Научная новизна:

Научная и практическая ценность. В работе решен ряд вопросов о поведении вероятностей больших уклонений в обобщенных схемах размещения. Полученные результаты могут быть использованы в учебном процессе по специальностям математическая статистика и теория информации, при исследовании статистических процедур анализа дискретных последовательностях и были использованы в /3/, /21/ при обосновании защищенности одного класса информационных систем. Положения, выносимые на защиту:

Сведение задачи проверки по единственной последовательности цветов шаров гипотезы от том, что эта последовательность получена в результате выбора без возвращения до исчерпания шаров из урны, содержащей шары двух цветов, и каждый такой выбор имеет одинаковую вероятность, к построению критериев согласия для проверки гипотез в соответствующей обобщенной схеме размещения;

Непрерывность функций энтропии и информационного расстояния Кульбака - Лейблера - Санова па бесконечномерном симплексе с введенной логарифмической обобщенной метрикой;

Теорема о грубой (с точностью до логарифмической эквивалентности) асимптотике вероятностей больших уклонений симметричных разделимых статистик, не удовлетворяющих условию Крамера в обобщенной схеме размещения в семиэксионенциалыюм случае;

Теорема о грубой (с точностью до логарифмической эквивалентности) асимптотике вероятностей больших уклонений для статистик вида (0.4);

Построение критерия согласия для проверки гипотез в обобщенных схемах размещения с наибольшим значением индекса в классе критериев вида (0.7).

Апробация работы. Результаты докладывалась на семинарах Отдела дискретной математики Математического института им. В. А. Стек-лова РАН, отделения информационной безопасности ИТМиВТ им. С. А. Лебедева РАН и на:

Пятом Всероссийском симпозиуме по прикладной и промышленной математике. Весенняя сессия, Кисловодск, 2 - 8 мая 2004;

Шестой Международной Петрозаводской конференция "Вероятностные методы в дискретной математике" 10 - 16 июня 2004;

Второй Международной конференции "Информационные системы и технологии (IST"2004)", Минск, 8-10 ноября 2004;

Международной конференции "Modern Problems and new Trends in Probability Theory", Черновцы, Украина, 19 - 26 июня 2005.

Основные результаты работы использовались в НИР "Апология", выполняемой ИТМиВТ РАН им. С. А. Лебедева в интересах Федеральной службы по техническому и экспортному контролю РФ, и вошли в отчет об исполнении этапа НИР /21/. Отдельные результаты диссертации вошли в отчет но НИР "Разработка математических проблем криптографии" Академии криптографии РФ за 2004 г. /22/.

Автор выражает глубокую благодарность научному руководителю доктору физико-математических наук Ронжину А. Ф. и научному консультанту доктору физико-математических наук старшему научному сотруднику Князеву А. В. Автор выражает признательность доктору физико-математических наук профессору Зубкову А. М. и кандидату физико-математических наук Круглову И. А. за внимание, оказанное работе, и ряд ценных замечаний.

Структура и содержание работы.

В первой главе исследуются свойства энтропии и информационного расстояния для распределений на множестве неотрицательных целых чисел.

В первом параграфе первой главы вводятся обозначения и даются необходимые определения. В частности, используются следующие обозначения: х = (xq,x\, . ) - бесконечномерный вектор со счетным количеством компонент;

Н{х) - -Ex^oXvlnx,-, truncm(x) = (x0,x1,.,xm,0,0,.)] f2* = {х, хи > 0, zy = 0,1,., о х„ < 1}; Q = {х, х, > 0,и = 0,1,., о xv = 1}; = {х G О, ££L0 = 7};

Ml = о Ue>1|5 € о < Ml - 7МГ1 < 00}. Понятно, что множество £1 соответствует семейству вероятностных распределений на множестве неотрицательных целых чисел, П7 - семейству вероятностных распределений на множестве неотрицательных целых чисел с математическим ожиданием 7.

Если у 6Е П, то для е > 0 через Ое(у) будет обозначаться множество

Ое(у) - {х ^ < уие£ для всех v = 0,1,.}.

Во втором параграфе первой главы доказывается теорема об ограниченности энтропии дискретных распределений с ограниченным математическим ожиданием.

Теорема 1. Об ограниченности энтропии дискретных распределений с ограниченным математическим ожиданием.

Для любого ж 6 П7

H(x)

Если х € fly соответствует геометрическому распределению с математическим оэюиданием 7, то есть 7 х„ = (1- р)р\ v = 0,1,., где р = --,

1 + 7 то имеет место равенство

H(x) = F(<7).

На утверждение теоремы можно смотреть как на результат формальv ного применения метода условных множителей Лагранжа в случае бесконечного количества переменных. Теорема о том, что единственное распределение на множестве {к, к + 1, к + 2,.} с данным математическим ожиданием и максимальной энтропией есть геометрическое распределение с данным математическим ожиданием, приведена (без доказательства) в /47/. Автором, тем не менее, дано строгое доказательство.

В третьем параграфе первой главы дается определение обобщенной метрики - метрики, допускающей бесконечные значения.

Для х,у € Q определяется функция р(х,у) как минимальное е > О со свойством уие~£ <хи< уиее для всех и = 0,1,. Если такого е не существует, то полагается, что р(х,у) = оо.

Доказывается, что функция р{х,у) - обобщенная метрика на семействе распределений на множестве неотрицательных целых чисел, а также на всем множестве Cl*. Вместо е в определении метрики р{х,у) можно использовать любое другое положительное,число, отличное от 1. Получающиеся при этом метрики будут отличаться на мультипликативную константу. Обозначим через J(x, у) информационное расстояние

00 £ J(x,y) = Е In-.

Здесь и далее полагается, что 0 In 0 = 0,0 In jj = 0. Информационное расстояние определено для таких х, у, что х„ = 0 для всех и таких, что уи = 0. Если это условие не выполнено, то будем полагать J(x,ij) = оо. Пусть Л СП. Тогда будем обозначать

J (А У) = |nf J(x,y).

В четвертом параграфе первой главы дается определение компактности функций, заданных на множестве Q*. Компактность функции от счетного числа аргументов означает, что с любой степенью точности значение функции может быть приближено значениями этой функции в точках, где лишь конечное количество аргументов отлично от нуля. Доказывается компактность функций энтропии и информационного расстояния.

1. Для любого 0 < 7 < оо функция Н(х) компактна на

2. Если для некоторого 0 < 70 < оо

Р е то для любых 0<7<оо,г>0 функция х) = J(x,p) компактна на множестве Ц7] П Ог(р).

В пятом параграфе первой главы рассматриваются свойства информационного расстояния, задаваемого на бесконечномерном пространстве. По сравнению с конечномерным случаем ситуация с непрерывностью функции информационного расстояния качественно меняется. Показывается, что функция информационного расстояния не является непрерывной на множестве ни в одной из метрик

Pl&V) = Е \Хи~У»\, и=0

Е {xv - Уи)2 v=Q

Рз{х,у) = 8Up\xu-yv\. v

Доказывается справедливость следующих неравенств для функций энтропии Н{х) и информационного расстояния J(x,p):

1. Для любых х, х" € fi

Н{х) - Н(х")\ < - 1){Н{х) + Н{х")).

2. Если для некоторых х,р е П существует е > 0 такое, что х 6 0£(р), то для любого х" £ Q J{x,p) - J(x",p)| < (е"М - 1){Н{х) + Н{х") + ееН(р)).

Из этих неравенств с учетом теоремы 1 следует равномерная непрерывность функций энтропии и информационного расстояния на соответствующих подмножествах Q в метрике p(x,y)t а именно,

1. Для любого 7 такого, что 0 < 7 < оо, функция Н(х) равномерно непрерывна на Г2 в метрике р(ж,у);

2. Если для некоторого 70, 0 < 70 < оо

ТО для любых 0<7<оои£>0 функция

Л р{х) = J(x,p) равномерно непрерывна на множестве П Ое(р) в метрике р{х,у).

Дается определение неэкстремальности функции. Условие неэкстремальности означает то, что функция не имеет локальных экстремумов, либо функция принимает в локальных минимумах (локальных максимумах) одинаковые значения. Условие неэкстремальности ослабляет требование отсутствия локальных экстремумов. Например, функция sin х на множестве действительных чисел имеет локальные экстремумы, но удовлетворяет условию неэкстремальности.

Пусть для некоторого 7 > 0, область А задается условием

А = {х € VLv4>(x) > а}, (0.9) где ф(х) - действительнозначная функция, а - некоторая действительная константа, inf ф(х) < а < inf ф(х).

Изучался вопрос, при каких условиях на функцию ф при изменении параметров n,N в центральной области, ^ -; 7, при всех достаточно больших их значениях найдутся такие неотрицательные целые ко, к\,., кп, что к0 + ki + . + кп = N, к\ + 2к2. + пкп - N и

Ф(ко к\ кп

-£,0,0 ,.)>а.

Доказывается, что для этого от функции ф достаточно потребовать неэкстремальное™, компактности и непрерывности в метрике р(х,у), а также того, что хотя бы для одной точки х, удовлетворяющей (0.9), для некоторого е > 0 существует конечный момент степени 1 + е и х„ > 0 для любого v = 0,1,.

Во второй главе исследуется грубая (с точностью до логарифмической эквивалентности) асимптотика вероятности больших уклонений функций от Д = (^0) ■ ) Ц"п, 0, .) - числа ячеек с заданным заполнением в центральной области изменения параметров N,n. Грубой асимптотики вероятностей больших уклонений достаточно для изучения индексов критериев согласия.

Пусть случайные величины ^ в (0.2) одинаково распределены и

P(z) - производящая функция случайной величины - сходится в круге радиуса 1 < R < оо. Следуя /38/, для 0 < z < R обозначим через £(z) случайную величину такую, что

Ml+£ = £ i1+ex„ < 00.

0.10) к] = Рк, к = 0,1,.

Обозначим

Если существует решение уравнения м Z(z) = ъ то оно единственно /38/. Всюду в дальнейшем будем предполагать, что рк > О,А; = 0,1,.

В первом пункте первого параграфа второй главы находится асимптотика логарифмов вероятностей вида

1пР{/х0 = ко,.,цп = кп}.

Доказывается следующая теорема.

Теорема 2. Грубая локальная теорема о вероятностях больших уклонений. Пусть п, N -» оо так, что jj ->7,0 <7 < оо, существует z7 - корень уравнения M£(z) = 7, с. в. £(г7) имеет положительную дисперсию. Тогда для любого k G Cl(n,N)

1пР{Д = к} = JftpK)) + O(^lniV).

Утверждение теоремы следует непосредственно из формулы для совместного распределения fii,. fin в /26/ и следующей оценки: если неотрицательные целочисленные величины , Нп удовлетворяют условию

Hi + 2д2 + + ПНп = п, то число ненулевых величин среди них есть 0(л/п). Это грубая оценка, не претендующая на новизну. Число ненулевых цг в обобщенных схемах размещения не превосходит величины максимального заполнения ячеек, которое в центральной области с вероятностью, стремящейся к 1, не превосходит величины O(lnn) /25/,/27/. Тем не менее, полученная оценка 0(у/п) выполняется с вероятностью 1 и ее достаточно для получения грубой асимптотики.

Во втором пункте первого параграфа второй главы находится значение предела где адг - последовательность действительных чисел, сходящаяся к некоторому a G R, ф(х) - действительнозначная функция. Доказывается следующая теорема.

Теорема 3. Грубая интегральная теорема о вероятностях больших уклонений. Пусть выполнены условия теоремы 2, для некоторых г >0,С> 0 действительная функция ф(х) компактна, равномерно непрерывна в метрике р на множестве

А = 0r+<;(p(z7)) П Ц7+с] и удовлетворяет условию неэкстремальности на множестве fly. Если для некоторой константы а такой, что inf ф(х) < а < sup ф(х). xeily существует вектор ра € fi7 П 0r(p(z7)); такой, что

Ф{ра) > а и j({(x) >а,хе П7},р(2;7)) = 7(ра,р(*у)) mo для любой последовательности а^, сходящейся к а,

Jim -vbPW%%,.)>aN} = J(pa,p(2h)). (0.11)

При дополнительных ограничениях на функцию ф(х) информационное расстояние J(pa,p{z7)) в (2.3) удается вычислить более конкретно. А именно, справедлива следующая теорема. Теорема 4. Об информационном расстоянии. Пусть для некоторого 0 < 7 < оо для некоторвх г > 0, С > 0 действительная функция ф(х) и ее частные производные первого порядка компактны и равномерно непрерывны в обобщенной метрике р(х, у) на множестве р G

А = Ог(р) П %+с] существуют Т > 0, R > 0, такие, что для всех \t\ <Т,0 < z < R,x е А

Е^ехр^-ф(х)} < оо,

0(a;)exp{t-< со, i/=o oxv 0X1/ для некоторого е > О оо Q pvv1+£zu exp{t-ф{х)} < оо, (0.13) и существует единственный вектор x(z,t), удовлетворяющий системе уравнений xv(z, t) = pvzv ехр {Ь-ф(х(г, t))}, v = 0,1,. функция ф(х) удовлетворяет на множестве А условию неэкстремальности, а - некоторая константа, ф(р) < а < sup ф(:x)(z,t),

0

00 vpv{za,ta) = 7, 1/=0

0(р(*аЛ)) = а, где

Тогда p(za, ta) € и

J({x e А,ф(х) = а},р) = J(p{za, ta),p)

00 д 00 д = l\nza + taYl ir-(x(za,ta)) - In Е^г/ехр{ta-z-(p(zatta))}. j/=0 C^i/ t^=0

Если функция ф(х) - линейная функция, и функция f(x) определена при помощи равенства (0.5), то условие (0.12) превращается в условие Крамера для случайной величины f{£{z)). Условие (0.13) есть форма условия (0.10) и используется при доказательстве наличия в областях вида {х G ф(х) > а} хотя бы одной точки из 0(n, N) при всех достаточно больших п, N.

Пусть^)(п, N) = (hi,., /гдг) - вектор частот в обобщенной схеме размещения (0.2). В качестве следствия из теорем 3, 4 формулируется следующая теорема.

Теорема 5. Грубая интегральная теорема о вероятностях больших уклонений симметричных разделимых статистик в обобщенной схеме размещения.

Пусть п, N -» оо так, что ^ - 7, 0 < 7 < оо, существует z1 - корень уравнения М£(,г) = 7, с. в. £(27) имеет положительную дисперсию и максимальный шаг распределения 1, а - некоторая константа, f(x) - действительная функция, а < Mf(^(z1)), существуют Т > 0,R > 0 такие, что для всех |t| <Т,0 < z < R,

00 оо, и=0 существуют такие ta\

Е vVi/(«01 ta) = Ъ где f{v)p»{za,ta) = а, 1/=0

Тогда для любой последовательности адг, сходящейся к а,

Jim - - InF»{- £ f(h„) > aN} = J(p{za,ta),p{z7))

00 7 In 2a + taa - In £ p^/e^M i/=0

Эта теорема впервые была доказана А. Ф. Ронжиным в /38/ с использованием метода перевала.

Во втором параграфе второй главы исследуются вероятности больших уклонений разделимых статистик в обобщенных cxj^iax разме- ^ ^ щения в случае невыполнения условию Крамера для случайной величины f(€(z)). Условие Крамера для случайной величины f(£(z)) не выполняется, в частности, если £(z) - пуассоновская случайная величина, a f(x) - х2. Заметим, что условие Крамера для самих разделимых статистик в обобщенных схемах размещения выполняется всегда, так как при любых фиксированных п, N число возможных исходов в этих схемах конечно.

Как отмечено в /2/, если условие Крамера не выполнено, то для отыскания асимптотики вероятностей больших уклонений сумм одинаково расq пределенных случайных величин требуется выполнение дополнительных. f

V и. . I условий правильного изменения на распределение слагаемого. В работе j

О, 5 рассматривается случай, соответствующий выполнению условия (3) в /2/, то есть семиэкспоненциальный случай. Пусть P{£i = к} > 0 для всех к = 0,1,. и функцию р(к) = -\пР{^ = к}, можно продолжить до функции непрерывного аргумента - правильно меняющейся функции порядка р, 0 < р < со /45/, то есть положительной функции такой, что при t -> оо p{tx) хр.

Пусть функция f(x) при достаточно больших значениях аргумента - положительная строго возрастающая, правильно меняющаяся функция порядка Определим функцию ср(х), положив для достаточно больших х ф)=р(Г\х)).

На остальной числовой оси ip(x) может быть задана произвольным ограниченным измеримым образом.

Тогда с. в. /(£i) имеет моменты любого порядка и не удовлетворяет условию Крамера, р(х) = о(х) при х -> со, и справедлива следующая Теорема 6. Пусть при достаточно больших х функция ip(x) монотонно не убывает, фг^кция монотонно не возрастает, п, N -> оо так, что jj - А, 0 < Л < оо; гд - единственный корень уравнения M^i(^) = Л, тогда для любого с > b(z\), где b(z) = M/(£i(.z)), существует предел CN} = -(с - b(z\))4.

Из теоремы б следует, что ири невыполнении условия Крамера предел lim 1 InP{LN(h(n, N)) > cN} = 0, ^ ^ iv-too iv что доказывает справедливость гипотезы, высказанной в /39/. Таким образом, значение индекса критерия согласия в обобщенных схемах размещения ири невыполнении условия Крамера всегда равно нулю. При этом в классе критериев, когда условие Крамера выполняется, строятся критерии с ненулевым значением индекса. Отсюда можно сделать вывод, что использовать критерии, статистика которых не удовлетворяет условию Крамера, например, критерий хи-квадрат в полиномиальной схеме, для построения критериев согласия для проверки гипотез при несближающихся альтернативах в указанном смысле асимптотически неэффективно. Подобный вы-вод^был сделан в /54/ по результатам сравнения статистик хи-квадрат и отношения максимального правдоподобия в полиномиальной схеме.

В третьей главе решается задача построения критериев согласия с наибольшим значением индекса критерия (наибольшим значением нижнего индекса критерия) для проверки гипотез в обобщенных схемах размещения. На основе результатов первой и второй глав о свойствах функций энтропии, информационного расстояния и вероятностей больших уклонений в третьей главе находится функция вида (0.4) такая, что критерий согласия, построенный на ее основе, имеет наибольшее значение точного нижнего индекса в рассматриваемом классе критериев. Доказывается следующая теорема.

Теорема 7. О существовании индекса. Пусть выполнены условия теоремы 3, 0 < /3 < 1, Н = Hp(i),Hp(2>,. - последовательность альтернативных распределений, а,ф((3, N) - максимальное число, для которого при гипотезе Нр<ло выполнено неравенство существует предел lim^-оо о>ф{Р, N) - а. Тогда в точке (/3, Н) существует индекс критерия ф

Зфф, Н) = 3{{ф(х) >а,х£ ^.PW).

Шй)<ШН)> где w/fo fh ч v^l ^

В Заключении излагаются полученные результаты в их соотношении с общей целью и конкретными задачами, поставленными в диссертации, формулируются выводы но результатам диссертационного исследования, указываются научная новизна, теоретическая и практическая ценность работы, а также конкретные научные задачи, которые выявлены автором и решение которых представляется актуальным.

Краткий обзор литературы по теме исследования. В диссертационной работе рассматривается задача построения критериев согласия в обобщенных схемах размещения с наибольшим значением индекса критерия в классе функций вида (0.4) при несближающихся альтернативах.

Обобщенные схемы размещения были введены В. Ф. Колчиным в /24/. Величины в полиномиальной схеме были названы числом ячеек с г дробинками и подробно изучены в монографии В. Ф. Колчина, Б. А. Севастьянова, В. П. Чистякова /27/. Величины fir в обобщенных схемах размещения исследовались В. Ф. Колчиным в /25/,/26/. Статистики вида (0.3) впервые были рассмотрены Ю. И. Медведевым в /30/ и получили название разделимых (аддитивно разделимых) статистик. Если функции /„ в (0.3) не зависят от и, такие статистики были названы в /31/ симметричными разделимыми статистиками. Асимптотика моментов разделимых статистик в обобщенных схемах размещения была получена Г. И. Ивченко в /9/. Предельные теоремы для обобщенной схемы размещения рассматривались также в /23/. Обзоры результатов предельных теоремах и критериях согласия в дискретных вероятностых схемах типа (0.2) были даны В. А. Ивановым, Г. И. Ивченко, Ю. И. Медведевым в /8/ и Г. И. Ивченко, Ю. И. Медведевым, А. Ф. Ронжиным в /14/. Критерии согласия для обобщенных схем размещения были рассмотрены А. Ф. Ронжиным в /38/.

Сравнение свойств статистических критериев в указанных работах проводилось с точки зрения относительной асимптотической эффективности. Рассматривались случае сближающихся (контигуальных) гипотез - эффективность в смысле Питмена и несближающихся гипотез - эффективность в смысле Бахадура, Ходжеса - Лемана и Чернова. Связь между различными видами относительной эффективности статистических критериев обсуждается, например, в /49/. Как следует из результатов 10. И. Медведева в /31/ о распределении разделимых статистик в полиномиальной схеме, наибольшую асимптотическую мощность при сближающихся гипотезах в классе разделимых статистик от частот исходов в полиномиальной схеме имеет критерий, основанный на основе статистики хи-квадрат. Данный результат был обобщен А. Ф. Ронжиным для схем типа (0.2) в /38/. И. И. Викторовой и В. П. Чистяковым в /4/ построен оптимальный критерий для полиномиальной схемы в классе линейных функций от /хг. А. Ф. Ронжин в /38/ построил критерий, который при последовательности несближающихся с нулевой гипотезой альтернатив минимизирует логарифмическую скорость стремления вероятности ошибки первого рода к нулю, в классе статистик вида (0.6). Сравнение относительной эффективности статистик хи-квадрат и отношения максимального правдоподобия при сближающихся и несближающихся гипотезах было проведено в /54/.

В диссертационной работе рассматривался случай несближающися гипотез. Изучение относительной статистической эффективности критериев при несближающихся гипотезах требует исследования вероятностей сверхбольших уклонений - порядка 0(i/n). Впервые такая задача для полиномиального распределения с фиксированным количеством исходов решалась И. Н. Сановым в /40/. Асимптотическая оптимальность критериев согласия для проверки простых и сложных гипотез для полиномиального распределения в случае конечного числа исходов при несближающихся альтернативах рассматривалась в /48/. Свойства информационного расстояния ранее рассматривались Кульбаком, Лейблером /29/,/53/ и И. II. Сановым /40/, а также Хеффдингом /48/. В указанных работах непрерывность информационного расстояния рассматривалась на конечномерпых пространствах в евклидовой метрике. Рядом автором рассматривалась последовательность пространств с растущей размерностью, например, в работе Ю. В. Прохорова /37/ или в работе В. И. Богачева, А. В. Колесникова /1/. Грубые (с точностью до логарифмической эквивалентности) теоремы о вероятностях больших уклонений разделимых статистик в обобщенных схемах размещения при выполнении условия Крамера были получены А. Ф. Ронжиным в /38/. А. Н. Тимашевым в /42/,/43/ получены точные (с точностью до эквивалентности) многомерные интегральные и локальные предельные теоремы о вероятностях больших уклонений вектора fir^n, N),., iir.{n,N), где s, г\,., rs - фиксированные целые числа,

О <П < .

Исследование вероятностей больших уклонений при невыполнении условия Крамера для случая независимых случайных величин проведено в работах А. В. Нагаева /35/. Метод сопряженных распределений описан у Феллера /45/.

Статистические задачи проверки гипотез и оценивания параметров в схеме выбора без возвращения в несколько иной постановке рассматривались Г. И. Ивченко, В. В. Левиным, Е. Е. Тимониной /10/, /15/, где решались задачи оценивания для конечной совокупности, когда число ее элементов является неизвестной величиной, доказывалась асимптотическая нормальность многомерных S - статистик от s независимых выборок в схеме выбора без возвращения. Задача изучения случайных величин, связанных с повторениями в последовательностях независимых испытаний исследовалась А. М. Зубковым, В. Г. Михайловым, А. М. Шойтовым в /6/, /7/, /32/, /33/, /34/. Анализ основных статистических задач оценивания и проверки гипотез в рамках общей модели Маркова-Пойа проведен Г. И. Ивченко, Ю. И. Медведевым в /13/, вероятностный анализ которой был дан в /11/. Способ задания неравновероятпых мер на множестве комбинаторных объектов, не сводимый к обобщенной схеме размещения (0.2) был описан в Г. И. Ивченко, Ю. И. Медведевым /12/. Ряд задач теории вероятностей, в которых ответ может быть получен в результате вычислений ио рекуррентным формулам, указан А. М. Зубковым в /5/.

Неравенства для энтропии дискретных распределений были получены в /50/ (цитируется по реферату А. М. Зубкова в РЖМат). Если {pn}^Lo - распределение вероятностей, оо

Рп = Е Рк, к=тг

А = supp^Pn+i < оо (0.14) п> 0 и

F{x) = (х + 1) In (ж + 1) - х In х, то для энтропии Я этого вероятностного распределения

00 я = - 5Z Рк^Рк к=0 справедливы неравенства -L 1 00 00 Р

Я + (In -f-) £ (Арп - Рп+1) < F(А) < Я + £ (АРп - P„+i)(ln

Л D п=П -t п.4-1 и неравенства превращаются в равенства, если

Рп= {xf1)n+vn>Q. (0.15)

Заметим, что экстремальное распределение (0.15) есть геометрическое распределение с математическим ожиданием Л, а функция F(А) от параметра (0.14) совпадает с функцией от математического ожидания в теореме 1.

Похожие диссертационные работы по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК

  • Асимптотическая эффективность критериев экспоненциальности, свободных от параметра масштаба 2005 год, кандидат физико-математических наук Чирина, Анна Владимировна

  • Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Лапласа 2010 год, кандидат физико-математических наук Лямин, Олег Олегович

  • Предельные теоремы в задачах о плотном вложении и плотных сериях в дискретных случайных последовательностях 2009 год, кандидат физико-математических наук Меженная, Наталья Михайловна

  • Предельные теоремы для числа пересечений полосы траекториями случайного блуждания 2006 год, кандидат физико-математических наук Орлова, Нина Геннадьевна

  • Оптимизация структуры моментных оценок точности нормальной аппроксимации для распределений сумм независимых случайных величин 2013 год, доктор физико-математических наук Шевцова, Ирина Геннадьевна

Заключение диссертации по теме «Теория вероятностей и математическая статистика», Колодзей, Александр Владимирович

3.4. Выводы

В настоящей главе на основе результатов предыдущих глав удалость построить критерий согласия для проверки гипотез в обобщенных схемах размещения с наибольшей логарифмической скоростью стремления^нулю вероятностей ошибок первого рода^ри фиксированной вероятности ошибки первого рода и несближающихся альтернативах. ~ "

Заключение

Целью диссертационной работы было построения критериев согласия для проверки гипотез в схеме выбора без возвращения из урны, содержащей шары 2 цветов. Автором было решено изучать статистики, построенные на основе частот расстояний между шарами одного цвета. В такой постановке задача была сведена, к задаче проверки гипотез в подходящей обобщенной схеме размещения.

В диссертационной работе были

Исследованы свойства энтропии и информационного расстояния дискретных распределений с неограниченным количеством исходов при ограниченном математическом ожидании;

Получена грубая (с точностью до логарифмической эквивалентности) асимптотика вероятностей больших уклонений широкого класса статистик в обобщенной схеме размещения;

На основе полученных результатов построена функция критерия с наибольшей логарифмической скоростью стремления к нулю вероятности ошибки первого рода при фиксированной вероятности ошибки второго рода и несближающихся альтернативах;

Доказано, что статистики, не удовлетворяющие условию Крамера, имеют меньшую скорость стремления к нулю вероятностей больших уклонений по сравнению со статистиками, удовлетворяющими такому условию.

Научная новизна работы заключается в следующем.

Дано понятие обобщенной метрики - функции, допускающей бесконечные значения и удовлетворяющей аксиомам тождества, симметрии и неравенства треугольника. Найдена обобщенная метрика и указаны множества, на которых функции энтропии и информационного расстояния, заданные на семействе дискретных распределений со счетным числом исходов, непрерывны в этой метрике;

В обобщенной схеме размещения найдена грубая (с точностью до логарифмической эквивалентности) асимптотика для вероятностей больших уклонений статистик вида (0.4), удовлетворяющих соответствующей форме условия Крамера;

В обобщенной схеме размещения найдена грубая (с точностью до логарифмической эквивалентности) асимптотика для вероятностей больших уклонений симметричных разделимых статистик, не удовлетворяющих условию Крамера;

В классе критериев вида (0.7) построен критерий с наибольшим значением индекса критерия.

В работе решен ряд вопросов о поведении вероятностей больших уклонений в обобщенных схемах размещения. Полученные результаты могут быть использованы в учебном процессе по специальностям математическая статистика и теория информации, при исследовании статистических процедур анализа дискретных последовательностях и были использованы в /3/, /21/ при обосновании защищенности одного класса информационных систем.

Однако, ряд вопросов остается открытым. Автор ограничился рассмотрением центральной зоны изменения параметров n,N обобщенных схем размещения п частиц по N ячейкам. Если носитель распределения случайных величин, порождающие обобщенную схему размещения (0.2), не есть множество вида г, г +1, г + 2,., то при доказательстве непрерывности функции информационного расстояния и исследовании вероятностей больших уклонений требуется учитывать арифметическую структуру такого носителя, что в работе автора не рассматривалось. Для практического применения критериев, построенных на основе предлагаемой функции с максимальным значением индекса, требуется изучение ее распределения как при нулевой гипотезе, так и при альтернативах, в том числе и сближающихся. Интерес представляет также перенос разработанных методов и обобщение полученных результатов на другие вероятностные схемы, отличные от обобщенных схем размещения.

Если - частоты расстояний между номерами исхода 0 в биномиальной схеме с вероятностями исходов ро> 1- Ро, то можно показать, что в этом случае

РЬ = kh.t fin = кп} = I(± iki = n){kl + --, (3.3) v=\ K\ \ . Kn\ где

О* = Ро~1(1 ~Po),v =

Из анализа формулы для совместного распределение величин цг в обобщенной схеме размещения, доказанной в /26/, следует, что распределение (3.3), вообще говоря, не может быть представлено в общем случае как совместное распределение величин цг в какой-либо обобщенной схеме размещения частиц по ячейкам. Данное распределение является частным случаем распределений па множестве комбинаторных объектов, введенных в /12/. Представляется актуальной задачей перенос результатов диссертационной работы для обобщенных схем размещения на этот случай, что и обсуждалось в /52/.

Если число исходов в схеме выбора без возвращения или в полиномиальной схеме размещения больше двух, то совместное распределение частот расстояний между соседними одинаковыми исходами уже не может быть представлено таким простым образом. Пока удается подсчитать только математическое ожидание и дисперсию числа таких расстояний /51/.

Список литературы диссертационного исследования кандидат физико-математических наук Колодзей, Александр Владимирович, 2006 год

1. Богачев В. И., Колесников А. В. Нелинейные преобразования выпуклых мер и энтропия плотностей Радона-Никодима // Доклады Академии наук. - 2004. - Т. 207. - 2. - С. 155 - 159.

2. Видякин В. В., Колодзей А. В. Статистическое обнаружение скрытых каналов в сетях передачи данных // Тез. докл. II Междунар. конф. "Информационные системы и технологии IST"2004"(Минск, 8- 10 окт. 2004 г.) Минск: БГУ, 2004. - Ч. 1. - С. 116 - 117.

3. Викторова И. И., Чистяков В. П. Некоторые обобщения критерия пустых ящиков // Теория вероятн. и ее примен. - 1966. - Т. XI. - 2. С. 306-313.

4. Зубков А. М. Рекуррентные формулы для вычисления функционалов од дискретных случайных величин // Обозрение прикл. и промышл. матем. 1996. - Т. 3. - 4. - С. 567 - 573.

5. G. Зубков A. M., Михайлов В. Г. Предельные распределения случайных величин, связанных с длинными повторениями в последовательности независимых испытаний // Теория вероятн. и ее примен. - 1974. - Т. XIX. 1. - С. 173 - 181.

6. Зубков А. М., Михайлов В. Г. О повторениях s - цепочек в последовательности независимых величин // Теория вероятн. и ее примен.- 1979. Т. XXIV. - 2. - С. 267 - 273.

7. Иванов В. А., Ивченко Г. И., Медведев Ю. И. Дискретные задачи в теории вероятностей // Итоги науки и техники. Сер. теория вероятн., матем. статист., теор. киберн. Т. 23. - М.: ВИНИТИ, 1984. С. 3 -60.

8. Ивченко Г. И. О моментах разделимых статистик в обобщенной схеме размещения // Мат. заметки. 1986. - Т. 39. - 2. - С. 284 - 293.

9. Ивченко Г. И., Левин В. В. Асимптотическая нормальность в схеме выбора без возвращения // Теория вероятн. и ее применен. - 1978.- Т. XXIII. 1. - С. 97 - 108.

10. Ивченко Г. И., Медведев Ю. И. Об урновой схеме Маркова-Пойа: от 1917 до наших дней // Обозрение прикл. и промышл. матем. - 1996.- Т. 3. 4. - С. 484-511.

11. Ивченко Г. И., Медведев Ю. И. Случайные комбинаторные объекты // Доклады Академии наук. 2004. - Т. 396. - 2. - С. 151 - 154.

12. Ивченко Г. И., Медведев Ю. И. Статистические задачи, связанные с организацией контроля за процессами генерации дискретных случайных последовательностей // Дискретн. матем. - 2000. - Т. 12. - 2. С. 3 - 24.

13. Ивченко Г. И., Медведев Ю. И., Ронжин А. Ф. Разделимые статистики и критерии согласия для полиномиальных выборок // Труды Математ. ин-та АН СССР. 1986. - Т. 177. - С. 60 - 74.

14. Ивченко Г. И., Тимонина Е. Е. Об оценивании при выборе из конечной совокупности // Мат. заметки. - 1980. - Т. 28. - 4. - С. 623 - 633.

15. Колодзей А. В. Теорема о вероятностях больших уклонений для разделимых статистик, не удовлетворяющих условию Крамера // Дискретн. матем. 2005. - Т. 17. - 2. - С. 87 - 94.

16. Колодзей А. В. Энтропия дискретных распределений и вероятности больших уклонений функций от заполнения ячеек в обобщенных схемах размещения // Обозрение прикл. и промышл. матем. - 2005. - Т. 12. 2. - С. 248 - 252.

17. Колодзей А. В. Статистические критерии выявления скрытых каналов, основанных на изменении порядка следования сообщений // Научно-исследовательская работа "Апология": Отчет / ФСТЭК РФ, Руководитель А. В. Князев. Инв. 7 дсп. - М., 2004. - С. 96 - 128.

18. Колодзей А. В., Ронжин А. Ф О некоторых статистиках, связанных с проверкой однородности случайных дискретных последовательностей // Научно-исследовательская работа "Разработка математических проблем криптографии" N 4 2004.: Отчет / АК РФ, - М., 2004.

19. Колчин А. В. Предельные теоремы для обобщенной схемы размещения // Дискретн. матем. 2003. - Т. 15. - 4. - С. 148 - 157.

20. Колчин В. Ф. Один класс предельных теорем для условных распределений // Лит. матем. сб. - 1968. - Т. 8. - 1. - С. 111 - 126.

21. Колчин В. Ф. Случайные графы. 2-е изд. - М.: ФИЗМАТЛИТ, 2004. - 256с.

22. Колчин В. Ф. Случайные отображения. - М.: Наука, 1984. - 208с.

23. Колчин В. Ф., Севастьянов Б. А., Чистяков В. П. Случайные размещения. М.: Наука, 1976. - 223с.

24. Крамер Г. // Успехи матем. науки. - 1944. - выи. 10. - С. 166 - 178.

25. Кульбак С. Теория информации и статистика. - М.: Наука, 1967. - 408с.

26. Медведев Ю. И. Некоторые теоремы об асимптотическом распределении статистики хи-квадрат // Докл. АН СССР. - 1970. - Т. 192. 5. - С. 997 - 989.

27. Медведев Ю. И. Разделимые статистики в полиномиальной схеме I; II. // Теория вероятн. и ее нримен. - 1977. - Т. 22. - 1. - С. 3 - 17; 1977. Т. 22. - 3. - С. 623 - 631.

28. Михайлов В. Г. Предельные распределения случайных величин, связанных с многократными длинными повторениями в последовательности независимых испытаний // Теория вероятн. и ее примен. - 1974. Т. 19. - 1. - С. 182 - 187.

29. Михайлов В. Г. Центральная предельная теорема для числа неполных длинных повторений // Теория вероятн. и ее примен. - 1975. - Т. 20. 4. - С. 880 - 884.

30. Михайлов В. Г., Шойтов А. М. Структурная эквивалентность s - цепочек в случайных дискретных последовательностях // Дискретп. матем. 2003. - Т. 15, - 4. - С. 7 - 34.

31. Нагаев А.В. Интегральные предельные теоремы с учетом вероятностей больших уклонений. I. // Теория вероятн. и ее применен. -1969. Т. 14. 1. - С. 51 - 63.

32. Петров В. В. Суммы независимых случайных величин. - М.: Наука, 1972. 416с.

33. Прохоров Ю. В. Предельные теоремы для сумм случайных векторов, размерность которых стремится к бесконечности // Теория вероятн. и ее примен. 1990. - Т. 35. - 4. - С. 751 - 753.

34. Ронжин А.Ф. Критерии для обобщенных схем размещения частиц // Теория вероятн. и ее примен. - 1988. - Т. 33. - 1. - С. 94 - 104.

35. Ронжин А.Ф. Теорема о вероятностях больших уклонений для разделимых статистик и ее статистическое приложение // Мат. заметки. 1984. - Т. 36. - 4. - С. 610 - 615.

36. Санов И. Н. О вероятностях больших отклонений случайных величин // Мат. сб. 1957. - Т. 42. - 1 (84). - С. И - 44.

37. Сенета Е. Правильно меняющиеся функции. М.: Наука, 1985. - 144с.

38. Тимашев А. Н. Многомерная интегральная теорема о больших уклонениях в равновероятной схеме размещения // Дискрета, матем. - 1992. Т. 4. - 4. - С. 74 - 81.

39. Тимашев А. Н. Многомерная локальная теорема о больших уклонениях в равновероятной схеме размещения // Дискретн. матем. - 1990. Т. 2. - 2. - С. 143 - 149.

40. Федорюк М.В. Метод перевала. М.: Наука, 1977. 368с.

41. Феллер В. Введение в теорию вероятностей и ее приложения. Т. 2. - М.: Мир, 1984. 738с.

42. Шеннон К. Математическая теория связи // Работы по теории информации и кибернетике: Пер. с англ. / М., ИЛ, 1963, с. 243 - 332.

43. Conrad К. Probability Distribution and Maximum Entropy // http://www.math.uconn.edu/~kconrad/blurbs/entropypost.pdf

44. Hoeffding W. Asymptotically optimal tests for multinomial distribution // Ann. Math. Statist. 1965. - T. 36. - C. 369 - 408.

45. Inglot T,. Rallenberg W. С. M., Ledwina T. Vanishing shortcoming and asymptotic relative efficiency // Ann. Statist. - 2000. - T. 28. - C. 215 238.

46. Jurdas C., Pecaric J., Roki R., Sarapa N., On an inequality for theentropy of probability distribution // Math. Inequal. and Appl. - 2001. T. 4. - 2. - C. 209 - 214. (РЖМат. - 2005. - 05.07-13B.16).

47. Kolodzey А. V., Ronzhin A. F., Goodness of Fit Tests for Random Combinatoric Objects // Тез. докл. межд. конф. Modern Problems and new Trends in Probability Theory, (Черновцы, 19 - 26 июн. 2005 г.) - Киев: Институт математики, 2005. Ч. 1. С. 122.

48. Kullback S. and Leibler R. A. On information and sufficiency // Ann. Math. Statist. 1951. - T. 22. - C. 79 - 86.

49. Quine M.P., Robinson J. Efficience of chi-square and likelihood ratio goodness of fit tests // Ann. Statist. 1985. - T. 13. - 2. - C. 727 -742.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Вам также будет интересно:

Основные виды многогранников и их свойства
Хотя стереометрию изучают только в старших классах школы, но с кубом, правильными...
Деятельность человека и ее основные формы (труд, игра, учение)
Деятельность ­ это присущая только человеку форма взаимодействия с окружающим миром. Пока...
Как написать диктант по географии
Всероссийский географический диктант 2016 года, который состоялся 20 ноября 2016 года. Это...
Исторические факты в фильме «Иван Васильевич меняет профессию
Кто не знает эту весёлую комедию Леонида Гайдая? Таких среди россиян, пожалуй, нет. Мы...
Живая азбука, живые буквы в картинках, русский алфавит в картинках На что похожи буквы рисунок получили приз
В 1 классе после изучения всех букв алфавита детям предлагается выполнить проект "На что...