PDF Google Drive Downloader v1.1


Report a problem

Content text Пример выполнения ТР 10.5.pdf

22.02.2018 Пример выполнения типового расчета 10.5 file:///H:/CANVAS_%D0%90%D0%A1%D0%9E%D0%9F/TR_10.5/Ex_10.5.html 1/7 5 Обработка данных методами линейного корреляционного анализа 5.1 ТЕОРЕТИЧЕСКОЕ ВВЕДЕНИЕ 5.1.1 Двумерный случайный вектор. Линейная корреляция Рассмотрим систему двух случайных величин или двумерный случайный вектор (X, Y) T c центром распределения и ковариационной матрицей , (5.1) где ax и ay – математические ожидания; D(X ) = σx 2 и D(Y ) = σy 2 – дисперсии случайных величин X и Y соответственно; Kxy – ковариация между величинами X и Y, определяется следующим образом: Kxy = cov(X,Y) = M[(X – ax )(Y – ay )]. (5.2) В качестве нормированной ковариации вводится коэффициент корреляции: , (5.3) который характеризует степень линейной зависимости между случайными величинами X и Y. Свойства коэффициента корреляции следующие. 1. Коэффициент корреляции является безразмерным коэффициентом, не зависящим от начала отсчета величин X и Y. 2. Коэффициент корреляции по абсолютной величине не превышает единицу : –1 ≤ ρxy ≤ 1. 3. Если |ρxy | = 1, случайные величины X и Y связаны линейной функциональной зависимостью. 4. Если ρxy = 0, случайные величины X и Y некоррелированы, т.е. между ними отсутствует линейная зависимость. 5. Чем ближе значение |ρxy | к единице, тем сильнее линейная зависимость между X и Y. Чем ближе значение |ρxy | к нулю, тем слабее линейная зависимость между X и Y. 6. Если ρxy > 0, то с увеличением одной случайной величины математическое ожидание (среднее значение) другой увеличивается; если ρxy < 0, то с увеличением одной случайной величины математическое ожидание (среднее значение) другой уменьшается. Для случайного вектора (X, Y) T вводятся условные математические ожидания M(X / Y = y) и M(Y / X = x). M(X / Y = y) – это математическое ожидание случайной величины X при условии, что Y приняло одно из своих возможных значений y. Аналогично, M(Y / X = x) – это математическое ожидание случайной величины Y при условии, что X приняло одно из своих возможных значений x. Функцией регрессии Y на X называется зависимость величины M(Y / X = x) от аргумента х. Она характеризует зависимость математического ожидания величины Y от значения, принимаемого величиной X. Аналогично функцией регрессии X на Y называется зависимость величины M(X / Y = y) от аргумента y. Она характеризует зависимость математического ожидания величины X от значения, принимаемого величиной Y. Если обе функции регрессии Y на X и X на Y являются
22.02.2018 Пример выполнения типового расчета 10.5 file:///H:/CANVAS_%D0%90%D0%A1%D0%9E%D0%9F/TR_10.5/Ex_10.5.html 2/7 линейными, корреляционная зависимость между случайными величинами X и Y называется линейной. В случае линейной корреляционной зависимости уравнения регрессии – Y на X и X на Y – называются уравнениями линейной регрессии. Уравнение линейной регрессии Y на X имеет вид , (5.4) а уравнение линейной регрессии X на Y – . (5.5) 5.1.2 Выборочные характеристики двумерного случайного вектора Пусть (Xi , Yi ), i = 1,2,..., n – выборка объема n из наблюдений случайного двумерного вектора (X, Y) T . Определим оценки числовых характеристик этого вектора. За оценку математических ожиданий ax и ay принимаются средние арифметические и (см. формулу (3.2)), за оценку дисперсий σx 2 и σy 2 – соответствующие эмпирические дисперсии Sx 2 и Sy 2 , вычисленные по формуле (3.3). Здесь и далее ссылки на формулы с первой цифрой 3 даются на текст типового расчета 10.3. Несмещенной оценкой ковариации Kxy является величина . (5.6) Для практических расчетов формулу (5.6) удобно преобразовать к виду: . (5.7) Расчет упрощается, если, как и при нахождении оценок параметров одномерной случайной величины, ввести линейную замену (3.6): Xi = C1 + h1Ui ; Yi = C2 + h2Vi . (5.8) При такой замене формула (5.7) принимает вид . (5.9) Оценку коэффициента корреляции ρxy находят по формуле . (5.10) Уравнения оценочных (выборочных) прямых регрессии получают по следующим формулам. Уравнение линейной регрессии Y на X : . (5.11) Уравнение линейной регрессии X на Y : . (5.12) Выборочные уравнения прямых регрессии используют для предсказания среднего значения одной переменной по значению другой. 5.1.3 Построение доверительного интервала для коэффициента корреляции. Проверка
22.02.2018 Пример выполнения типового расчета 10.5 file:///H:/CANVAS_%D0%90%D0%A1%D0%9E%D0%9F/TR_10.5/Ex_10.5.html 3/7 гипотезы о существовании линейной зависимости Будем предполагать, что заданная двумерная выборка имеет двумерное нормальное распределение. Тогда доверительный интервал для коэффициента корреляции можно найти по номограммам. В Приложении (см. [1]) приведены такие номограммы (рис. П1) для доверительной вероятности P = 0,95. По горизонтальной оси номограммы отложены значения выборочного коэффициента корреляции r, по вертикальной оси – значения истинного коэффициента корреляции ρxy , числа над кривыми указывают объемы выборок n. Отложив по горизонтальной оси вычисленное значение выборочного коэффициента корреляции, следует подняться над этой точкой вертикально вверх и найти две точки пересечения с кривыми, соответствующими объему заданной выборки. Ординаты этих двух точек являются границами доверительного интервала истинного коэффициента корреляции. Эти же графики можно использовать для проверки гипотезы H0 об отсутствии линейной зависимости между величинами X и Y, т.е. о том, что истинный коэффициент корреляции ρxy = 0 при альтернативной гипотезе H1 : ρxy ≠ 0. Гипотеза H0 принимается, т.е. линейная зависимость между величинами не существует (с уровнем значимости α = 1 – P), если значение ρxy = 0 принадлежит найденному доверительному интервалу. Здесь P – доверительная вероятность при определении доверительного интервала. Гипотеза H0 отвергается, т.е. принимается альтернативная гипотеза H1 (линейная зависимость между величинами существует), если значение ρxy = 0 не принадлежит найденному доверительному интервалу. Для проверки гипотезы H0 : ρxy = 0 при альтернативной гипотезе H1 : ρxy ≠ 0 можно использовать другой критерий. Гипотеза H0 принимается с уровнем значимости α, т.е. линейная зависимость между величинами не существует, если , (5.13) в противоположном случае принимается гипотеза H1 , т.е. предполагается, что линейная зависимость между величинами существует; t1– α/2 (n – 2) – квантиль распределения Стьюдента с числом степеней свободы k = n – 2. Если принята гипотеза о существовании линейной зависимости между случайными величинами, то, зная доверительный интервал для коэффициента корреляции, можно сделать вывод о силе взаимосвязи между X и Y. Если доверительный интервал примыкает к единице или минус единице, то говорят, что связь сильная. Если доверительный интервал примыкает к нулю, то говорят, что связь слабая. Если доверительный интервал расположен примерно посередине интервала (–1; 0) или (0; 1), то говорят, что связь средней величины. 5.2 Содержание типового расчета Заданы результаты n экспериментов, в каждом из которых измерены значения двух величин х и у, т.е. задана выборка объема n, извлеченная из двумерной нормальной генеральной совокупности (Х, Y). По приведенным исходным данным требуется: – найти оценки характеристик наблюдаемого двумерного случайного вектора; – найти оценку коэффициента корреляции; – записать эмпирические уравнения линейной регрессии; – проверить гипотезу об отсутствии линейной зависимости между величинами X и Y; – сделать вывод о силе и характере связи между величинами X и Y. 5.3 Порядок выполнения типового расчета. Примеры
22.02.2018 Пример выполнения типового расчета 10.5 file:///H:/CANVAS_%D0%90%D0%A1%D0%9E%D0%9F/TR_10.5/Ex_10.5.html 4/7 1. Нахождение оценок числовых характеристик двумерного случайного вектора. Расчет оценки коэффициента корреляции. Необходимо определить оценки числовых характеристик двумерного случайного вектора. За оценку математических ожиданий αx и αy принимаются средние арифметические и , рассчитанные по формуле (3.23), за оценку дисперсий σx 2 и σy 2 – соответствующие эмпирические дисперсии Sx 2 и Sy 2 , вычисленные по формуле (3.3). Несмещенная оценка ковариации определяется по формуле (5.6). Для упрощения расчетов и последующего контроля правильности вычислений следует провести кодировку данных по формуле (5.8). Оценки определяются по формулам (3.7), (3.8), (3.4), (5.9). Для контроля правильности вычислений весь расчет необходимо повторить при другом начале отсчета. Результаты этих расчетов должны совпасть с точностью до величины возможных ошибок округления. Если результаты расчетов совпадают, определяется оценка коэффициента корреляции по формуле (5.10). 2. Нахождение уравнений линейной регрессии. На этом этапе расчетов требуется записать выборочные уравнения линейной регрессии Y на X и X на Y. На одном чертеже построить прямые регрессии и нанести все экспериментальные точки. Выборочные уравнения линейной регрессии записываются в соответствии с формулами (5.11), (5.12). 3. Построение доверительного интервала для коэффициента корреляции ρ. Проверка гипотезы о существовании линейной зависимости между величинами X и Y. На этом этапе расчетов требуется найти доверительный интервал для коэффициента корреляции и проверить гипотезу об отсутствии линейной зависимости между величинами X и Y. Уровень значимости α при проверке гипотезы задает преподаватель. Доверительная вероятность P = 1 – α. Пример выполнения типового расчета. В первом столбце табл. 1 содержатся измеренные значения величины X – изменения содержания азота в стали при ее выпуске из конвертера по сравнению с начальным содержанием [×10 –4 , %]; во втором столбце – значения величины Y (значения начальной концентрации углерода в этой же стали [%]). Найти оценку коэффициента корреляции по этой двумерной выборке. Вычислить выборочные параметры линейной регрессии Y на X и X на Y. Таблица 1 Номер эксперимента X Y U V U 2 V 2 UV 1 – 2,0 0,11 – 4 1 16 1 – 4 2 0,5 0,09 1 – 1 1 1 – 1 3 – 1,5 0,13 – 3 3 9 9 – 9 4 – 5,5 0,11 – 11 1 121 1 – 11 5 3,5 0,06 7 – 4 49 16 – 28 6 – 1,0 0,12 – 2 2 4 4 – 4 7 2,0 0,08 4 – 2 16 4 – 8 8 0,0 0,11 0 1 0 1 0 9 1,5 0,07 3 – 3 9 9 – 9

Related document

x
Report download errors
Report content



Download file quality is faulty:
Full name:
Email:
Comment
If you encounter an error, problem, .. or have any questions during the download process, please leave a comment below. Thank you.