Гаусс. Теория чисел. Если бы числа могли говорить

Страница: 1 ... 3839404142434445464748 ... 83

Карикатура на Лежандра, созданная в 1820 году французским художником Луи-Леопольдом Бальи.

ПРИМЕНЕНИЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ К СТАТИСТИКЕ

Кроме вычисления пространственных орбит, как мы увидим далее, метод наименьших квадратов имеет большой потенциал применения в других областях математики, особенно в статистике. Решение уравнений методом наименьших квадратов зависит от данных о функции ?, связывающей переменные, которые нам известны, и от сложности этой функции. Самый простой случай — когда функция имеет вид прямой, то есть Y = а + bХ. Вычисление параметров а и b получается простым расчетом на основе n пар двумерных данных (х1, y1), (х2, у2),..., (xn, yn). После применения техники наименьших квадратов получаем, продифференцировав и приравняв к нулю, уравнения, известные под названием нормальных уравнений:

откуда выводятся значения a и b:

где Cov(X, Y) — это ковариация переменных, Sx? и x — вариация и среднее значение переменной X, соответственно, а у — среднее значение переменной Y. Итоговую прямую называют регрессионной прямой. Такие вычисления позволяют определить возможное значение одной переменной на основе известного значения другой. Представим, что мы выбрали n индивидов, у которых пропорция между весом и ростом нормальная. На основе этих n пар данных мы делаем вычисления соответствующей регрессионной прямой. С помощью этого уравнения мы можем определить средний ожидаемый вес человека, зная его рост, — это вычисление используется по сей день. Рассмотрим следующую таблицу данных.

Рост

Вес

170

68

172

70

174

71

175

72

177

73

180

76

182

80

185

82

186

83

187

84

190

85

193

85

194

86

Проведя вычисления для получения регрессионной прямой, получаем, что Y= 0,808Х - 68,912, где ? — вес, а Х — рост. На графике на следующей странице представлены реальные точки и регрессионная прямая, вычисленная методом наименьших квадратов. Прямая позволяет нам спрогнозировать средний вес человека с ростом 179 сантиметров: ? = 0,808 · 179-68,921 = 75,71.

Чем сложнее функция ?, тем сложнее вычисления, но тем большую точность мы получаем в итоге.

Значительная часть статистики — это формулирование предположений, то есть извлечение выводов о параметрах аудитории на основе репрезентативной выборки. Эти выводы получены с помощью функции выборки, называемой статистической оценкой, которая предполагает оценку поведения целевой аудитории. Для статистического предположения принципиальную роль играет теорема Гаусса — Маркова. В ней утверждается, что при выполнении определенных гипотез статистическая оценка, полученная методом наименьших квадратов, является оптимальной.

— 43 —
Страница: 1 ... 3839404142434445464748 ... 83