Карикатура на Лежандра, созданная в 1820 году французским художником Луи-Леопольдом Бальи. ПРИМЕНЕНИЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ К СТАТИСТИКЕ Кроме вычисления пространственных орбит, как мы увидим далее, метод наименьших квадратов имеет большой потенциал применения в других областях математики, особенно в статистике. Решение уравнений методом наименьших квадратов зависит от данных о функции ?, связывающей переменные, которые нам известны, и от сложности этой функции. Самый простой случай — когда функция имеет вид прямой, то есть Y = а + bХ. Вычисление параметров а и b получается простым расчетом на основе n пар двумерных данных (х1, y1), (х2, у2),..., (xn, yn). После применения техники наименьших квадратов получаем, продифференцировав и приравняв к нулю, уравнения, известные под названием нормальных уравнений: откуда выводятся значения a и b: где Cov(X, Y) — это ковариация переменных, Sx? и x — вариация и среднее значение переменной X, соответственно, а у — среднее значение переменной Y. Итоговую прямую называют регрессионной прямой. Такие вычисления позволяют определить возможное значение одной переменной на основе известного значения другой. Представим, что мы выбрали n индивидов, у которых пропорция между весом и ростом нормальная. На основе этих n пар данных мы делаем вычисления соответствующей регрессионной прямой. С помощью этого уравнения мы можем определить средний ожидаемый вес человека, зная его рост, — это вычисление используется по сей день. Рассмотрим следующую таблицу данных.
Проведя вычисления для получения регрессионной прямой, получаем, что Y= 0,808Х - 68,912, где ? — вес, а Х — рост. На графике на следующей странице представлены реальные точки и регрессионная прямая, вычисленная методом наименьших квадратов. Прямая позволяет нам спрогнозировать средний вес человека с ростом 179 сантиметров: ? = 0,808 · 179-68,921 = 75,71. Чем сложнее функция ?, тем сложнее вычисления, но тем большую точность мы получаем в итоге. Значительная часть статистики — это формулирование предположений, то есть извлечение выводов о параметрах аудитории на основе репрезентативной выборки. Эти выводы получены с помощью функции выборки, называемой статистической оценкой, которая предполагает оценку поведения целевой аудитории. Для статистического предположения принципиальную роль играет теорема Гаусса — Маркова. В ней утверждается, что при выполнении определенных гипотез статистическая оценка, полученная методом наименьших квадратов, является оптимальной. — 43 —
|