Математика для заочников и не только

Высшая математика – просто и доступно!

Если сайт упал, используйте ЗЕРКАЛО: mathprofi.net

Наш форум, библиотека и блог mathprofi>>>


Высшая математика:

Математика для заочников

Математические формулы,
таблицы и другие материалы

Книги по математике

Математические сайты

+-*/^ Удобный калькулятор

+ «Дробовик»   

Учимся решать:

Лекции-уроки по высшей математике для первого курса

Высшая математика для чайников, или с чего начать?
Повторяем школьный курс

Аналитическая геометрия:

Векторы для чайников
Скалярное произведение
векторов

Линейная (не) зависимость
векторов. Базис векторов

Переход к новому базису
Векторное и смешанное
произведение векторов

Формулы деления отрезка
в данном отношении

Прямая на плоскости
Простейшие задачи
с прямой на плоскости

Линейные неравенства
Как научиться решать задачи
по аналитической геометрии?

Линии второго порядка. Эллипс
Гипербола и парабола
Задачи с линиями 2-го порядка
Как привести уравнение л. 2 п.
к каноническому виду?

Полярные координаты
Как построить линию
в полярной системе координат?

Уравнение плоскости
Прямая в пространстве
Задачи с прямой в пространстве
Основные задачи
на прямую и плоскость

Треугольная пирамида

Элементы высшей алгебры:

Множества и действия над ними
Основы математической логики
Формулы и законы логики
Уравнения высшей математики
Как найти рациональные корни
многочлена? Схема Горнера

Комплексные числа
Выражения, уравнения и с-мы
с комплексными числами

Действия с матрицами
Как вычислить определитель?
Свойства определителя
и понижение его порядка

Как найти обратную матрицу?
Свойства матричных операций.
Матричные выражения

Матричные уравнения
Как решить систему линейных уравнений?
Правило Крамера. Матричный метод решения системы
Метод Гаусса для чайников
Несовместные системы
и системы с общим решением

Как найти ранг матрицы?
Однородные системы
линейных уравнений

Метод Гаусса-Жордана
Решение системы уравнений
в различных базисах

Линейные преобразования
Собственные значения
и собственные векторы

Квадратичные формы
Как привести квадратичную
форму к каноническому виду?

Ортогональное преобразование
квадратичной формы

Пределы:

Пределы. Примеры решений
Замечательные пределы
Методы решения пределов
Бесконечно малые функции.
Эквивалентности

Правила Лопиталя
Сложные пределы
Пределы последовательностей
Пределы по Коши. Теория

Производные функций:

Как найти производную?
Производная сложной функции. Примеры решений
Логарифмическая производная
Производные неявной, параметрической функций
Простейшие задачи
с производной

Производные высших порядков
Что такое производная?
Производная по определению
Как найти уравнение нормали?
Приближенные вычисления
с помощью дифференциала

Метод касательных

Функции и графики:

Графики и свойства
элементарных функций

Как построить график функции
с помощью преобразований?

Непрерывность, точки разрыва
Область определения функции
Асимптоты графика функции
Интервалы знакопостоянства
Возрастание, убывание
и экстремумы функции

Выпуклость, вогнутость
и точки перегиба графика

Полное исследование функции
и построение графика

Наибольшее и наименьшее
значения функции на отрезке

Экстремальные задачи

ФНП:

Область определения функции
двух переменных. Линии уровня

Основные поверхности
Предел функции 2 переменных
Повторные пределы
Непрерывность функции 2п
Частные производные
Частные производные
функции трёх переменных

Производные сложных функций
нескольких переменных

Как проверить, удовлетворяет
ли функция уравнению?

Частные производные
неявно заданной функции

Производная по направлению
и градиент функции

Касательная плоскость и
нормаль к поверхности в точке

Экстремумы функций
двух и трёх переменных

Условные экстремумы
Наибольшее и наименьшее
значения функции в области

Метод наименьших квадратов

Интегралы:

Неопределенный интеграл.
Примеры решений

Метод замены переменной
в неопределенном интеграле

Интегрирование по частям
Интегралы от тригонометрических функций
Интегрирование дробей
Интегралы от дробно-рациональных функций
Интегрирование иррациональных функций
Сложные интегралы
Определенный интеграл
Как вычислить площадь
с помощью определенного интеграла?

Что такое интеграл?
Теория для чайников

Объем тела вращения
Несобственные интегралы
Эффективные методы решения
определенных и несобственных
интегралов

Как исследовать сходимость
несобственного интеграла?

Признаки сходимости несобств.
интегралов второго рода

Абсолютная и условная
сходимость несобств. интеграла

S в полярных координатах
S и V, если линия задана
в параметрическом виде

Длина дуги кривой
S поверхности вращения
Приближенные вычисления
определенных интегралов


Метод прямоугольников

  Карта сайта

Лекции-уроки по высшей математике для второго курса

Дифференциальные уравнения:

Дифференциальные уравнения первого порядка
Однородные ДУ 1-го порядка
ДУ, сводящиеся к однородным
Линейные неоднородные дифференциальные уравнения первого порядка
Дифференциальные уравнения в полных дифференциалах
Уравнение Бернулли
Дифференциальные уравнения
с понижением порядка

Однородные ДУ 2-го порядка
Неоднородные ДУ 2-го порядка
Линейные дифференциальные
уравнения высших порядков

Метод вариации
произвольных постоянных

Как решить систему
дифференциальных уравнений

Задачи с диффурами
Методы Эйлера и Рунге-Кутты

Числовые ряды:

Ряды для чайников
Как найти сумму ряда?
Признак Даламбера.
Признаки Коши

Знакочередующиеся ряды. Признак Лейбница
Ряды повышенной сложности

Функциональные ряды:

Степенные ряды
Разложение функций
в степенные ряды

Сумма степенного ряда
Равномерная сходимость
Другие функциональные ряды
Приближенные вычисления
с помощью рядов

Вычисление интеграла разложением функции в ряд
Как найти частное решение ДУ
приближённо с помощью ряда?

Вычисление пределов
Ряды Фурье. Примеры решений

Кратные интегралы:

Двойные интегралы
Как вычислить двойной
интеграл? Примеры решений

Двойные интегралы
в полярных координатах

Как найти центр тяжести
плоской фигуры?

Тройные интегралы
Как вычислить произвольный
тройной интеграл?


Криволинейные интегралы
Интеграл по замкнутому контуру
Формула Грина. Работа силы

Поверхностные интегралы

Элементы векторного анализа:

Основы теории поля
Поток векторного поля
Дивергенция векторного поля
Формула Гаусса-Остроградского

Циркуляция векторного поля
и формула Стокса

Комплексный анализ:

ТФКП для начинающих
Как построить область
на комплексной плоскости?

Линии на С. Параметрически
заданные линии

Отображение линий и областей
с помощью функции w=f(z)

Предел функции комплексной
переменной. Примеры решений

Производная комплексной
функции. Примеры решений

Как найти функцию
комплексной переменной?

Решение ДУ методом
операционного исчисления

Как решить систему ДУ
операционным методом?

Теория вероятностей:

Основы теории вероятностей
Задачи по комбинаторике
Задачи на классическое
определение вероятности

Геометрическая вероятность
Задачи на теоремы сложения
и умножения вероятностей

Зависимые события
Формула полной вероятности
и формулы Байеса

Независимые испытания
и формула Бернулли

Локальная и интегральная
теоремы Лапласа

Статистическая вероятность
Случайные величины.
Математическое ожидание

Дисперсия дискретной
случайной величины

Функция распределения
Геометрическое распределение
Биномиальное распределение
Распределение Пуассона
Гипергеометрическое
распределение вероятностей

Непрерывная случайная
величина, функции F(x) и f(x)

Как вычислить математическое
ожидание и дисперсию НСВ?

Равномерное распределение
Показательное распределение
Нормальное распределение
Система случайных величин
Зависимые и независимые
случайные величины

Двумерная непрерывная
случайная величина

Зависимость и коэффициент
ковариации непрерывных СВ

Математическая статистика:

Математическая статистика
Дискретный вариационный ряд
Интервальный ряд
Мода, медиана, средняя
Показатели вариации
Формула дисперсии, среднее
квадратическое отклонение,
коэффициент вариации

Асимметрия и эксцесс
эмпирического распределения

Статистические оценки
и доверительные интервалы

Оценка вероятности
биномиального распределения

Оценки по повторной
и бесповторной выборке

Статистические гипотезы
Проверка гипотез. Примеры
Гипотеза о виде распределения
Критерий согласия Пирсона

Группировка данных. Виды группировок. Перегруппировка
Общая, внутригрупповая
и межгрупповая дисперсия

Аналитическая группировка
Комбинационная группировка
Эмпирические показатели
Как вычислить линейный
коэффициент корреляции?

Уравнение линейной регрессии
Проверка значимости линейной
корреляционной модели

Модель пАрной регрессии.
Индекс детерминации

Нелинейная регрессия. Виды и
примеры решений

Коэффициент ранговой
корреляции Спирмена

Коэф-т корреляции Фехнера
Уравнение множественной
линейной регрессии

Не нашлось нужной задачи?
Сборники готовых решений!

Не получается пример?
Задайте вопрос на форуме!
>>> mathprofi.com

Обратная связь:

Часто задаваемые вопросы
Гостевая книга Отблагодарить автора >>>

Заметили опечатку / ошибку?
Пожалуйста, сообщите мне об этом



  Карта сайта


16. Аналитическая группировка


До сих пор нам встречался один вариационный ряд (либо однородные ряды), с которым можно сделать много хороших и полезных вещей. Но, как вы понимаете, там, где один, там и два, и три и больше. Причём, один ряд может зависеть от другого. Это может быть связь между признаками разных статистических совокупностей или (что чаще) между признаками одной совокупности. О подобных зависимостях и пойдёт речь далее по курсу. Добро пожаловать в дополненную реальность!

И начнём мы с аналитической группировки – популярной и несложной задачи, которая встречается повсеместно, особенно её любят предлагать студентам-экономистам. На данном уроке вы узнаете, что такое аналитическая группировка и научитесь БЫСТРО выполнять это действие. Объяснять, как обычно, буду на конкретном примере:

Пример 61

…Да, это уже задача предпенсионного возраста :)

Имеются выборочные данные о выпуске продукции (млн. руб.) и прибыли (млн. руб.) по 30 предприятиям за некоторый период:

Задание для начинающих:

1) Методом аналитической группировки установите наличие и характер корреляционной связи между стоимостью произведенной продукции и прибылью (результаты оформите в виде групповой и аналитической таблицы).

И пункт для продолжающих, продолжить рекомендую всем;)

2) Измерьте тесноту корреляционной связи между стоимостью произведенной продукции и прибылью эмпирическим корреляционным отношением

Сделайте выводы. И мы их сделаем! Разберёмся в задании, решим и сделаем.

Итак, по условию нам даны два вариационных ряда:   – выпуск продукции по предприятиям (в млн. руб.) и  – прибыль по соответствующим предприятиям (тоже в млн. руб.). Зададимся вопросом: как влияет стоимость произведённой продукции (выпуск) на размер прибыли? Очевидно, что чем больше предприятие выпускает, тем больше у него прибыль. Но всегда ли это так? Нет не всегда. Ведь крупное предприятие может быть и убыточным, может не продать всю продукцию при увеличении её производства. Однако общая тенденция состоит в том, что при увеличении выпуска продукции, увеличивается и средняя прибыль по предприятиям. Ибо масштаб имеет значение, пекарни – это пекарни, а хлебзаводы – это заводы.

Такая нежёсткая зависимость называется корреляционной, о ней я уже немного рассказывал в курсе теорвера на уроке Зависимость и коэффициент ковариации непрерывных случайных величин. Но тот страх мало кто читал, поэтому я объяснил всё заново :) И повторю ещё не раз.

Показатель  (выпуск продукции) называется факторным (причинным) или признаком-фактором. Показатель  (прибыль) называется результативным (следственным) или признаком-результатом.

Но не всё так просто. Дело в том, что вышесказанное является лишь нашим предположением. А вдруг в условии дано 30 каких-нибудь северокорейских заводов, где нет такой зависимости?

Именно поэтому по условию задачи требуется установить наличие и характер корреляционной связи между стоимостью произведенной продукции и прибылью. Под характером связи понимается её направление, при этом возможны следующие варианты:

прямая связь («чем больше, тем больше» – наш случай);
обратная связь («чем больше, тем меньше»);
– отсутствие связи  («чем больше, тем так же хаотично»).

И установить всё это нужно методом аналитической группировки – данная группировка позволяет выяснить наличие и направление корреляционной связи между признаком-фактором  и признаком-результатом .

И мы начинаем, наконец, оформлять решение:

Прежде всего, нужно определить признак-фактор и признак-результат. Самостоятельно, на основе логических рассуждений. Тут же высказываем предположение о наличии и направлении предполагаемой корреляционной связи. В нашей задаче можно записать примерно следующее:

Очевидно, что средний размер прибыли по предприятиям зависит от стоимости выпущенной продукции, при этом, чем больше выпущено продукции, тем выше может быть прибыль. Таким образом, выпуск продукции  является признаком-фактором, а прибыль предприятий  – признаком-результатом; предполагаемая корреляционная зависимостьпрямая.

Обращаю ваше внимание, что эта часть задания является если не обязательной, то строго желательной. Часто в условии прямо запрашивается этот пункт.

Теперь проверяем нашу гипотезу (предположение) методом аналитической группировки.

Как выполнить аналитическую группировку?

Сначала нужно упорядочить совокупность по признаку-фактору. Расположим предприятия по возрастанию выпуска продукции (оранжевый цвет):

В Экселе эта сортировка выполняется буквально в пару щелчков, и чуть ниже будет ролик о том, как быстро решить нашу задачу. Номера предприятий можно было опустить, но я оставил их для лучшего понимания выполненного действия.

Теперь выполняем группировку совокупности – опять же по признаку-фактору (выпуску продукции). Поскольку в условии нет никаких указаний на этот счёт, то используем стандартную равноинтервальную группировку. Размах вариации составляет:
 млн. руб., оптимальное количество интервалов определим по формуле Стерджеса, для объёма совокупности  оно составляет:

 интервалов

Таким образом, длина каждого интервала:  млн. руб., в результате чего у нас получаются интервалы: 41-53, 53-65, 65-77, 77-89 и 89-101 млн. руб. Собственно, организуем группы и начинаем заполнять групповую таблицу. Напоминаю, что значения, попадающие на «стык» интервалов следует относить в следующий интервал:

В нижней части таблицы подсчитываем количество  предприятий по каждой группе, сумму значений (внимание!) результативного признака (прибыли), и, наконец, средние значения  результативного признака по группам.

Основные результаты представим в виде аналитической таблицы:

Теперь смотрим короткое видео о том, как это всё быстро подсчитать:

  Как выполнить аналитическую группировку в MS Excel? (Ютуб)

Сделаем краткие выводы: аналитическая группировка показала, что при увеличении стоимости выпущенной продукции наблюдается увеличение средней прибыли по предприятиям. Таким образом, между рассмотренными факторами действительно существует прямая корреляционная зависимость.

То есть, наше предположение (см. начало задания) подтвердилось.

Обращаю внимание, что средние значения (правая колонка) не обязаны строго возрастать (либо убывать), и если вы получите такой результат, то это будет нормально, ведь корреляционная зависимость не является жёсткой. ВажнА общая тенденция увеличения (либо уменьшения) средних значений. Но может статься, что по итогу вообще не получится какой-то внятной закономерности. И это тоже результат исследования! С соответствующими выводами о слабой зависимости либо отсутствии таковой.

И вот здесь мы как раз подошли ко второму пункту задания: представьте, что значения признака-фактора меняются (в ту или иную строну). При этом признак-результат может реагировать на это изменение по-разному. Явственно и чётко. Или не очень. Или вообще слабо, на грани хаотичной случайности. «Отклик» может быть совершенно разным

И возникает вопрос: насколько СИЛЬНО влияет факторный признак на результат, насколько теснА связь между факторами?

Ответы на этот вопрос дают эмпирический коэффициент детерминации, о котором я уже рассказал в статье о дисперсиях, и связанное с ним эмпирическое корреляционное отношение.

Переходим ко второй части задания, а именно:

2) Измерим тесноту корреляционной связи между стоимостью произведенной продукции и
прибылью с помощью эмпирического корреляционного отношения.

Сначала вычислим эмпирический коэффициент детерминации. Начнём рассуждать неформально:  прибыль (признак-результат) варьируется под влиянием самых разных факторов, их может быть довольно много. И общая дисперсия  учитывает ВСЕ факторы, влияющие на изменение прибыли.

Далее мы разбили совокупность на группы, причём, в основу группировки был положен выпуск продукции (один из факторов). Как вы знаете из предыдущего урока, существенность влияния ЭТОГО фактора измеряется межгрупповой дисперсией . И эмпирический коэффициент детерминации  показывает ДОЛЮ влияния группировочного признака – чем ближе этот коэффициент к единице, тем сильнее влияние причины на следствие.

Внимание! Если вам не очень понятно, о чём речь, обязательно изучите предыдущий урок по ссылкам выше!

Собственно, переходим к вычислениям. Общую дисперсию прибыли можно вычислить как по исходным, так и отсортированным данным, это не имеет значения. Я выберу первый вариант. Сначала найдём среднее значение прибыли по всей выборке:
 млн. руб.

Дисперсию вычислим по определению:

О том, как автоматизировать расчёты в Экселе, я неоднократно рассказывал в своих видеороликах, в частности, на уроке о дисперсиях.

Вычислим межгрупповую дисперсию:

И для очистки совести можно ещё вычислить внутригрупповую дисперсию, чтобы проверить правило сложения дисперсий  и убедиться в правильности выполненных расчётов. Что я и сделал на черновике.

В результате:
, таким образом, 88,32% вариации прибыли обусловлено стоимостью выпущенной продукции. Оставшаяся часть вариации  обусловлена другими факторами.

По коэффициенту  можно судить о силе влияния причины на следствие, однако для оценки этой силы существует «специализированный» показатель, а именно:

эмпирическое корреляционное отношение, равное квадратному корню из . Фактически это отношение соответствующих стандартных отклонений:

Данное отношение тоже изменяется в пределах  , и характеризует тесноту (силу) связи между признаками. Для качественной оценки этой силы часто используют так называемую шкалу Чеддока:

В нашем случае , таким образом, прибыль предприятий очень сильно зависит от стоимости выпущенной продукции.

Задание выполнено.

Следует отметить, что результаты подобных задач не являются какой-то «абсолютной истиной» – это всего лишь математическая модель. Так, мы могли выполнить группировку другим способом, разбить выборочную совокупность на иное количество групп, и тогда у нас получились бы другие средние значения прибыли и другие коэффициенты . Однако, они вряд ли будут сильно отличаться от полученных результатов, и выводы мы сделаем те же самые. И это действительно так.

Кстати, если вы получили явно сомнительные результаты, то можно попробовать подобрать более удачную группировку, например, укрупнить интервалы и сделать меньше групп или использовать равнонаполненную группировку. В реальных  практических исследованиях для повышения репрезентативности целесообразно увеличить объём выборки, т.е. рассмотреть не 30 значений, а 50-100 или даже больше. И в этом нет ничего необычного – ведь первоначальная модель может оказаться неудачной.

Следующее задание для самостоятельного решения:

Пример 62

По результатам выборочного исследования 20 банков известны процентные ставки и соответствующие суммы выданных кредитов:

Требуется:

1) Определить факторный и результативный признак и выдвинуть предположение о наличии и направлении корреляционной связи между показателями.

2) Методом аналитической группировки проверить наличие корреляционной связи, выборку разбить на 4 группы с равным количеством банков в каждой. Результаты представить в виде групповой и аналитической таблицы. Сделать выводы.

3) Вычислить эмпирический коэффициент детерминации и эмпирическое корреляционное отношение. Сделать выводы.

Обратите внимание, что во 2-м пункте вам прямо указано, как следует выполнять группировку – в таких случаях не нужно проявлять самодеятельность – строго следуем указаниям условия. А если решение получится не слишком удачное, то это уже проблемы автора задачи.

Все числа забиты в Эксель и вам осталось быстренько выполнить действия. Решение для сверки совсем близко.

Что ещё можно сказать по теме?

В некоторых задачах результативных признаков может быть несколько, как правило, два, например:  – выпуск продукции  – прибыль и  – себестоимость производства. Никаких проблем – сортируем совокупность по признаку-фактору  (выпуску продукции), при этом в Экселе нужно выделить не два, а уже три столбца, о чём я уже рассказывал в ролике. Далее выполняем группировку и рассчитываем средние значения прибыли и себестоимости по каждой группе. Делаем выводы. Заметим, кстати, что корреляционная связь , вероятно, обратная, поскольку при увеличении выпуска продукции, издержки могут падать (ввиду автоматизации процесса при массовом производстве).

И в заключение хочу сказать, что показатели вам могут быть предложены самые разные, поэтому при решении этих задач следует включать голову и элементарную логику.

На ближайших уроках мы познакомимся с комбинационной группировкой, ещё раз повторим эмпирические коэффициенты детерминации и корреляции и потихоньку перейдём к графическому изображению корреляционных зависимостей.

До скорых встреч!

Решения и ответы:

Пример 62. Решение:

1) Очевидно, что чем больше процентная ставка, тем в среднем будет меньше сумма кредита, поскольку при высоких ставках заёмщику труднее расплачиваться по обязательствам и они занимает меньшие средства. Таким образом, процентная ставка  – признак-фактор, а сумма кредита  – признак-результат. Предполагаемая корреляционная зависимость – обратная («чем больше, тем меньше»).

2) Проверим выдвинутое предположение методом аналитической группировки. Упорядочим выборочную совокупность по возрастанию процентной ставки и разобьём её на  группы по  банков в каждой группе:

По каждой группе вычислим сумму кредитов (графа «Итого») и средние значения кредита  млн. руб. (разделив суммы на объёмы групп, то есть на 5).

Результаты сведём в аналитическую таблицу:

Таким образом, при увеличении процентных ставок средние значения выданных кредитов уменьшаются, что подтверждает обратную корреляционную зависимость суммы кредита от процентной ставки.
3) Найдём эмпирический коэффициент детерминации .
Вычислим общую среднюю (рассчитываю по упорядоченной совокупности):
 млн. руб.

Вычислим общую дисперсию:

Вычислим межгрупповую дисперсию:

В результате:
, таким образом, 83,98% вариации размера кредита обусловлено процентной ставкой (группировочным признаком). Оставшаяся часть вариации  обусловлена другими факторами.

Вычислим эмпирическое корреляционное отношение:

Таким образом, корреляционная зависимость суммы кредита от процентной ставки является очень сильной.

Автор: Емелин Александр


 Блог Емелина Александра

Высшая математика для заочников и не только >>>

(Переход на главную страницу)

Как можно отблагодарить автора?

Zaochnik.com – профессиональная помощь студентам,

cкидкa 15% на первый зaкaз, при оформлении введите прoмoкoд: 5530-hihi5




© Copyright mathprofi.ru, Александр Емелин, 2010-2024. Копирование материалов сайта запрещено