Высшая математика – просто и доступно! Если сайт упал, используйте ЗЕРКАЛО: mathprofi.net Наш форум, библиотека и блог: mathprofi.com | |||
Математические формулы,
Высшая математика для чайников, или с чего начать? Аналитическая геометрия:
Векторы для чайников
Элементы высшей алгебры:
Множества и действия над ними
Пределы:
Пределы. Примеры решений
Производные функций:
Как найти производную?
Функции и графики:
Графики и свойства ФНП:
Область определения функции Интегралы:
Неопределенный интеграл.
Дифференциальные уравнения:
Дифференциальные уравнения первого порядка
Числовые ряды:
Ряды для чайников
Функциональные ряды:
Степенные ряды
Кратные интегралы:
Двойные интегралы
Элементы векторного анализа:
Основы теории поля
Комплексный анализ:
ТФКП для начинающих
Теория вероятностей:
Основы теории вероятностей
Математическая статистика:
Математическая статистика
Не нашлось нужной задачи? Не получается пример?
Часто задаваемые вопросы Заметили опечатку / ошибку? |
17. Комбинационная группировкаНа предыдущем уроке мы освоили аналитическую группировку (обязательно к изучению!), и сейчас на очереди ещё один распространённый способ группировки данных. Комбинационная группировка – это группировка статистической совокупности совместно по двум или бОльшему количеству признаков. Она позволяет выявить устройство совокупности и установить взаимосвязи между её признаками. Рассмотрим выборку, состоящую из котов, среди которых оказалось 20 грациозных (менее 4 кг), 50 обычных (4-6 кг) и 30 толстых (более 6 кг). По существу, перед нами структурная группировка животных по их массе и это первый признак статической совокупности. Теперь возьмём какой-нибудь второй признак, например, разделим всех котов на злых и добрых :) Признак, кстати, качественный, но при желании его можно «оцифровать», рассмотрев некую экспертную шкалу доброты. В результате исследования выяснилось, что среди тощих котов 14 злых и 6 добрых, среди обычных – 24 злых и 26 добрых и среди толстых – 7 злых и 23 добрых. Очевидно, что между рассмотренными признаками есть взаимосвязь. Чем больше масса кота, тем более вероятно, что он окажется добрым. Ибо с лишним весом, полным желудком и Результаты комбинационной группировки обычно сводят в комбинационную таблицу: Внимательно изучаем таблицу и обозначения! Это очень, ОЧЕНЬ важно для практики: 1) Признак-фактор (причину) и его категории располагают в левом столбце (зелёный цвет), а признак-результат (следствие) и его категории – в «шапке» таблицы (жёлтый цвет). Встречается и расположение наоборот (что с моей точки зрения удобнее), но в практических задачах почему-то в ходу первый вариант. Но мы не будем комплексовать, попробуем и так и так. 2) В основной части таблицы (серый цвет) располагаются собственно результаты группировки – совместные групповые частоты . Итак, у нас в наличии есть: тощих и злых и тощих и добрых котов; Итого 6 групп. ! Справка: первый подстрочный индекс означает номер строки (рассматриваем серую область), а второй – номер столбца. Так, значение расположено в 1-й строке, 2-м столбце, а значение – в 3-й строке, 1-м столбце. Сумма всех групповых частот равна объёму статистической совокупности: ! Справка: значок двойного суммирования работает следующим образом: сначала переменная «и» принимает значение и переменная «жи» пробегает все свои значения (от 1 до 2), в результате чего получается сумма . Затем первая переменная принимает значение и «жи» снова пробегает все свои значения: . И, наконец, для получаем сумму . Часто для краткости пишут или даже используют одинарный значок суммы: Заканчиваем разбор таблицы: 3) В правом столбце (зелёный цвет) располагаются суммы частот по строкам (по группам признака-фактора). В нашей совокупности имеется тощих, обычных и толстых котов. Итого: котэ. В нижней строке (жёлтый цвет) подсчитываем суммы по столбцам (по категориям признака-результата): злых и добрых котов. Итого: , в чём и требовалось убедиться. Общая котосумма (объём совокупности) расположена в правом нижнем углу: . ! Если вы что-то не очень поняли, ещё раз ВДУМЧИВО перечитайте объяснения! Может ли в комбинационной группировке быть бОльшее количество факторов? Легко. Так, в нашем примере можно добавить фактор – жилищные условия кота (бездомный или домашний). В результате получится трёхмерная комбинационная группировка с группами: тощие, злые и бездомные коты; И, завершая занимательное котоведение, призываю вас не кастрировать своих (и чужих) котов. И мир станет гармоничнее! …Простите за лирическое отступление, Майкл Джексон любил детей, а я люблю котов :) Да и студентов тоже не тяну за хвосты :) Поэтому переходим к стандартным студенческим задачам, в которых предлагается простейшая двумерная комбинационная группировка: Пример 63 Имеются выборочные данные о выпуске продукции (млн. руб.) и сумме прибыли (млн. руб.) по 30 предприятиям: Определить признак-фактор и признак-результат и высказать предположение о наличии и направлении корреляционной зависимости между признаками. Выполнить комбинационную группировку, разбив значения признака-фактора на 5 равных интервалов, а значения признака-результата – на 3 равных интервала. Сделать выводы. Решение: числовые данные я взял из Примера 61, и если вы с ним не знакомы, то срочно навёрстываем упущенное! В той задаче мы выяснили, что признаком-фактором (причиной) является – выпуск продукции, а признаком-результатом (следствием) – прибыль. При увеличении выпуска продукции, очевидно, растёт средняя прибыль предприятий, таким образом, предполагаемая корреляционная зависимость – прямая («чем больше, тем больше»). И снова подчёркиваю нежёсткость этой зависимости: отдельно взятое предприятие может выпускать много, но сидеть в убытках, и наоборот – есть предприятия с небольшим объёмом выпуска, но высокой прибылью. Однако это всё отклонения от общей тенденции. Выполним комбинационную группировку, разбив значения признака-фактора на 5 равных интервалов, а значения признака-результата – на 3. Начало решения совпадает с началом Примера 61. Упорядочим предприятия по возрастанию признака-фактора: О том, как это быстро сделать в Экселе, есть видео! Далее мы нашли размах вариации млн. руб. и длину каждого интервала млн. руб., после чего у нас получилось 5 групп предприятий: Теперь в каждой группе нужно выделить подгруппы, условно говоря, предприятия с небольшой, средней и высокой прибылью (3 интервала по условию). Для этого берём исходные значения признака-результата (прибыли) и сортируем их по возрастанию. Для компактности расположу упорядоченные значения в три колонки: Вычислим размах вариации: млн. руб. и длину каждого интервала: ,… ай, как удачно разделилось! В результате получилось три интервала прибыли: 12,1-14,6; 14,6-17,1 и 17,1-19,6 млн. руб. Теперь в групповой таблице красными галочками помечаем предприятия 1-го интервала, зелёными – предприятия 2-го интервала и синими – 3-го интервала: По каждой из 5 групп подсчитываем количество предприятий с небольшой (красной), средней (зелёной) и высокой (синей) прибылью. Результаты сведём в комбинационную таблицу, при этом значения признака-фактора удобно расположить по горизонтали в «шапке» таблицы, а значения признака-результата – слева по вертикали: Да, всем ли понятны значения (частоты) в серой области? Частота означает, что у нас есть два предприятия с выпуском продукции 53-65 млн. руб. и невысокой прибылью (12,1-14,6 млн. руб.). Частота означает, что в выборке четыре предприятия с выпуском продукции 77-89 млн. руб. и высокой прибылью (17,1-19,6 млн. руб.). Для самоконтроля подсчитываем суммы по серым столбцам: , , всего: предприятий. Результаты заносим в нижнюю строку (см. таблицу ниже). И самое интересное – суммы по серым строкам: Всего:
, что и требовалось проверить. Результаты заносим в правый столбец. Таким образом, итоговая комбинационная таблица выглядит следующим образом: Сделаем выводы. На основании чего? Смотрим, как располагаются частоты (числа в серой области). Если частоты имеют тенденцию располагаться по диагонали от левого верхнего до правого нижнего угла, то между признаками существует прямая корреляционная зависимость («чем больше, тем больше»). Это наш случай – по таблице хорошо видно, что с увеличением выпуска продукции растут и прибыли предприятий. Если частоты имеют тенденцию располагаться по диагонали от левого нижнего до правого верхнего угла, то между признаками существует обратная корреляционная зависимость («чем больше, тем меньше»). И, наконец, если частоты расположены хаотично, без явной закономерности, то корреляционная зависимость отсутствует либо является слабой. Задание выполнено. И здесь опять возникает вопрос: насколько СИЛЬНО влияет признак-фактор на признак-результат? Ответ на этот вопрос дают эмпирические показатели, о которых мы поговорим на следующем уроке, ну а пока аналогичное задание для самостоятельного решения: Пример 64 Известны выборочные данные по 50 предприятиям одной отрасли – дебиторская задолженность (млн. руб.) и соответствующие дивиденды, начисленные по результатам деятельности (млн. руб.). Справка: дебиторская задолженность – это то, что предприятию должны юридические и физические лица. Определить признак-фактор и признак-результат и высказать предположение о наличии и направлении корреляционной зависимости. Проверить выдвинутое предположение, выполнив комбинационную группировку, при этом значения признака-фактора следует разделить на 6 равных интервалов, а значения признака результата – на 5 групп с одинаковым количеством предприятий в каждой. Сделать выводы. …Как проверить предположение? Пока что визуально. Строим комбинационную таблицу и смотрим, по диагонали ли располагаются частоты, и если да, то по какой. Все расклады приведены в конце предыдущего примера. Решения и ответы: Пример 64. Решение: чем выше дебиторская задолженность предприятия, тем меньше у него свободных средств, которые могут быть направлены на выплату дивидендов, и, соответственно, тем меньше они могут быть. Таким образом, – дебиторская задолженность – признак-фактор, а – начисленные дивиденды – признак-результат. Предполагаемая корреляционная зависимость от – обратная (чем больше задолженность, тем в среднем могут быть меньше дивиденды). Проверим выдвинутое предположение, построив комбинационную группировку. Упорядочим предприятия по возрастанию признака-фактора (дебиторской задолженности): Вычислим размах вариации: млн. руб. По условию, значения признака-фактора нужно разбить на интервалов равной длины, таким образом, длина каждого интервала составит млн. руб. В результате получаем следующие группы: Контроль: Проведём независимую сортировку дивидендов по возрастанию: По условию, значения признака-результата следуют разбить на 5 групп с равным количеством предприятий в каждой, что и сделано в вышеприведённой таблице – в каждой группе у нас по предприятий. В результате получаем 5 интервалов разной длины, при этом внутренние границы интервалов находим как среднее арифметическое «стыковых» значений: – красным цветом – предприятия с дивидендами 19,57 - 19,88 млн. руб.;
По каждой из 6 групп подсчитываем количество красных, синих, зелёных, фиолетовых и оранжевых предприятий, результаты заносим в комбинационную таблицу: И обязательно проверка: по каждому серому столбцу подсчитываем суммы и убеждаемся, что получаются корректные значения (нижняя строка). По каждой серой строке тоже подсчитываем суммы, получая равные значения (правый столбец). Если где-то что-то «не сходится», значит, допущена ошибка по невнимательности. Частоты имеют тенденцию располагаться по диагонали от левого нижнего к правому верхнему углу, что говорит о наличии обратной корреляционной зависимости – начисленных дивидендов от – дебиторской задолженности (чем больше задолженность, тем в среднем меньше дивиденды). Автор: Емелин Александр Высшая математика для заочников и не только >>> (Переход на главную страницу) Как можно отблагодарить автора? |
© Copyright Александр Емелин, mathprofi.ru, 2010-2024, сделано в Блокноте |