Медианный представитель что это
Глава 8. Статистика и вероятность (стр. 2 )
Из за большого объема этот материал размещен на нескольких страницах: 1 2 3 4 |
Решение. Получившаяся концентрация 12% — это среднее арифметичеекое концентраций обоих раетворов. Примем объем второго раствора за т литров. Тогда
6 1O+m 15 12
Средняя спорость (среднее гармоничеспое)
іЭта задача вызывает много трудностей. Большинство старшекласеников дают ответ 50 км/ч, хотя в учебниках шестого или седьмого класса такие задачи разбираютея подробно. Забыли?
Решение. Обозначим вееь путь N км. Время, затраченное на
путъ в деревню, равно
Значит, средняя екороеть равна
Как видим, расстояние роли не играет. Но ведь получилось не среднее арифметическое. Число 2 или, что то же
называется средним гармоническим чисел о и
6. Заметим, что ви о, ни b не должвы равняться нулю.
Средний банповсний процент
Задача 203. В какой банк выгоднее поместить вклад сроком
Решение. Узваем, чему равна средняя ставка в банке А. Первый год вклад умножится на b, = 1,09, а во второй год
на # = 1,11. Значит, за два года вклад вырастет в b-,
= 1,09- 1,11 = 1,2099 раз. іЭто то же самое, как если бы банк А каждый год умножал вклад на 1,23009 = 1,09995, то есть
Медиана
и медианный представитель
Задача 204. Найти медиану набора 1; 2; 4; 5; 7; 8; 8.
Задаяа 205. Найти медиану набора чиеел —0,3; —2; 1; 0; 0,3;
Решение. Сначала чиела нужно упорядочить:
—1; —2; —0,3; —0,2; 0; 0,1; 0,3; 1; 1,2; 1,2.
Beero чиеел 10. Одного чиела, етоящего посередине, нет. Не беда — возьмем два. ІЗто числа 0 и 0,1 Медианой будет любое из них, а также любое чиело, раеположенвое между ними. Таким образом, медиан может быть мвого. Обычно в качестве медианы берут среднее арифметическое двух ce-
рединных чиеел: 0+0,1 = 0,05.
Но, повторим, можно взять и 0, или 0,1 или 0,03 и т. п.
Медиана выгодно отличается от среднего арифметичеекого тем, что определяетея ередними по величине чиелами в наборе и не зависит от еамых больших и сампіх малпіх. Говорят, что i38
а) Найдите среднее арифметическое данных.
6) Найдите медиану данных.
г) Какое из этих найденных средних лучше описывает средний расход крупной реки?
Решение. в) Сложим все данные о расходе и разделим на
13. Получим приблизительно 37 646, 15 куб. м/с.
Считается средний объем воды, проходящий за секунду через устье реки в течение периода наблюдений.
6) Упорядочим даннъіе:
13600, 13600, 16000, 16200, ITIOO, 18600, 19200,
Медианой является 7-е по счету значение в этом ряду:
Ответ: в) 37 646,15; 6) 19 200; в) fiрахмалутра; г) Медиана.
После:
Рис. Meduoпнoя фклsтрация восстановияа фото кота
Росстат впервые рассчитал зарплату среднестатистического работника
Медианная среднемесячная зарплата в российской экономике за 2020 год оценена в 32 422 руб., что на 6,4% выше аналогичного показателя 2019 года (30 458 руб.), следует из данных, опубликованных Росстатом в пятницу, 11 июня.
Росстат впервые рассчитал медианную зарплату по новой методике, которая также опубликована сегодня. Расчет основан на административных данных Пенсионного фонда о начисленных страховых взносах с зарплат.
Медианная зарплата означает, что 50% рабочих мест оплачиваются ниже этого значения и 50% рабочих мест — выше, то есть речь идет о зарплате, которую получает среднестатистический работник в России. Показатель определялся Росстатом на основании ранжированного по возрастанию распределения всех рабочих мест по размерам зарплаты. Ранжировалась именно оплата труда по рабочим местам, а не по работникам (один работник может иметь несколько рабочих мест как у одного работодателя, так и у нескольких).
Росстат получил и проанализировал записи более чем 75 млн человек, уточнили РБК в пресс-службе ведомства.
Среднемесячная номинальная зарплата в российских организациях за 2020 год составила 51 352 руб., сообщал ранее Росстат. А с учетом заработков в неформальном секторе среднемесячный трудовой доход в 2020 году составил около 42,4 тыс. руб., следует из данных Росстата. Таким образом, медианная зарплата оказалась более чем в полтора раза ниже средней зарплаты в организациях и в 1,3 раза меньше среднего трудового дохода. Чем выше разница между этими показателями, тем больше разрыв между сверхвысокими зарплатами меньшинства и более низкими заработками большинства.
На основе данных ПФР Росстат учел зарплаты в малом бизнесе и у индивидуальных предпринимателей, тогда как средняя зарплата считается только по данным средних и крупных предприятий.
Росстат опубликовал медианную зарплату в связи с новым порядком определения минимального размера оплаты труда (МРОТ) с 2021 года. Теперь МРОТ привязан к медианной зарплате, рассчитываемой Росстатом, а не к потребительской корзине, как раньше. В этом году МРОТ составляет 42% от медианной зарплаты.
До этого Росстат рассчитывал медианную зарплату раз в два года, но по другой методике. По данным последнего обследования в 2019 году, медианная зарплата составляла 34,3 тыс. руб., но это значение выводилось только по данным для среднего и крупного бизнеса, при этом исследование является выборочным (в 2019 году было охвачено 27,1 млн работников). Росстат планирует продолжать это обследование, по крайней мере в 2021 году.
Росстат также считает показатель медианного среднедушевого дохода, который в 2020 году составил 27 036 руб. в месяц — чуть больше, чем в 2019 году (26,4 тыс. руб.).
Медиана в статистике
Центральную тенденцию данных можно рассматривать не только, как значение с нулевым суммарным отклонением (среднее арифметическое) или максимальную частоту (мода), но и как некоторую отметку (значение в совокупности), делящую ранжированные данные (отсортированные по возрастанию или убыванию) на две равные части. Половина исходных данных меньше этой отметки, а половина – больше. Это и есть медиана.
Итак, медиана в статистике – это уровень показателя, который делит набор данных на две равные половины. Значения в одной половине меньше, а в другой больше медианы. В качестве примера обратимся к набору нормально распределенных случайных чисел.
Очевидно, что при симметричном распределении середина, делящая совокупность пополам, будет находиться в самом центре – там же, где средняя арифметическая (и мода). Это, так сказать, идеальная ситуация, когда мода, медиана и средняя арифметическая совпадают и все их свойства приходятся на одну точку – максимальная частота, деление пополам, нулевая сумма отклонений – все в одном месте. Однако, жизнь не так симметрична, как нормальное распределение.
Допустим, мы имеем дело с техническими замерами отклонений от ожидаемой величины чего-нибудь (содержания элементов, расстояния, уровня, массы и т.д. и т.п.). Если все ОК, то отклонения, скорее всего, будут распределены по закону, близкому к нормальному, примерно, как на рисунке выше. Но если в процессе присутствует важный и неконтролируемый фактор, то могут появиться аномальные значения, которые в значительной мере повлияют на среднюю арифметическую, но при этом почти не затронут медиану.
Медиана выборки – это альтернатива средней арифметической, т.к. она устойчива к аномальным отклонениям (выбросам).
Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение, если сравнивать с отклонениями от любой другой величины. Даже меньше, чем от средней арифметической, о как! Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объектов около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.).
Формула медианы
Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.
Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:
№Me – номер значения, соответствующего медиане,
N – количество значений в совокупности данных.
Тогда медиана обозначается, как
Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:
В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу.
Для начала (после ранжирования данных) находят медианный интервал. Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.
Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.
Обратимся к наглядной схеме.
Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:
где xMe — нижняя граница медианного интервала;
iMe — ширина медианного интервала;
∑f/2 — количество всех значений, деленное на 2 (два);
S(Me-1)— суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;
fMe — число наблюдений в медианном интервале.
Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%.
Для примера рассчитаем медиану по следующим данным.
Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.
По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.
То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.
Расчет медианы в Excel
Медиану для числовых данных легко найти, используя функцию Excel, которая так и называется — МЕДИАНА. Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.
Напоследок предлагаю задачку. Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:
Мода, медиана и среднее значение выборки – это разный способ определить центральную тенденцию в выборке.
Ниже видеоролик о том, как рассчитать медиану в Excel.
Урок по теории вероятностей и статистике «Медиана» (7-й класс)
Разделы: Математика
Класс: 7
Цель урока: сформировать у учащихся представление о медиане набора чисел и умение вычислять ее для несложных числовых наборов, закрепление понятия среднего арифметического набора чисел.
Тип урока: объяснение нового материала.
Оборудование: доска, учебник под ред. Ю.Н Тюрина “Теория вероятностей и статистика”, компьютер с проектором.
Ход урока
1. Организационный момент.
Сообщить тему урока и сформулировать его цели.
2. Актуализация прежних знаний.
Проверка домашнего задания с помощью проектора (Приложение 1):
3. Изучение нового материала.
На предыдущем уроке мы познакомились с такой статистической характеристикой как среднее арифметическое набора чисел. Сегодня мы посвятим урок еще одной статистической характеристике – медиане.
Не только среднее арифметическое показывает, где на числовой прямой располагаются числа какого-либо набора и где их центр. Другим показателем является медиана.
Медианой набора чисел называется такое число, которое разделяет набор на две равные по численности части. Вместо “медиана” можно было бы сказать “середина”.
Сначала на примерах разберем, как найти медиану, а затем дадим строгое определение.
Рассмотрим следующий устный пример с применением проектора (Приложение 2)
В конце учебного года 11 учеников 7-го класса сдали норматив по бегу на 100 метров. Были зафиксированы следующие результаты:
Результат в секундах
После того как ребята пробежали дистанцию, к преподавателю подошел Петя и спросил, кокой у него результат.
“Самый средний результат: 16,9 секунды”, – ответил учитель
“Почему?” – удивился Петя. – Ведь среднее арифметическое всех результатов – примерно 18,3 секунды, а я пробежал на секунду с лишним лучше. И вообще, результат Кати (18,4) гораздо ближе к среднему, чем мой”.
“Твой результат средний, так как пять человек пробежали лучше, чем ты, и пять – хуже. То есть ты как раз посередине”, – сказал учитель. [ 2 ]
Далее предложить учащимся самостоятельно рассмотреть по учебнику примеры 1,2,3 и сформулировать алгоритм нахождения медианы набора чисел.
Предложить учащимся самостоятельно сформулировать определение медианы набора чисел, затем прочитать в учебнике два определения медианы ( стр. 50), далее разобрать примеры 4 и 5 учебника (стр.50-52)
Обратить внимание учащихся на важное обстоятельство: медиана практически не чувствительна к значительным отклонениям отдельных крайних значений наборов чисел. В статистике это свойство называется устойчивостью. Устойчивость статистического показателя – очень важное свойство, оно страхует нас от случайных ошибок и отдельных недостоверных данных.
4. Закрепление изученного материала.
Решение номеров из учебника к п.11 “Медиана”.
=( 1+3+5+7+9):5=25:5=5
= Ме
Набор чисел: 1,3,5,7,14.
=( 1+3+5+7+14):5=30:5=6
> Ме
а) Набор чисел: 3,4,11,17,21
б) Набор чисел: 17,18,19,25,28
в) Набор чисел:25, 25, 27, 28, 29, 40, 50
Вывод : медиана набора чисел, состоящего из нечетного числа членов равна числу, стоящему посередине.
а) Набор чисел:2, 4, 8, 9.
Медиана набора чисел, содержащего четное число членов равна полусумме двух чисел, стоящих посередине.
Ученик получил в течении четверти следующие оценки по алгебре:
5, 4, 2, 5, 5, 4, 4, 5, 5, 5.
= ( 5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4
Упорядочим набор чисел: 2,4,4,4,5,5,5,5,5,5
Всего 10 чисел, чтобы найти медиану надо взять два средних числа и найти их полусумму.
Вопрос к учащимся: Если бы вы были учителем, какую бы вы поставили оценку за четверть этому ученику? Ответ обоснуйте.
Президент компании получает зарплату 300000 руб. три его заместителя получают по 150000 руб., сорок служащих – по 50000 руб. и зарплата уборщицы составляет 10000 руб. Найдите среднее арифметическое и медиану зарплат в компании. Какую из этих характеристик выгоднее использовать президенту в рекламных целях?
= ( 300000+3·150000+40·50000+10000):(1+3+40+1) = 2760000:4561333,33 (руб.)
В рекламных целях выгоднее использовать среднее арифметическое зарплат, т.к. она выше.
Задача 3. (Предложить учащимся решить самостоятельно, задачу спроецировать с помощью проектора)
В таблице показан примерный объем воды крупнейших озер и водохранилищ России в куб. км. (Приложение 3) [ 4 ]
Объем воды в куб. км
А) Найдите средний объем воды в данных водоемах (среднее арифметическое);
Б) Найдите объем воды в среднем по величине водоеме (медиану данных);
В) По вашему мнению, какая из этих характеристик – среднее арифметическое или медиана – лучше описывает объем типичного крупного водоема России? Ответ объясните.
в) Медиана, т.к. данные содержат значения сильно отличающиеся от всех прочих.
А) Сколько чисел в наборе, если его медианой служит ее девятый член?
Б) Сколько чисел в наборе, если его медианой служит среднее арифметическое 7-го и 8-го членов?
Г) Каждое из чисел набора увеличили на 3. Что произойдет со средним арифметическим и медианой?
Конфеты в магазине продают на вес. Чтобы узнать, сколько конфет содержится в одном килограмме, Маша решила найти вес одной конфеты. Она взвесила несколько конфет и получила следующие результаты:
12, 13, 14, 12, 15, 16, 14, 13, 11.
= 13,33
Для оценки веса одной конфеты пригодны обе характеристики, т.к. они не сильно отличаются друг от друга.
Методические аспекты преподавания статистики и теории вероятностей в школьном курсе математики
Онлайн-конференция
«Современная профориентация педагогов
и родителей, перспективы рынка труда
и особенности личности подростка»
Свидетельство и скидка на обучение каждому участнику
Методические аспекты преподавания статистики и теории вероятностей в школьном курсе математики
Из чего должен состоять школьный курс статистики
и теории вероятностей
Часто считают, что статистические данные — это обязательно большие массивы. На самом деле, даже одна величина может являться статистическим данным, если её использовать как источник информации.
Описательная статистика — обработка собранных данных с помощью подходящих характеристик. Например, частот, средних значений, мер рассеивания или симметрии.
Анализ статистических данных — умение на основе данных и их описания делать выводы, выдвигать, проверять или опровергать гипотезы, исследовать случайную изменчивость первичных данных и описательных характеристик.
Начала теории вероятностей — теоретические основания для изучения закономерностей случайной изменчивости.
Математические методы статистики в школьном курсе не изучаются.
Основные результаты изучения статистики и теории вероятностей
Предметные результаты изучения статистики и вероятности на базовом уровне должны обеспечивать:
умение оперировать понятиями: столбиковые и круговые диаграммы, таблицы; среднее арифметическое, медиана, наибольшее и наименьшее значения, размах числового набора;
умение извлекать, интерпретировать и преобразовывать информацию, представленную в таблицах и на диаграммах, отражающую свойства и характеристики процессов и явлений;
умение распознавать изменчивые величины в окружающем мире;
умение оперировать понятиями: случайный опыт, элементарное событие, случайное событие, вероятность события;
умение находить вероятности случайных событий в опытах с равновозможными элементарными событиями;
умение решать задачи методом организованного перебора и с использованием правила умножения;
умение оценивать вероятности реальных событий и явлений, понимать роль практически достоверных и маловероятных событий в окружающем мире и в жизни;
знакомство с понятием независимых событий;
знакомство с законом больших чисел и его ролью в массовых явлениях.
Под законом больших чисел в широком смысле понимается общий принцип, согласно которому совокупное действие случайных факторов приводит к результату, почти не зависящему от случая. Под законом больших чисел в узком смысле понимают ряд математических теорем, в каждой из которых для тех или иных совокупностей условий устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным.
Меры центральной тенденции (средние значения)
Числовой набор — неупорядоченная коллекция данных. Для описания числовых массивов часто применяют средние значения (меры центра или меры центральной тенденции). Формально любое число из числового набора можно рассматривать как меру центральной тенденции.
Среднее арифметическое — наиболее употребительное среднее. Формула для среднего арифметического n чисел имеет вид
Важным свойством среднего арифметического является то, что оно в одинаковой степени зависит от всех чисел в наборе. Среднее арифметическое используется для описания однородных суммируемых данных. С механической точки зрения среднее арифметическое — центр масс, точка равновесия.
Пример. Средняя зарплата работников одинаковой квалификации в близких условиях. Наилучшее представление об этой величине даёт среднее арифметическое.
Неудачное применение среднего арифметического — школьные отметки, средний возраст игроков команды, средняя температура по больнице. Все эти величины не суммируемы. Другой пример неудачного среднего арифметического — средняя зарплата в отрасли или в городе. В этом примере нет однородности данных.
Пример. Средний процент по вкладу за несколько лет.
1,04 ⋅ 1,05 ⋅ 1,06=1,15752 раз.
Средний ежегодный прирост составит ≈1,049968.
Мы нашли среднее геометрическое коэффициентов годового прироста вклада. Среднее геометрическое не больше среднего арифметического (они совпадают, только если все значения одинаковы).
Формула для среднего геометрического n положительных чисел имеет вид
Как выбирать описательные характеристики?
При выборе описательных характеристик нужно учитывать следующие соображения:
Природу данных. Например, в предыдущих лекциях обсуждалось, что чтобы вычислить среднюю зарплату работников одинаковой квалификации в близких условиях, лучше всего использовать среднее арифметическое, а в случае банковских вкладов естественным способом усреднения процентов по вкладу является вычисление среднего геометрического.
Цель исследования. Рассмотрим пример: школьник прыгал в длину три раза. Длина первого прыжка — 1,5 м, длина второго прыжка — 2 м, длина третьего прыжка — 2,5 м. Если тренер захочет выяснить типичную длину прыжка этого школьника, то можно посчитать среднее арифметическое. Если цель — похвалить школьника и записать рекорд, то в качестве меры центральной тенденции тренер выберет максимальную длину прыжка. Если тренер хочет указать школьнику на неверную технику, он выберет минимальную длину прыжка.
Сложившиеся традиции. Мы уже обсуждали, что вычисление итоговой отметки с помощью среднего арифметического — не самое удачное решение, так как отметки не суммируемы. Тем не менее, это удобно, и все к этому привыкли.
В массиве 100 чисел. Каждое число массива увеличили на 1. Как изменилось среднее арифметическое?
Увеличилось на 100.
Увеличилось на 1. верно
Увеличилось на 0,01.
Зависит от конкретных чисел в массиве.
В таблице приведены данные об изменении средней цены на золото в течение 7 лет по отношению к прошлогодней цене.
Определите, на сколько процентов в год в среднем менялась цена золота за указанный период. Ответ округлите до сотых.
Медиана и медианный представитель
Для вычисления медианы числа в наборе сначала нужно упорядочить. Если количество чисел в массиве нечётно, то в упорядоченном наборе (вариационном ряду) можно однозначно определить центральное число. Это и есть медиана.
Пример. Ниже перечислены четвертные отметки по математике некоторого школьника.
Если количество значений чётно, то центральных чисел два. Любое из них и все числа между ними удовлетворяют определению медианы.
Медиана определена неоднозначно для наборов, где количество значений чётно. На практике для устранения неоднозначности обычно берут полусумму двух центральных чисел.
Главное свойство медианы — устойчивость относительно слишком больших и слишком малых значений, сильно отличающихся от большинства прочих значений массива (выбросов). Также медиана хорошо отвечает на вопрос о типичном представителе совокупности. Недостатком медианы является то, что она определяется лишь одним или двумя типичными представителями. При вычислении медианы теряется очень много информации о числах в наборе.
Пример. Население городов-миллионеров России.
Средняя численность населения городов-миллионеров России в 2019 году составляет 2240,2 тыс. человек. Нет города, чьё население было бы близко к этому значению. Среднее арифметическое в данном случае не является показательной характеристикой из-за Москвы и Санкт-Петербурга, население которых сильно выделяется на общем фоне. Медиана населения равна 1165 тыс. чел., это население Омска. Омск — медианный представитель.
Числовой массив или числовой набор — общее название. Отличается от статистического ряда или выборки тем, что не имеет специальных свойств. Выборка может быть из некоторой большой совокупности. Для исследования выборочной совокупности нужны выборочные методы.
Статистический ряд — это данные, расположенные в определённой последовательности (по времени, по возрастанию, в лексикографическом порядке и т. п.). Для исследования рядов применяются специальные методы (например, скользящие средние, анализ динамики).
Упражнения
Упражнение 1
Среднее арифметическое
Медиана
Среднее геометрическое
Наибольшее значение
Наименьшее значение
Упражнение 2
Средний рост учащихся в классе 165 см. Медиана равна 168 см. Укажите утверждения, которые верны всегда, вне зависимости от конкретных числ в наборе.
Не меньше половины учеников в этом классе выше 165 см.
Не меньше половины учеников в этом классе выше 168 см.
В этом классе обязательно найдётся ученик ростом ровно 168 см.
В этом классе обязательно найдётся ученик, рост которого меньше 165 см.
Случайная изменчивость. Тенденции и случайные колебания
На двух диаграммах показано, как с возрастом меняется вес девочек и мальчиков обычного телосложения. Эти данные медицинской статистики получены за много лет наблюдений. Средний ожидаемый вес увеличивается плавно — тенденция показана синей линией. Но каждый конкретный ребёнок может отставать от тенденции и обгонять её. Колебания вызваны индивидуальными особенностями, образом жизни и питания и другими случайными факторами, часть из которых неизвестна.
Тенденция (тренд) — характерное, устойчивое изменение во времени. Как правило, тенденция обусловлена долгосрочными факторами, которые заставляют величину расти или убывать.
Тысячи мальчиков и девочек взвешивают в школах, детских садах и поликлиниках. Поэтому общие тенденции в развитии детей известны. Однако бывает так, что изменчивая величина не имеет аналогов ни в прошлом, ни в настоящем. Например, таких явлений много в экономике: экономическая ситуация в мире уникальная и меняется всё время. При исследовании экономических процессов настоящее нельзя сравнивать с прошлым, а поэтому прогнозы в экономике обычно делать труднее, чем предсказывать погоду.
Пример. Рассмотрим мировые цены на нефть в первом полугодии 2008 г. и во втором полугодии 2014 г.
Тенденция формируется под действием факторов, которые действуют постоянно или длительное время. Случайные колебания вызваны краткосрочными случайными и бессистемными явлениями.
Часто изменчивость в природных, экономических и социальных явлениях состоит из двух составляющих. Первая составляющая — тенденция, которая обусловлена долгосрочными факторами. Вторая составляющая — случайные отклонения, вызванные разнонаправленными краткосрочными действиями, которые зачастую невозможно предвидеть.
Одна из важных задач статистики — научиться выделять тенденции в изменчивых явлениях и отличать их от незначительных случайных колебаний.
Один из способов выделения тенденции — усреднение. Средние значения многих величин меньше подвержены случайной изменчивости, чем отдельные значения. Это проявление статистической устойчивости.
Упражнение 1
В таблице даны результаты 25 измерений напряжения в бытовой электросети. Все измерения сделаны днём, в случайно выбранные моменты.
В России номинальное напряжение в бытовых сетях 220 В (вольт). На самом деле напряжение редко равно в точности 220 В. Моменты включения и выключения электрических приборов случайные и приводят к случайной изменчивости напряжения. Кроме того, производитель электроэнергии не может обеспечить напряжение в точности равное 220 В.
Электрические приборы в России рассчитаны на колебания напряжения в определённых пределах. На задней панели микроволновой печи или холодильника обычно есть табличка, где написан интервал рабочего напряжения. Например, от 190 до 250 В. Если напряжение выходит за эти пределы, прибор может выйти из строя. Поэтому в некоторых случаях люди используют стабилизаторы напряжения, которые уменьшают изменчивость.
Среднее арифметическое напряжение по данным таблицы равно 222,2 В. На сколько медиана отличается от среднего арифметического? верно
Графическое представление случайной изменчивости
Гистограмма. «Двускатная» форма распределения
Школьникам можно предложить следующую практическую работу: измерить длину шнурка. Каждому участнику работы выдаётся несколько с виду одинаковых шнурков. Задача каждого — доступным ему способом измерить шесть шнурков. В процессе можно меняться шнурками.
Чтобы изобразить результаты графически, требуется группировка данных. Диапазон значений разбивается на интервалы, в каждый интервал попадает какое-то количество измерений: получаются частоты интервалов. Диаграмма частот называется гистограммой.
При подходящем выборе группировки получается характерная гистограмма. Очень малых ( 70 – 80 см) результатов мало. Так же мало очень больших результатов измерений ( 92 – 95 см). Края гистограммы низкие. Центральная часть высокая — это область концентрации значений.
Так получается из-за действия разнонаправленных и независимых факторов. Маловероятно, что все факторы, не сговариваясь, «уменьшат» результат. Поэтому малых результатов мало. Так же маловероятно, что все независимые факторы «сыграют в плюс». Поэтому больших результатов тоже мало. В большинстве случаев часть факторов увеличивает, а часть — уменьшает результат измерений.
Похожую картину можно наблюдать в простом эксперименте с монетой. Если бросить 10 монет, часть из них падает орлом, часть — решкой вверх. Маловероятно, что все 10 упадут орлом вверх или все 10 дадут решку. Диаграмма частоты выпадения орлов получается похожей на то, что мы видели в примере со шнурками.
«Односкатная» форма распределения
Не все природные случайные величины имеют «двускатное» распределение.
На рисунке — гистограмма длительности телефонных разговоров абонента. Шаг группировки — 25 секунд. Видно, что коротких разговоров намного больше, чем длинных. Здесь совершенно иной вид изменчивости, случайные факторы работают иначе, и это отличие отражено на диаграмме распределения, которое имеет «односкатную» форму.
Получить похожее по форме распределение можно с помощью простого эксперимента. Например, можно бросать одну игральную кость до тех пор, пока не случится шестёрка. Чаще всего требуется один бросок! Два броска требуются реже, чем один, три — ещё реже и так далее.
Может показаться странным и неправдоподобным, что такие разные по своей сути эксперименты — замер длительности разговора и количество бросков кости до шестёрки — имеют схожие черты. Это кажется случайностью.
Разобраться в этом, увидеть общие черты и понять общую подоплёку этих опытов помогает уже теория вероятностей; только в рамках статистики здесь не справиться.
Случайные опыты и события в них
Всякое случайное событие связано с некоторыми условиями. Если мы создаём или описываем такие условия, мы тем самым производим некоторый случайный эксперимент, или случайный опыт. Если случайный эксперимент не описан или описан плохо, то нельзя говорить о вероятностях событий.
Например, о шансах спортивных команд на победу можно говорить, только если эти команды могут встретиться и сыграть. О вероятности выпадения шести очков на игральном кубике можно говорить, только если кубик бросают.
Случайный эксперимент (случайный опыт) — это условия и обстоятельства, в которых мы рассматриваем случайные события.
Пример. Случайный эксперимент — телефонный разговор. Можно говорить о разных случайных событиях. Например, «длительность разговора составит от 5 до 10 минут» или «разговор прервётся из-за плохой связи».
Пример. Школьник пишет контрольную работу по математике. Это в нашем понимании случайный эксперимент, и в нём возникают случайные события. Например, «школьник сделает не больше трёх ошибок» или «школьник получит отметку «отлично».
Пример. Бросание игрального кубика. Выпадение шестёрки — случайное событие. Другое случайное событие — «выпадет больше двух очков».
Пример. Подсчёт количества крупных пожаров в определённом городе в будущем году — тоже случайный опыт, поскольку условия определены, а результат неизвестен. Примеры случайных событий: «крупных пожаров не будет» или «крупных пожаров будет больше шести» и т. п.
Вероятность случайного события — это числовая мера правдоподобия этого события.
Иногда вероятности событий можно рассчитать математически, но часто их приходится оценивать, то есть находить приближённо, повторяя один и тот же случайный опыт много раз.
Отношение числа опытов, в которых случайное событие произошло, к общему числу проведённых опытов называется частотой данного случайного события в этой серии опытов.
Вероятности и частоты связаны. Если опыт повторять достаточно много раз, то окажется, что частота события близка к его вероятности.
Этот факт связывает теорию вероятностей с практикой. Он позволяет оценивать вероятности с помощью статистических опытов и прогнозировать частоты наступления событий, зная их вероятности. Так проявляется статистическая устойчивость в повторяющихся сериях случайных экспериментов.
Упражнение 1
Обычную симметричную монету, у которой на одной стороне изображён орёл, а другая сторона — решка, бросили шесть раз. Все шесть раз эта монета выпадала орлом. Какое утверждение или какие из утверждений верны?
В следующий раз более вероятно, что выпадет орёл, чем решка.
В следующий раз более вероятно, что выпадет решка, чем орёл.
В следующий раз орёл и решка могут выпасть с равными шансами верно
Седьмой раз подряд орёл выпасть не может.
При седьмом броске тоже выпадет орёл.
Упражнение 2
Известно, что растения-потомки, полученные при определённом виде скрещивания двух растений гороха с жёлтыми горошинами, дают в среднем три четверти жёлтых и четверть зелёных горошин.
В потомстве от скрещивания было 25 растений, с которых удалось собрать 900 горошин. Сколько среди них разумно ожидать зелёных горошин?
от 300 до 400
от 180 до 260 верно
от 100 до 200
от 400 до 700
В каждом опыте можно выделить элементарные события, из которых состоят все остальные события. Здесь можно провести аналогию с геометрией. Геометрические фигуры на плоскости состоят из точек. Точно так же события внутри случайного опыта состоят из элементарных событий.
В результате случайного опыта обязательно наступает только одно элементарное событие.
Каждому элементарному событию назначается вероятность. Чаще всего это сделать непросто, но есть такие случайные опыты, в которых все элементарные события считаются равновозможными в силу симметрии.
Пример. В случайном опыте бросания монеты два элементарных события: выпадение орла и выпадение решки. Монета симметрична, поэтому оба эти события равновозможны и обоим назначается вероятность 0,5.
Пример. При подбрасывании игральной кости элементарных событий шесть: «выпадет одно очко», «выпадет два очка» и т. д. вплоть до события «выпадет шесть очков». Эти события также равновозможны, каждому из них назначается вероятность 16.
Опытов с равновозможными элементарными событиями не так много, в основном это искусственные опыты: игры, жеребьёвка и т. п.
Пример. Игральную кость бросают дважды. В этом опыте 6 ⋅ 6=36 элементарных событий, которые удобно представить таблицей.
Элементарное событие нельзя разделить на более простые. Может возникнуть вопрос, почему пару чисел, выпавших при двух бросаниях игральной кости, нельзя разделить на два более простых события: выпадение числа при первом броске и выпадение числа при втором броске. Ответ состоит в том, что выпадение первого числа является элементарным событием, но не в нашем опыте, а в опыте с одним броском. (При этом в нашем опыте это тоже событие, но не элементарное, так как оно отвечает целой строке из клеток таблицы).
Упражнение 1
В классе 25 учеников. Учитель во время урока вызывает к доске одного ученика. Сколько различных элементарных событий имеет этот случайный опыт?
верно
Упражнение 2
Сколько элементарных событий в случайном опыте, в котором монету бросают два раза?
верно
Задачи для самостоятельного решения
Задача 1. В киоске продаётся мороженое трёх сортов: сливочное, шоколадное и клубничное. Андрей и Борис покупают по одной порции. Выпишите в виде таблицы элементарные события этого опыта. Сколько всего получилось элементарных событий? Начало таблицы показано ниже.
Задача 2. Игральную кость подбрасывают дважды. Нарисуйте в тетради таблицу элементарных событий этого эксперимента. Выделите в таблице элементарные события, при которых в сумме выпало:
чётное число очков.
Задача 3. Монету бросают до тех пор, пока не выпадет орёл. Пользуясь обозначениями О и Р, запишите несколько элементарных событий этого опыта. Сколько всего элементарных событий в этом случайном опыте?
Вероятности элементарных событий. Равновозможные элементарные события.
Опыты с равновозможными элементарными событиями
В некоторых случаях вероятности элементарных событий можно рассчитать. В других случаях их приближённо можно найти из наблюдений. Иногда вероятности элементарных событий так и остаются неизвестными.
В любом случайном опыте сумма вероятностей всех элементарных событий равна 1.
Интересен случай, когда элементарные события в опыте имеют одинаковые шансы. Например, при одном бросании игральной кости элементарные события это 1, 2, 3, 4, 5 или 6 очков. Если кость правильная, то шансы этих шести элементарных событий одинаковы.
Если в случайном опыте шансы всех элементарных событий одинаковы, то такой опыт называется случайным опытом с равновозможными элементарными событиями.
В природе опыты с равновозможными элементарными событиями встречаются очень редко.
Если в случайном опыте ровно N равновозможных элементарных событий, то вероятность каждого из них равна 1N.
Пример. В случайном опыте бросания монеты два элементарных события: выпадение орла и выпадение решки. Монета симметрична, поэтому эти события равновозможны и обоим назначается вероятность 0,5.
Пример. При бросании двух игральных костей элементарных событий 36, и все они равновозможны. В дальнейшем мы часто будем рассматривать случайные опыты, в которых все элементарные события равновозможны. Такие опыты также возникают при раздаче игральных карт, в лотереях, жребиях, социальных исследованиях и в других искусственных экспериментах.
Пример. Механические часы со стрелками остановились, потому что иссякла батарейка. В качестве случайного эксперимента возьмём время остановки часов. Все 720 элементарных событий этого эксперимента разумно считать равновозможными, поэтому вероятность одного элементарного события равна 1720. Можно было бы рассмотреть и другой случайный эксперимент — положение минутной стрелки в момент остановки часов. Набор элементарных событий этого эксперимента состоит уже не из 720, а из 60 элементарных событий, эти события также равновозможны. Следовательно, вероятность каждого из них равна 160.
Хотя в природе опыты с равновозможными элементарными событиями практически не встречаются, эти опыты очень важны. Во-первых, с помощью искусственных опытов с равновозможными событиями часто удаётся находить приближённые решения сложных и важных задач, причём не только задач по теории вероятностей. Во-вторых, эксперименты с равновозможными событиями удобны при изучении теории вероятностей. Традиционно теорию вероятностей начинают изучать именно с таких опытов. Здесь кроется опасность: из-за «злоупотребления» равновозможными элементарными событиями в обучении, многие думают, что во всех опытах события равновозможны.
Пример опыта с неравновозможными элементарными событиями
Опыты с равновозможными элементарными событиями встречаются в природе очень редко. Как правило, они возникают в искусственных экспериментах.
Рассмотрим несколько примеров опытов с неравновозможными элементарными событиями.
Чтобы назначить вероятность элементарным событиям в опыте с неравновозможными элементарными исходами, приходится прибегать к статистическому измерению вероятности. Эксперимент многократно повторяют, подсчитывают частоту элементарных событий и объявляют частоту вероятностью.
Также встречаются эксперименты, в которых назначить вероятность элементарным событиям невозможно, потому что нет ни симметрии, ни частотного анализа, ни других средств.
Пример. Бросание чашки на пол. Элементарных событий в этом эксперименте два: чашка либо разобьётся, либо нет. В зависимости от условий эксперимента (сила броска, состояние чашки, характер поверхности пола) вероятности могут быть разные, поэтому элементарные события нельзя считать равновозможными. Повторить эксперимент много раз, чтобы вычислить частоту, также невозможно: если чашка разбилась, то эксперимент заканчивается.
Описание случайного опыта и назначение вероятностей элементарных событий
Рассмотрим следующий эксперимент: изначально муха сидит в левом нижнем углу проволочной сетки (точка A) и ползёт в противоположную вершину квадрата (точку B). Необходимо найти вероятность того, что муха проползёт через точку C.
В зависимости от того, как трактовать эксперимент, одному и тому же элементарному исходу можно назначить различные вероятности.
1 способ. Если считать, что мухе изначально предъявляют полный список из 20 маршрутов, она случайным образом выбирает один из них и ползёт по нему, то все элементарные события такого эксперимента равновозможны. В этом случае вероятность выбора каждого маршрута равна 120, а значит, вероятность того, что муха проползёт через точку C, равна 920.
Упражнение 1
верно
Упражнение 2
В некотором случайном эксперименте 25 элементарных событий, все они равновозможны. Найдите вероятность каждого элементарного события.
верно
Задачи для самостоятельного решения
Задача 1. Автомобиль подъезжает к перекрёстку. Определим возможные элементарные события:
«автомобиль повернёт направо»,
«автомобиль повернёт налево»,
«автомобиль поедет прямо»,
«автомобиль развернётся и поедет обратно».
Можно ли считать эти элементарные события равновозможными? Объясните свой ответ.
Задача 2. При подбрасывании монеты будем обозначать буквой О выпадение орла и буквой Р выпадение решки. Подбросим симметричную монету два раза. Равновозможны ли элементарные события ОО, РО, ОР и РР? Найдите их вероятности.
Вероятности случайных событий
Вероятности событий в случайном опыте
Определение. Вероятность события A равна сумме вероятностей всех элементарных событий, из которых состоит A. Элементарные события, при которых наступает событие A, называют благоприятствующими событию A.
Вероятность события A обозначается через P(A) (от английского слова probability).
Совокупность всех элементарных событий обозначают через Ω. Поскольку сумма вероятностей всех элементарных событий равна 1, то P(Ω)=1. Также несложно видеть, что P( ∅ )=0.
Пример. Эксперимент: Андрей, Борис и Владимир (А, Б и В) встают в очередь. Все возможные события в этом опыте складываются из элементарных событий, которых в данном случае всего шесть:
АБВ, АВБ, БВА, БАВ, ВАБ, ВБА.
Событию C= <Андрей стоит первым>благоприятствуют два элементарных события: АБВ и АВБ. Если предположить, что все элементарные события равновероятны, то P(C)=1/3.
Событию D= <Борис стоит прежде Владимира>благоприятствуют три элементарных события: АБВ, БАВ и БВА. Если предположить, что все элементарные события равновероятны, то P(D)=1/2.
Различные способы записи событий
События можно задавать разными способами. В примере из предыдущей лекции событие
можно задать перечислением элементарных событий:
можно иначе задать следующим образом:
словесно можно задать следующим образом
Событие A= <в сумме выпало 6 очков>можно описать перечислением элементарных событий: