Человек который занимается статистикой. Как считается статистика КХЛ? Кто должен отчитываться в Росстат

Сегодня я хочу разобрать подробнее то, о чём уже однажды рассказывал, а точнее про и почему нужно вести статистику того, в чём вы хотите добиться высокого результата, очень важно. Без этого, я думаю, не обходится ни один успешный человек. Поэтому заслуженно отправляю эту статью в раздел привычек и навыков, которые необходимо в себе сформировать.

Вести статистику я начал почти год назад, после того, как прошёл обучение в и уволился со своей оффлайн работы, где 2 года проработал инженером-электриком. Изучая новые направления в интернете и создавая свои проекты, полностью сменив сферу деятельности, ведение статистики помогло увидеть, куда я двигаюсь. Самое главное открытие оказалось для меня в том, что когда подводишь еженедельные или ежемесячные итоги о проделанной работе и видишь наглядный результат роста в цифрах — это мотивирует, как ничто другое и заставляет действовать ещё эффективней, убирая то, что не приносит результат.

Отслеживать статистику — это базовый принцип, которым пользуются абсолютно все. Но вот в обычной жизни люди этого не делают. Ещё год назад у меня в окружении не было ни одного человека, кто бы вёл статистику и мог объяснить, зачем это надо. При этом, я думаю, каждый, кого я знаю, хоть раз на работе или учёбе составлял отчёты и подводил итоги. Как думаете, зачем начальство с вас спрашивает различные отчёты?

Чтобы видеть динамику вашей работы и всей организации в общем. Поэтому я рекомендую каждому, кто желает улучшать своё качество жизни, расти в финансовой, физической и других сферах, вести статистику и подводить итоги. Все они взаимосвязаны между собой и улучшение одного показателя может повлиять на всё сразу.

Для того, чтобы сформировать у себя такую привычку, достаточно сейчас создать документ в Excel, подумать и выписать то, что можно отследить в вашей деятельности. Начать можно с главного - вести статистику своих расходов и доходов. Все мы хотим увеличить свой заработок, но вот как вы хотите это сделать, если даже не знаете сколько точно вы зарабатываете, какие источники дохода у вас есть и куда, самое главное, утекают ваши деньги.

Когда мы стали анализировать свои расходы, то удивились, что большая часть денег уходит на совершенно ненужные вещи и стали учиться использовать деньги правильно. Наверное, я никого не удивлю, но есть законы денег, о которых чуть позже я тоже буду рассказывать, из-за которых бедные становятся беднее, а богатые — ещё богаче.

Следующее, что нужно анализировать — это ваша деятельность. Приведу пример. Я , и моя деятельность ничем не отличается от обычной работы, я также получаю задания и выполняю их. Параллельно я развиваю свои проекты, такие как: блог, социальные сети и т.д. Начну с основной работы, удалённо я занимаюсь созданием, настройкой и продвижением сайтов на WordPress. Что здесь можно анализировать:

  • заказы, выполненные за месяц;
  • количество заказчиков;
  • сколько заказчиков остались довольны работой;
  • проекты, взятые на постоянное обслуживание;
  • трудозатраты на ту или иную работу и цена за эту работу;
  • с обслуживанием и продвижением отслеживается также для отдельно взятого проекта вся статистика выполненных работ;
  • и множество других показателей, которые можно отслеживать.

Теперь возьмём один из моих проектов, например, этот блог, что здесь можно и нужно отслеживать, если вы хотите сделать блог популярным и качественным:

Для чего, например, отслеживать сколько статей написано в месяц и сколько времени на это потрачено? Это позволяет мне видеть на сколько увеличивается скорость написания одной статьи и улучшать этот показатель с каждой новой статьёй. А количество написанных статей за месяц позволяет увеличивать это кол-во в следующем месяце и т.д. Также, когда точно известен доход за месяц и из каких источников, — это позволяет увеличить его в следующем месяце на несколько процентов, а отслеживание профессиональных навыков — увеличивать цены за свои услуги.

В остальных сферах жизни также всё можно отслеживать и улучшать в нужную сторону. Например, вы хотите похудеть или наоборот, как я, — потолстеть. То купите весы и ежедневно наблюдайте и выписывайте показания весов, работая на результат, пока цифры не станут такими, какими хотите их видеть вы. Опять же, мотивации будет больше, если будете видеть результат проделанной работы, не задумываясь, что время потрачено зря.

Пишите свои мысли по этому поводу в комментариях, задавайте вопросы, будет приятно получить от вас обратную связь. Также делитесь статьёй с друзьями, если она оказалась для вас полезной, и начинайте действовать. Всем удачи!

С уважением, Василий Блинов

"Все игроки следят за статистикой"

Как считается статистика и куда обращаться игрокам, если они не согласны, – в интервью с главным статистиком КХЛ Владимиром Жидковым.

Встречаются очень интересные факты, которые можно использовать. Например, когда у Трощинского был юбилейный матч, то ему специально сделали майку с цифрой «1000» и вручили, - Владимир Жидков начал с важности статистики.

- Часто клубы у вас узнают информацию?
- Только когда им надо что-то уточнить. У нас нет какой-то трибуны, где можно было бы все выкладывать. При этом практически каждый день случается какое-то знаковое событие. Например, в декабре было 400-е очко Радулова в КХЛ, больше него набрал лишь Мозякин. Такие события интересны комментаторам и журналистам. Есть ещё занимательная статистика, например, в этом году впервые за последние шесть лет игроки под десятыми номерами уступили пальму первенства другим по количеству заброшенных шайб. Обычно «десятые» забивали больше всех: Мозякин, Бут, Дарзиньш в Риге, Тихонов.

- В НХЛ статистика ведётся очень тщательно, когда КХЛ достигнет этот уровень?
- Мы в области статистики попытались перепрыгнуть, как когда-то Монголия из феодализма в социализм. В НХЛ развитие шло постепенно. В принципе, мы можем приблизиться к их уровню, да и статистику можно выложить в общий доступ. Когда наша компания только начинала заниматься статистикой, на нас работал Константин Гасилин. Когда о нём узнали в ИИХФ, то позвали в Швейцарию. Он мог быстро сделать программу и посчитать необходимую информацию. В КХЛ, к сожалению, отклик очень долгий. В этом году КХЛ сделала большое дело – начали считать силовые приёмы, блокированные броски, заработанные фолы. Для меня стало откровением, что в Ярославле больше всех фолов заработал на себе Мусатов.

Во времена Суперлиги к статистике относились как к чему-то не очень нужному. С появление КХЛ эти данные стали доступны и систематизированы. Но где данные по игре в Суперлиге? Что, Морозов или Зарипов не играли до появления КХЛ? Один из шагов, которым бы хотелось сделать, – дать более широкое представление. Ещё меня угнетает ситуация с сайтом ФХР. Почему там нет истории сборной? Это не так трудно сделать. Есть люди, которые этим занимаются. Вот ты приезжаешь на чемпионат мира, берёшь шведский справочник, так там указаны все игры сборной Швеции. Причём не только первой, но и второй, молодёжной, юношеской. А у нас? Ничего нет. Просто надо, чтобы кто-то этим занимался. Но в целом обстановка меняется в лучшую сторону…

- А по всей КХЛ?
- Мозякин. Кстати, хочу рассказать интересную деталь про Мозякина. Все любят вспоминать, что на чемпионате мира в Квебеке два гола в финале забил Ковальчук, а про Мозякина говорят, что он ничего не показал. Но он играл в третьем звене с Сушинским и Горовиковым. Их задачей было не пропустить, они заработали 12 удалений, на реализацию которых выходили другие звенья. Во времена Суперлиги к статистике относились как к чему-то не очень нужному. С появлением КХЛ эти данные стали доступны и систематизированы. Но где данные по игре в Суперлиге? Что, Морозов или Зарипов не играли до появления КХЛ? Один из шагов, которым бы хотелось сделать, – дать более широкое представление. Ещё меня угнетает ситуация с сайтом ФХР. Почему там нет истории сборной? Это не так трудно сделать. Есть люди, которые этим занимаются. Вот ты приезжаешь на чемпионат мира, берёшь шведский справочник, так там указаны все игры сборной Швеции. Причём не только первой, но и второй, молодёжной, юношеской. А у нас? Ничего нет. Просто надо, чтобы кто-то этим занимался. Но в целом обстановка меняется в лучшую сторону.

- Какие главные отличия при работе со статистикой у нас и за океаном?
- В НХЛ не считают сочетания троек нападающих, какая из них самая результативная. Потому что там игроки постоянно меняются. Как не ведётся подсчёт самым результативным связкам нападающих или не состоявшихся сухим матчам. Весь вопрос в том, есть ли потребитель. Можно написать красивую классическую музыку, а её услышат 10 человек, а попса интересна всем. Что интересует рядовых болельщиков? Шайбы, передачи, показатель полезности. У нас не придаётся большого значения тому, кто чаще сравнивал счёт, какая пара защитников самая результативная и т.д. Вот пример: в НХЛ широко анонсировалось, когда Овечкин забросил 400 шайб. А чем 300 шайб Зарипова хуже? У нас же меньше игр в чемпионате. Или в НХЛ все восхищались рекордом Ягра. Так у Мозякина в КХЛ 38 победных голов, а если добавить к этому эпоху Суперлиги, то их будет 70. Да и у нас нет трибуны, где эти вещи можно анонсировать.

- Как считаются силовые приёмы?
- Требуется понимание того, что такое силовой приём. Или игрок просто в человека врезался? Или отобрал шайбу? Сейчас даже комментаторы говорят: «Непонятно, пойдёт этот приём в статистику или нет». Действительно, в одной игре могут насчитать 60 силовых приёмов. А в другой – 10. Тут ещё играет роль, какая команда играет – если это «Торпедо», то на площадке сплошное движение, а «Слован» - в откат сыграли и всё. Надо, чтобы в разных городах люди одиноково трактовали силовые приёмы. К тому же статистические бригады у нас располагаются в разных местах, и из-за этого следует неодинаковое видение площадки. К тому же у нас часто записывают ситуации, когда человек уже отдал шайбу, а в него потом врезались, в силовой приём. Существует комиссия по статистике, которую я имею честь возглавлять и куда игроки могут обратиться. Это нормально, когда они обращаются по вопросам своего присутствия на площадке, очков, голов, передач. Это их бонусы и деньги. И мы вышли на высокий уровень доверия. Если эпизод спорный, то его просматривает комиссия из пяти-шести человек под руководством Полякова. Пока это лишь черновой вариант, пусть игроки не переживают! Может, не всё гладко, но мы работаем над улучшением. Кстати, в одно время в НХЛ отказались от подсчёта «хитов». Из-за их разного трактования. А у кого-то были бонусы за

Что интересует рядовых болельщиков? Шайбы, передачи, показатель полезности. У нас не придаётся большого значения, кто чаще сравнивал счёт, какая пара защитников самая результативная и т.д. Вот пример: в НХЛ широко анонсировалось, когда Овечкин забросил 400 шайб. А чем 300 шайб Зарипова хуже? У нас же меньше игр в чемпионате. Или в НХЛ все восхищались рекордом Ягра. Так у Мозякина в КХЛ 38 победных голов, а если добавить к этому эпоху Суперлиги, то их будет 70…

силовые приёмы. Наверное, бонусы надо давать за шайбы, очки, время на площадке. Пусть игроки, которым не засчитали силовые приёмы, не переживают.

- У кого больше всего силовых приёмов?
- У Евгения Катичева. Среди других лидеров – Рябин и Комаров. Понятно, что там нет Морозова, Зарипова. У них другая задача.

- Как игрокам высказать жалобу на ошибки в статистике?
- Письменно. Это делают агенты или представители клуба. Во времена Суперлиги я как-то обнаружил у некоторых игроков по 18 «левых» передач. Благодаря новому оборудованию у нас появилась возможность получать записи всех матчей. И мы решили, что надо корректировать ситуацию со статистикой. Сначала ребята воспринимали это в штыки: «Как, у меня отнимают очки!». Но ситуация какая была: судьи не видели игрока, который отдал передачу, подъезжают и спрашивают у хоккеистов. А игроки как решают: у кого есть бонусы, пусть тому и запишут. Так не должно быть.
И ещё, если наши технические записи не могу однозначно трактовать материал, а представители игрока предоставляют видео, то мы будем рассматривать эпизод по их записи. И такое бывает, был случай с Николаем Прониным. На нашей записи не было понятно, попала шайба ему в конёк или нет. Его представители прислали нам другое видео, где это очевидно.

- Игроки будут тратить столько времени ради одной передачи?
- Есть один мальчик во Владивостоке. Его агент недавно звонил, говорил, что у парня заканчивается контракт. Очков у него мало, и каждый на вес золото. Для них это важно.

- Статистику на матчах кто ведёт?
- В каждом клубе есть внештатные сотрудники, которые получают вознаграждение за разовую работу.

- Вы как увлеклись статистикой?
- В детстве я собирал газеты со спортивными новостями и делал выписки. Помню, как я ждал каждую газету. Я вёл это для себя, всё записывал в тетрадки. Самой страшной угрозой со стороны мамы было: «Я все твои тетради выброшу». Потом я поступил в университет, учился на географическом. Зимой в Антарктиде было не до статистики.

- Когда к ней вернулись?
- Мой второй сын решил заниматься хоккеем. Почему я по-особенному отношусь у игрокам 81-го года? Они все росли у меня на глазах. На тренировках я тогда столкнулся с ненормальными родителями, которые видят в своём сыне, едва умеющем стоять на коньках, звезду НХЛ. Мой сын начинал в ЦСКА, перешёл в «Крылья», но потом понял, что хоккей не его призвание. А мне было интересно, как из «ничего» получаются игроки. Я стал следить за 81-м годом. Сначала по Москве, потом собралась первая сборная их возраста. У меня были хорошие отношения с Александром Голиковым. И он попросил меня помочь. Я придумал программу, как фиксировать различные параметры во время игры, в итоге мне сказали: «У вас есть хобби! Может, хотите за него получать ещё и деньги?». Это были сложные 90-е, деньги были нужны, и я начал этим заниматься. Удалось найти единомышленников. У нас более академический подход, а большинство статистиков стараются просто свести голы и очки в общую таблицу и посмотреть. Сейчас мы хотим поднять информацию по статистики прошлого.

Сейчас мы хотим поднять информацию по статистики прошлого. Ищем в старых программка, газетах. Если не сделать это сейчас, то вся информация будет утеряна. К сожалению, ФХР не хочет этим заниматься. Хотя отмечали же 65 лет хоккея, скоро будет 70. Почему бы не издать справочник? Сейчас я чувствую полную поддержку со стороны Шалаева, мы пересчитали все игры тренеров, например. А это должна была делать федерация…

Ищем в старых программка, газетах. Если не сделать это сейчас, то вся информация будет утеряна. К сожалению, ФХР не хочет этим заниматься. Хотя отмечали же 65 лет хоккея, скоро будет 70. Почему бы не издать справочник? Сейчас я чувствую полную поддержку со стороны Шалаева, мы пересчитали все игры тренеров, например. А это должна была делать федерация.

- У кого ближайшие 1000-е матчи?
- Из игроков Антипов и Горовиков, если продолжат выступать в следующем сезоне. Сушинский, кстати, у которого было 990 игр, не стал доигрывать. Из тренеров – никто. Билялетдинов в сборной, а 300 матчей ему надо где-то находить. Ещё интересна статистика по снайперам. Морозов может покорить рекорды Мальцева и Балдериса. Вообще, здорово, когда хобби совпадает с работой. Например, можно посмотреть, кто в 20 лет играл лучше: Малкин или Черепанов. Выясняется, что Черепанов. Вообще, Лисутин недавно сказал: «Обманывают те, кто говорит, что не следят за статистикой. Все следят».

- С игроками часто приходится общаться?
- Время от времени. Помните знаменитый покер Петрова в плей-офф, когда изначально записали шайбу Непряеву? Нам пришлось переговорить лично с каждым из них, чтобы выяснить, кто забил. Игроки отнеслись с пониманием. Непряев сказал, что не помнит, как коснулся шайбы. На видео тоже не видно. Это тоже часть нашей работы. Как-то ко мне подошёл игрок «Спартака»: «Мне не записали передачу». Я ответил: «Посмотрим, выясним». В общем, какие наши достижения? Мы вторая лига по статистике, у нас есть куда развиваться, есть люди, которые этим занимаются. А ещё у нас в лиге собраны прекрасные игроки.

Статистика- наука, изучающая количественную сторону массовых социально- экономических явлений и процессов, в неразрывном единстве с их качественной стороной в конкретных условиях места и времени.

В естественных науках понятие «статистика» означает анализ массовых явлений, основанных на применении методов теории вероятности.

Статистика разрабатывает специальную методологию исследования и обработки материалов: массовые статистические наблюдения, метод группировок, средних величин, индексов, балансовый метод, метод графических изображений.

Методологическими особенностями является изучение: массовости явлений, качественно однородных признаков того или иного явления в динамике.

Статистика включает ряд разделов, среди которых: общая теория статистики, экономическая статистика, отраслевые статистики- промышленная, сельского хозяйства, транспорта, медицинская.

11. Группы показателей для оценки состояния здоровья населения.

Здоровье населения характеризуется тремя группами основных показателей:

А) медико-демографические –отражают состояние и динамику демографических процессов:

    Статистика населения (плотность, размещение, социальный состав, состав по полу и возрасту, грамотность, образование, национальность, язык, культура.)

    Динамика населения (механическая эмиграция и иммиграция, естественная рождаемость, смертность, естественный прирост.)

    Семейное состояние (коэффициент брачности, разводов, средняя продолжительность брака.)

    Процессы воспроизводства (суммарная плодовитость, брутто-коэффициент и нетто-коэффициент.)

    Средняя ожидаемая продолжительность жизни

    Смертность (структура смертности, показатели смертности в зависимости от причины, характера заболеваемости и возраста.)

Б) показатели заболеваемости и травматизма (первичная заболеваемость, распространенность, накопленная заболеваемость, патологическая пораженность, индекс здоровья, летальность, травматизм, инвалидность.)

В) показатели физического развития:

    Антропометрические (рост, масса тела, окружность грудной клетки, головы, плеча, предплечья, голени, бедра)

    Физиометрические (жизненная ёмкость легких, мышечная сила кистей рук, становая сила)

    Соматоскопические (телосложение, развитие мускулатуры, степень упитанности, форма грудной клетки, форма голеней, стоп, выраженность вторичных половых признаков.)

    Медицинская статистика, ее разделы, задачи. Роль статистического метода в изучении здоровья населения и деятельности системы здравоохранения.

Медицинская (санитарная) статистика - изу­чает количественную сторону явлений и процессов, связанных с ме­дициной, гигиеной и здравоохранением.

Выделяют 3 раздела медицинской статистики:

1. Статистика здоровья населения - изучает состояние здоровья населения в целом или его отдельных групп (путем сбора и статис­тического анализа данных о численности и составе населения, его воспроизводстве, о естественном движении, физическом развитии, распространенности различных заболеваний, продолжительности жиз­ни и т.д.). Оценка показателей здоровья проводится в сопоставлении с общепринятыми оценочными уровнями и уровнями, полученными по различным регионам и в динамике.

2. Статистика здравоохранения - решает вопросы сбора, обработ­ки и анализа информации о сети учреждений здравоохранения (их размещении, оснащении, деятельности) и кадрах (о численности врачей, среднего и младшего медицинского персонала, о распределе­нии их по специальностям, стажу работы, о их переподготовке и т.д.). При анализе деятельности лечебно-профилактических учрежде­ний осуществляется сопоставление полученных данных с нормативны­ми уровнями, а также уровнями, полученными по другим регионам и в динамике.

3. Клиническая статистика - это использование статистических методов при обработке результатов клинических, экспериментальных и лабораторных исследований; она позволяет с количественной точ­ки зрения оценить достоверность результатов исследования и ре­шить ряд других задач (определение объема необходимого числа наблюдений при выборочном исследовании, сформировать эксперимен­тальную и контрольную группы, изучить наличие корреляционных и регрессионных связей, устранить качественную неоднородность групп и т. д.).

Задачами медицинской статистики являются:

1) изучение состояния здоровья населения, анализ количественных характеристик общественного здоровья.

2) выявление связей между показателями здоровья и различными фак­торами природной и социальной среды, оценка влияния этих фак­торов на уровни здоровья населения.

3) изучение материально- технической базы здравоохранения.

4) анализ деятельности лечебно-профилактических учреждений.

5) оценка эффективности (медицинской, социальной, экономической) проводимых лечебных, профилактических, противоэпидемических мероприятий и здравоохранения в целом.

6) использование статистических методов при проведении клинических и экспериментальных медико-биологических исследований.

Медицинская статистика является методом социальной диагности­ки, поскольку она позволяет дать оценку состояния здоровья насе­ления страны, региона и на этой основе разработать меры, направ­ленные на улучшение общественного здоровья. Важнейшим принципом статистики является применение ее для изу­чения не отдельных, единичных, а массовых явлений , с целью выявления их общих закономерностей. Эти закономерности проявляются, как правило, в массе наблюдений, то есть при изучении статистической совокупности.

В медицине статистика - ведущий метод, т.к.:

1) позволяет количественно измерить показатели здоровья населения и показатели деятельности медицинских учреждений

2) определяет силу влияния различных факторов на здоровье населения

3) определяет эффективность лечения и оздоровительных мероприятий

4) позволяет оценить динамику показателей здоровья и позволяет прогнозировать их

5) позволяет получить необходимые данные для разработки норм и нормативов здравоохранения.

    Статистическая совокупность. Определение, виды, свойства. Особенности исследования статистической совокупности.

Объектом любого статистического исследования является статис­тическая совокупность.

Статистическая совокупность - группа, состоящая из множества относительно однородных элементов, взятых вместе в известных гра­ницах пространства и времени и обладающих признаками сходства и различия.

Свойства статистической совокупности : 1) однородность единиц наблюдения 2) определенные границы пространства и времени изучаемого явления

Объектом статистического исследования в медицине и здравоохранении могут быть различные контингенты населения (население в целой или его отдельные группы, больные, умершие, родившиеся), лечебно-профилактические учреждения и др.

Различают два вида статистической совокупности :

а) генеральная совокупность

б) выборочная совокупность

1. выборочная совокупность формируется таким образом, чтобы обес­печить равную возможность для всех элементов исходной совокупнос­ти быть охваченными наблюдением.

2. выборочная совокупность должна быть репрезентативной (представительной), точно и полно отра­жать явление, т.е. давать такое же представление о явлении, как если бы изучалась вся генеральная совокупность.

Выборочная совокупность

1) должна быть репрезентативной, точно и полно отражать явление, т.е. давать такое же представление о явлении как если бы изучалась вся генеральная совокупность, для этого она должна:

а. быть достаточной по численности

б. обладать основными чертами генеральной совокупности (в отобранной части должны быть представлены все элементы в таком же соотношении, как и в генеральной)

2) при ее формировании должен соблюдаться

1) случайный отбор - отбор единиц наблюдения путем жеребьевки с помощью таблицы случайных чисел и т.д. При этом для каждой единицы обеспечивается равная возможность попасть в выборку.

2) механический отбор - единицы генеральной совокупности, последовательно расположенные по какому-либо признаку (по алфавиту, по датам обращения к врачу и т.д.), разбиваются на равные части; из каждой части в заранее обусловленном порядке отбирают каждую 5, 10 или n-ую единицу наблюдения таким образом, чтобы обеспечить необходимый объем выборки.

3) типический (типологический) отбор - предполагает обязательное предварительное расчленение генеральной совокупности на отдельные качественно однородные группы (типы) с последующей выборкой единиц наблюдения из каждой группы по принипам случайного или механического отбора.

4) серийный (гнездный, гнездовой) отбор - предполагает выборку из генеральной совокупности не отдельных единиц, а целых серий (организованной совокупности единиц наблюдений, например, организаций, районов и т.д.)

5) комбинированные способы - сочетание различных способов формирования выборочной.

    Выборочная совокупность, требования, предъявляемые к ней. Принципы и способы формирования выборочной совокупности.

Различают два вида статистической совокупности :

а) генеральная совокупность - совокупность, состоящая из всех единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования. При изучении общественного здоровья генеральная совокупность часто рассматривается в пределах конкретных территориальных гра­ниц или может ограничиваться другими признаками (полом, возрас­том и др.) в зависимости от цели исследования.

б) выборочная совокупность - часть генеральной, отобранная спе­циальным (выборочным) методом и предназначенная для характерис­тики генеральной совокупности.

Особенности проведения статистического исследования на выборочной совокупности:

1. выборочная совокупность формируется таким образом, чтобы обес­печить равную возможность для всех элементов исходной совокупнос­ти быть охваченными наблюдением.

2. выборочная совокупность должна быть репрезентативной (представительной), точно и полно отра­жать явление, т.е. давать такое же представление о явлении, как если бы изучалась вся генеральная совокупность.

Выборочная совокупность - часть генеральной совокупности, отобранная спе­циальным (выборочным) методом и предназначенная для характерис­тики генеральной совокупности.

Требования, предъявляемые к выборочной совокупности:

1) должна быть репрезентативной, точно и полно отражать явление, т.е. давать такое же представление о явлении как если бы изучалась вся генеральная совокупность, для этого она должна:

а. быть достаточной по численности

б. обладать основными чертами генеральной совокупности (в отобранной части должны быть представлены все элементы в таком же соотношении, как и в генеральной)

2) при ее формировании должен соблюдаться основной принцип формирования выборочной совокупности : равная возможность для каждой единицы наблюдения попасть в исследование.

Способы формирования статистической совокупности:

1) случайный отбор - отбор единиц наблюдения путем жеребьевки с помощью таблицы случайных чисел и т.д. При этом для каждой единицы обеспечивается равная возможность попасть в выборку.

2) механический отбор - единицы генеральной совокупности, последовательно расположенные по какому-либо признаку (по алфавиту, по датам обращения к врачу и т.д.), разбиваются на равные части; из каждой части в заранее обусловленном порядке отбирают каждую 5, 10 или n-ую единицу наблюдения таким образом, чтобы обеспечить необходимый объем выборки.

3) типический (типологический) отбор - предполагает обязательное предварительное расчленение генеральной совокупности на отдельные качественно однородные группы (типы) с последующей выборкой единиц наблюдения из каждой группы по принипам случайного или механического отбора.

4) серийный (гнездный, гнездовой) отбор - предполагает выборку из генеральной совокупности не отдельных единиц, а целых серий (организованной совокупности единиц наблюдений, например, организаций, районов и т.д.)

5) комбинированные способы - сочетание различных способов формирования выборочной.

Владимир Мхитарян, заведующий отделением статистики, анализа данных и демографии НИУ ВШЭ

Объективные оценки устраивают далеко не всех. Отсюда и случаи, когда статистическими данными пытаются манипулировать - замалчивают и откровенно их передергивают. Бывает, что статистические данные искажаются под политическим давлением.

— Владимир Сергеевич, статистик - не из числа тех профессий, которые постоянно на слуху, как, например, айтишник или менеджер. Она востребована?

— Любая современная управленческая работа связана с обработкой информации. Сегодня недостаточно сказать, к примеру, что в экономике имеют место циклические кризисы - важны количественные оценки ситуации, которые обеспечивает именно статистика. Статистик занимается не только непосредственными измерениями - сбором и обработкой статистических данных, но и статистическим анализом и моделированием экономических процессов. Поэтому статистика - одна из самых востребованных профессий в мире: в рейтингах профессий в США она неоднократно занимала первые места.

— То есть представление, что статистиков готовят для работы в статистических ведомствах, неверное?

— Нет. Известно, что во Франции, например, на одного специалиста, который работает в статистическом ведомстве, приходится десять человек в бизнесе. И у нас подавляющее большинство специалистов, экономистов - статистиков (более 80 %) - уходят в бизнес. Однако в развитых странах мира работа в статистическом ведомстве очень престижна.

Возможности для трудоустройства обширные. Статистка - это инструмент, овладев которым можно работать в самых разных сферах - в банках, страховых и инвестиционных компаниях, в органах государственного управления, розничной торговле и т.д. Сейчас во многих компаниях от среднего до крупного бизнеса - создаются аналитические подразделения: отделы развития, маркетинга, продвижения товаров и услуг. Они могут называться по-разному, но задачи у них похожие - поддержка принятия управленческих решений. Даже в небольшом магазине - сотни товаров, и кто-то должен контролировать их продвижение к покупателю (поставка, реализация и даже своевременное изъятие товара из продажи с учетом срока его годности). А уж в крупных торговых сетях объемы обрабатываемых статистических данных огромны. Аналитическая работа проводится для того, чтобы все работало слаженно. В современном мире для успешного развития бизнеса надо знать не только показатели развития собственной компании, но и состояние рынка, учитывать внешние факторы - региональные, национальные и мировые.

В условиях рыночной экономики интерес к статистике как никогда велик: не случайно такие макроэкономические показатели, как курс доллара и евро или стоимость барреля нефти, на слуху у всех.

— Как собираются статистические данные? Откуда мы, допустим, знаем, какова в Москве средняя зарплата? А есть еще более сложные показатели - и их собирают по всей стране...

— Сбор информации - дорогостоящее мероприятие. В системе, обеспечивающей официальную статистику, работает порядка 200 - 300 тысяч человек, из которых в Росстате и ее территориальных органах - около 30 тысяч. Это целая многоуровневая система. На предприятиях происходит сбор бухгалтерской отчетности, информации о производственной деятельности - объемах производства, доходах и проч. Эта информация поступает в управление муниципальной статистики, затем - региональной и т.д. Кроме того ведется сбор информации по домашним хозяйствам. Есть и неофициальные источники статистических данных. У нас это только развивается, а на Западе сбором и обработкой статистической информации занимаются многие частные компании.

Сегодня в открытом доступе на сайте Росстата находятся огромные массивы статистических данных по регионам России и стране в целом.

— Как происходит анализ данных?

— Основных методов, которыми пользуется статистик, не так много. Как в музыке - семь нот и бесчисленное количество мелодий, так и в статистике - десятки инструментов, методов, но использование их в разных сочетаниях многократно расширяет круг решаемых задач.

Учитывая большую потребность в статистической данных, разработано множество аналитических пакетов прикладных программ, таких, как SPSS, Statistica, SAS, STATA и другие. Как раньше - на счетах, логарифмической линейке или калькуляторах сейчас уже никто не считает. Зато гораздо больше внимания уделяется постановке задач, сбору и оценке качества информации, построению моделей и интерпретации результатов статистических расчетов.

— Чем привлекательна эта профессия - вы многие годы ею занимаетесь. На первый взгляд, это аккуратная, дотошная - и может создаться впечатление, что скучная, - работа с цифрами…

— Сбор, анализ данных, расчёты, прогнозирование - это всегда упорядочивание картины мира. Вот у вас был очень большой массив данных, а в результате расчетов вы получили изящную модель, числа, которые говорят сами за себя. Это и нашим студентам очень нравится. Для неспециалиста числа существуют сами по себе, а профессионал их легко интерпретирует и видит за ними состояние экономики, финансовое состояние предприятия или качество жизни населения.

Вот, к примеру, как на Западе узнали о создании в СССР системы ГУЛАГ? Ведь эта информация была очень закрытой. Дело в том, что Советский Союз стал выпускать на мировой рынок уголь и лес по демпинговым ценам. Проходит полгода, год, а цены остаются такими же низкими и никто не разоряется. На Западе подсчитали и поняли, что это возможно, если исключить оплату труда. Отсюда вывод, что людей заставляют работать за еду, что возможно только в условиях существования лагерей.

Или еще пример. Дмитрию Ивановичу Менделееву поручили открыть для России тайну бездымного пороха, состав которого Германия скрывала особенно тщательно. Менделеев запросил открытые данные о перевозке грузов по железной дороге в направлении порохового завода. Проанализировав, какие материалы и в каком количестве поступают на завод, он определил состав пороха. Это примеры того, как может работать с данными профессионал, учитывая, что в экономике многие явления взаимосвязаны.

— У профессии статистика не самая лучшая репутация. Не случайно же появилось высказывание: «есть ложь, наглая ложь, а есть статистика».

— Помните мультфильм «Козленок, который умел считать до десяти»? В нем козленок пытается посчитать животных, которые входили на корабль. Это им не понравилось, и они даже преследовали козленка.

Так и в жизни: объективные оценки устраивают далеко не всех. Отсюда и случаи, когда статистическими данными пытаются манипулировать - замалчивают и откровенно их передергивают. Бывает, что статистические данные искажаются под политическим давлением. Самый известный пример, когда после окончания Великой Отечественной войны долго время считалось, что потери СССР в войне всего 7 миллионов человек. Это было сказано Сталиным, и миф продержался более десяти лет, пока не были обнародованы реальные данные о 27 миллионах погибших.

Помимо этого, нужно иметь в виду, что измерения в экономике и социальной сфере очень сложные - в них обобщается деятельность тысяч, миллионов людей. Например, как можно измерить уровень коррупционности в стране? Ведь никто никогда никому не говорит, кто кому и сколько платит. Или как можно оценить инвестиционную привлекательность страны, региона? Во всех этих случаях для получения оценок используют достаточно сложные и тонкие алгоритмы, в которых стараются минимизировать возможные ошибки. Эти задачи сегодня решаются, и каждый год публикуются международные рейтинги стран по уровню коррумпированности, инвестиционной привлекательности и т.д., с которыми в мире очень считаются.

— Почему статистические данные порой расходятся? В разных источниках можно найти, предположим, разные показатели относительно безработицы или прогнозы относительно инфляции.

— Данные могут расходиться вследствие использования разных методик расчета статистических показателей, каждая из которых имеет свои плюсы и минусы. Национальные стандарты статистики лучше учитывают специфику страны, но, чтобы можно было проводить межстрановые сопоставления, по требованию ООН расчеты основных макроэкономических показателей страны должны проводиться и по международным стандартам. Используются и другие методики, которые, по мнению авторов, дают более точные результаты.

— Что отличает опытного статистика от недавно окончившего вуз? В чем проявляется профессионализм?

— В такой сложной системе, как экономика, нет таких точных измерителей, как в технике, например, спидометр в автомобиле, термометр, часы и т.д. Многие экономические данные носят субъективный характер, поэтому выводы в статистике часто носят вероятностный характер. С опытом появляется чутье, интуиция. Опытный аналитик какие-то выводы ставит под сомнение, больше сопоставляет данные перед тем, как сделать окончательные выводы. Студенты же любят, чтобы все было четко, однозначно и ясно, поэтому к работе с данными часто подходят формально: рассчитал характеристику, построил модель - и не задумывается о том, насколько они адекватны исследуемому явлению. К сожалению, в экономике и социальной сфере мы не можем сказать, где находится абсолютная истина, поэтому так важен опыт для принятия оптимального решения. Компьютерная программа может провести многовариантные расчеты, а специалист должен из них выбрать оптимальный вариант. Для этого он, конечно, должен разбираться в предметной области, хорошо владеть статистической методологией, математико-статистическим инструментарием и компьютерными технологиями. В конце концов, нужен здравый смысл - не случайно в статистике широко используется метод максимального правдоподобия, когда выбирается наиболее вероятное из решений. Современные выпускники достаточно быстро набираются опыта и занимают хорошие позиции в экономике.

— Что является вершиной карьеры статистика?

— Нет одного на всех сценария. Люди пробуют работать в разных сферах деятельности. А уж до каких позиций человек сможет дорасти, зависит только от него самого. Среди выпускников, экономистов-статистиков, есть руководители Росстата, министры, губернаторы - я имею в виду бывшего губернатора Красноярского края, депутата Госдумы Валерия Зубова. И за рубежом есть подобные примеры. Среди выпускников по специальности статистика - премьер-министры и министры стран, мэры городов, президент Академии наук Монголии (АНМ) - Батболдын Энхтувшин.

— Кстати, за рубежом наш специалист с дипломом статистика может устроиться на работу?

— Вполне. Сотрудница нашего отделения Мария Плотникова в 2007 году закончила МЭСИ по специальности статистка, поступила в аспирантуру и защитила в 2010 году кандидатскую диссертацию, связанную со статистическим анализом наркотической ситуации в России. После защиты в 2011 году переехала в Австралию и сейчас там работает по специальности. Это далеко не единичный пример. Под моим руководством 18 иностранных аспирантов защитили кандидатские диссертации по статистике, им присвоена ученая степень PhD, и они успешно работают в разных странах. Профессия востребована во всем мире. И человек, который хорошо владеет языком международного общения - английским, может работать в любой стране. Однако я думаю, что наши выпускники имеют хорошие шансы на трудоустройство и в России.

Беседовала Елена Кузнецова

Статистика - отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных.
Слово «статистика» происходит от латинского status - состояние дел. В науку термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году, предложив заменить название курса «Государствоведение», преподававшегося в университетах Германии, на «Статистику», положив тем самым начало развитию статистики как науки и учебной дисциплины. Несмотря на это, статистический учет вёлся намного раньше: проводились переписи населения в Древнем Китае, осуществлялось сравнение военного потенциала государств, велся учет имущества граждан в Древнем Риме и т. п.
Статистика разрабатывает специальную методологию исследования и обработки материалов: массовые статистические наблюдения, метод группировок, средних величин, индексов, балансовый метод, метод графических изображений и другие методы анализа статистических данных.
Начало статистической практики относится примерно ко времени возникновения государства. Первой опубликованной статистической информацией можно считать глиняные таблички Шумерского царства (III - II тысячелетия до н. э.).
Вначале под статистикой понимали описание экономического и политического состояния государства или его части. Например, к 1792 г. относится определение: «статистика описывает состояние государства в настоящее время или в некоторый известный момент в прошлом». И в настоящее время деятельность государственных статистических служб вполне укладывается в это определение.
Постепенно термин «статистика» стал использоваться более широко. В XX веке статистику часто рассматривают прежде всего как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных. В 1954 г. академик АН УССР Б. В. Гнеденко дал следующее определение: «Статистика состоит из трёх разделов:
1. сбор статистических сведений, то есть сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;
2. статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;
3. разработка приёмов статистического наблюдения и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики».
Термин «статистика» употребляют ещё в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, статистикой называют функцию от результатов наблюдений, используемую для оценки характеристик и параметров распределений и проверки гипотез.
Типовые примеры раннего этапа применения статистических методов описаны в Библии, в Ветхом Завете. Там, в частности, приводится число воинов в различных племенах. С математической точки зрения дело сводилось к подсчёту числа попаданий значений наблюдаемых признаков в определённые градации.
Сразу после возникновения теории вероятностей (Паскаль, Ферма, XVII век) вероятностные модели стали использоваться при обработке статистических данных. Например, изучалась частота рождения мальчиков и девочек, было установлено отличие вероятности рождения мальчика от 0.5, анализировались причины того, что в парижских приютах эта вероятность не та, что в самом Париже, и т. д.
В 1794 г. (по другим данным - в 1795 г.) немецкий математик Карл Гаусс формализовал один из методов современной математической статистики - метод наименьших квадратов. В XIX веке заметный вклад в развитие практической статистики внёс бельгиец Кетле, на основе анализа большого числа реальных данных показавший устойчивость относительных статистических показателей, таких, как доля самоубийств среди всех смертей.
Первая треть ХХ века прошла под знаком параметрической статистики. Изучались методы, основанные на анализе данных из параметрических семейств распределений, описываемых кривыми семейства Пирсона. Наиболее популярным было нормальное распределение. Для проверки гипотез использовались критерии Пирсона, Стьюдента, Фишера. Были предложены метод максимального правдоподобия, дисперсионный анализ, сформулированы основные идеи планирования эксперимента.
Разработанную в первой трети ХХ века теорию анализа данных называют параметрической статистикой, поскольку её основной объект изучения - это выборки из распределений, описываемых одним или небольшим числом параметров. Наиболее общим является семейство кривых Пирсона, задаваемых четырьмя параметрами. Как правило, нельзя указать каких-либо веских причин, по которым распределение результатов конкретных наблюдений должно входить в то или иное параметрическое семейство. Исключения хорошо известны: если вероятностная модель предусматривает суммирование независимых случайных величин, то сумму естественно описывать нормальным распределением; если же в модели рассматривается произведение таких величин, то итог, видимо, приближается логарифмически нормальным распределением и так далее.
В настоящее время термин статистика употребляется в 4 значениях:
1. наука, изучающая количественную сторону массовых явлений и процессов в неразрывной связи с их качественным содержанием – учебный предмет в высших и средних специальных учебных заведений;
2. совокупность цифровых сведений, характеризующих состояние массовых явлений и процессов общественной жизни; статистические данные, представляемые в отчетности предприятий, организаций, отраслей экономики, а также публикуемых в сборниках, справочниках, периодической печати и в сети Интернет, которые являются результатом статистической работы;
3. отрасль практической деятельности («статистический учет») по сбору, обработке, анализу и публикации массовых цифровых данных о самых различных явлениях и процессах общественной жизни;
4. некий параметр ряда случайных величин, получаемый по определенному алгоритму из результатов наблюдений, например, статистические критерии (критические статистики), применяющиеся при проверке различных гипотез (предположительных утверждений) относительно природы или значений отдельных показателей исследуемых данных, особенностей их распределения и пр.
Как и любая другая наука, статистика имеет свой предмет и метод исследования. Статистика изучает количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной или содержанием, а также исследует количественное выражение закономерностей общественного развития в конкретных условиях места и времени. Такое изучение основывается на системе категорий (понятий), отражающих наиболее общие и существенные свойства, признаки, связи и отношения предметов и явлений объективного мира.
Основные категории, используемые в статистике:
1. Статистическая совокупность – множество социально-экономических объектов или явлений общественной жизни, объединенных качественной основой, но отличающихся друг от друга отдельными признаками, т.е. однородных в одном отношении, но разнородных в другом. Таковы, например, совокупность домохозяйств, семей, предприятий, фирм и т.п.
2. Единица совокупности – первичный элемент статистической совокупности, являющийся носителем признаков и основой ведущегося при обследовании счета.
3. Признак единицы совокупности – свойства единицы совокупности, которые различаются способами их измерения и другими особенностями
4. Статистический показатель – понятие, отображающее количественные характеристики (размеры) или соотношения признаков общественных явлений. Статистические показатели можно подразделить на первичные (объемные) – характеризуют либо общее число единиц совокупности (объем совокупности), либо сумму значений какого-либо признака (объем признака) и выражаются абсолютными величинами и вторичные (расчетные) – задаются на единицу первичного показателя и выражаются относительными и средними величинами. Статистические показатели могут быть плановыми, отчетными и прогнозными.
5. Система статистических показателей – совокупность статистических показателей, отражающая взаимосвязи, которые объективно существуют между явлениями. Она охватывает все стороны общественной жизни как на макро-, так и на микроуровне. С изменением условий жизни общества меняются и системы статистических показателей, совершенствуется методология их расчета.
Совокупность приемов, пользуясь которыми статистика исследует свой предмет, составляет метод статистики. Можно выделить 3 группы статистических методов (3 этапа статистического исследования):
1. Cтатистическое наблюдение - научно организованный сбор сведений, заключающийся в регистрации тех или иных фактов, признаков, относящихся к каждой единице изучаемой совокупности;
2. Сводка и группировка - обработка собранных первичных данных, включающая их группировку, обобщение и оформление в таблицах;
3. Статистический анализ - на основе итоговых данных сводки рассчитываются различные обобщающие показатели в виде средних и относительных величин, выявляются определенные закономерности в распределениях, динамике показателей и т.п.
Таким образом, любое законченное статистическое исследование проходит в 3 этапа, между которыми, разумеется, могут быть перерывы во времени.
Статисти?ческие ме?тоды - методы анализа статистических данных. Выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надежность и испытания, планирование экспериментов.
Классификация статистических методов. Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.
Целесообразно выделить три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):
а) разработка и исследование методов общего назначения, без учета специфики области применения;
б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;
в) применение статистических методов и моделей для статистического анализа конкретных данных.

Прикладная статистика - это наука о том, как обрабатывать данные произвольной природы. Математической основой прикладной статистики и статистических методов анализа является теория вероятностей и математическая статистика.
Описание вида данных и механизма их порождения - начало любого статистического исследования. Для описания данных применяют как детерминированные, так и вероятностные методы. С помощью детерминированных методов можно проанализировать только те данные, которые имеются в распоряжении исследователя. Например, с их помощью получены таблицы, рассчитанные органами официальной государственной статистики на основе представленных предприятиями и организациями статистических отчетов. Перенести полученные результаты на более широкую совокупность, использовать их для предсказания и управления можно лишь на основе вероятностно-статистического моделирования. Поэтому в математическую статистику часто включают лишь методы, опирающиеся на теорию вероятностей.
В простейшей ситуации статистические данные - это значения некоторого признака, свойственного изучаемым объектам. Значения могут быть количественными или представлять собой указание на категорию, к которой можно отнести объект. Во втором случае говорят о качественном признаке.
При измерении по нескольким количественным или качественным признакам в качестве статистических данных об объекте получаем вектор. Его можно рассматривать как новый вид данных. В таком случае выборка состоит из набора векторов. Есть часть координат - числа, а часть - качественные (категоризованные) данные, то говорим о векторе разнотипных данных.
Одним элементом выборки, то есть одним измерением, может быть и функция в целом. Например, описывающая динамику показателя, то есть его изменение во времени, - электрокардиограмма больного или амплитуда биений вала двигателя. Или временной ряд, описывающий динамику показателей определенной фирмы. Тогда выборка состоит из набора функций.
Элементами выборки могут быть и иные математические объекты. Например, бинарные отношения. Так, при опросах экспертов часто используют упорядочения (ранжировки) объектов экспертизы - образцов продукции, инвестиционных проектов, вариантов управленческих решений. В зависимости от регламента экспертного исследования элементами выборки могут быть различные виды бинарных отношений (упорядочения, разбиения, толерантности), множества, нечёткие множества и т. д.
Итак, математическая природа элементов выборки в различных задачах прикладной статистики может быть самой разной. Однако можно выделить два класса статистических данных - числовые и нечисловые. Соответственно прикладная статистика разбивается на две части - числовую статистику и нечисловую статистику.
Числовые статистические данные - это числа, вектора, функции. Их можно складывать, умножать на коэффициенты. Поэтому в числовой статистике большое значение имеют разнообразные суммы. Математический аппарат анализа сумм случайных элементов выборки - это (классические) законы больших чисел и центральные предельные теоремы.
Нечисловые статистические данные - это категоризованные данные, вектора разнотипных признаков, бинарные отношения, множества, нечеткие множества и др. Их нельзя складывать и умножать на коэффициенты. Поэтому не имеет смысла говорить о суммах нечисловых статистических данных. Они являются элементами нечисловых математических пространств (множеств). Математический аппарат анализа нечисловых статистических данных основан на использовании расстояний между элементами (а также мер близости, показателей различия) в таких пространствах. С помощью расстояний определяются эмпирические и теоретические средние, доказываются законы больших чисел, строятся непараметрические оценки плотности распределения вероятностей, решаются задачи диагностики и кластерного анализа, и т. д. (см. ).
В прикладных исследованиях используют статистические данные различных видов. Это связано, в частности, со способами их получения. Например, если испытания некоторых технических устройств продолжаются до определенного момента времени, то получаем т. н. цензурированные данные, состоящие из набора чисел - продолжительности работы ряда устройств до отказа, и информации о том, что остальные устройства продолжали работать в момент окончания испытания. Цензурированные данные часто используются при оценке и контроле надежности технических устройств.
Теория вероятностей - раздел математики, изучающий закономерности случайных явлений: случайные события, случайные величины, их свойства и операции над ними.
Возникновение теории вероятностей как науки относят к средним векам и первым попыткам математического анализа азартных игр (орлянка, кости, рулетка). Первоначально её основные понятия не имели строго математического вида, к ним можно было относиться как к некоторым эмпирическим фактам, как к свойствам реальных событий, и они формулировались в наглядных представлениях. Самые ранние работы учёных в области теории вероятностей относятся к XVII веку. Исследуя прогнозирование выигрыша в азартных играх, Блез Паскаль и Пьер Ферма открыли первые вероятностные закономерности, возникающие при бросании костей. Под влиянием поднятых и рассматриваемых ими вопросов решением тех же задач занимался и Христиан Гюйгенс. При этом с перепиской Паскаля и Ферма он знаком не был, поэтому методику решения изобрёл самостоятельно. Его работа, в которой вводятся основные понятия теории вероятностей (понятие вероятности как величины шанса; математическое ожидание для дискретных случаев, в виде цены шанса), а также используются теоремы сложения и умножения вероятностей (не сформулированные явно), вышла в печатном виде на двадцать лет раньше (1657 год) издания писем Паскаля и Ферма (1679 год).
Важный вклад в теорию вероятностей внёс Якоб Бернулли: он дал доказательство закона больших чисел в простейшем случае независимых испытаний. В первой половине XIX века теория вероятностей начинает применяться к анализу ошибок наблюдений; Лаплас и Пуассон доказали первые предельные теоремы. Во второй половине XIX века основной вклад внесли русские учёные П. Л. Чебышев, А. А. Марков и А. М. Ляпунов. В это время были доказаны закон больших чисел, центральная предельная теорема, а также разработана теория цепей Маркова. Современный вид теория вероятностей получила благодаря аксиоматизации, предложенной Андреем Николаевичем Колмогоровым. В результате теория вероятностей приобрела строгий математический вид и окончательно стала восприниматься как один из разделов математики.
Математическая статистика - раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений. В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы.
Математическая статистика сформировалась как научная дисциплина, являющаяся частью математики во 2-й половине XIX - начале XX веков.
Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (напр., оценить необходимый объём выборки для получения результатов требуемой точности при выборочном обследовании).
Выделяют описательную статистику, теорию оценивания и теорию проверки гипотез. Описательная статистика есть совокупность эмпирических методов, используемых для визуализации и интерпретации данных (расчет выборочных характеристик, таблицы, диаграммы, графики и т. д.), как правило, не требующих предположений о вероятностной природе данных. Некоторые методы описательной статистики предполагают использование возможностей современных компьютеров. К ним относятся, в частности, кластерный анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости.
Методы оценивания и проверки гипотез опираются на вероятностные модели происхождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что характеристики изучаемых объектов описываются посредством распределений, зависящих от (одного или нескольких) числовых параметров. Непараметрические модели не связаны со спецификацией параметрического семейства для распределения изучаемых характеристик. В математической статистике оценивают параметры и функции от них, представляющие важные характеристики распределений (например, математическое ожидание, медиана, стандартное отклонение, квантили и др.), плотности и функции распределения и пр. Используют точечные и интервальные оценки.
В математической статистике есть общая теория проверки гипотез и большое число методов, посвящённых проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (то есть о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.
Большое значение имеет раздел математической статистики, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.
Задачи восстановления зависимостей активно изучаются более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов.
Разработка методов аппроксимации данных и сокращения размерности описания была начата более 100 лет назад, когда К. Пирсон создал метод главных компонент. Позднее были разработаны факторный анализ и многочисленные нелинейные обобщения.
Различные методы построения (кластер-анализ), анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без), автоматической классификации и др.
В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчётов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).