Для получения данных о состоянии общества используется целый комплекс наук. Одна из них – статистика. Что она собой представляет?
Что такое статистика?
Так называют отрасль знаний, где излагают общие вопросы по сбору, измерению и анализу массовых (количественных или качественных) данных. Также статистика занимается изучением количественной стороны общественных массовых явлений с точки зрения их числовой формы. Происходит данное слово от латинского status, что означает «состояние дел». Первоначально данная наука называлась «Государствоведением».
Впервые термин «статистика» использовали в 1746 году, и этот момент положил начало такой учебной дисциплине и науке. Правда, нельзя сказать, что с этим началось ее непосредственное использование, поскольку учёт, измерение и анализ данных проводились значительно раньше. Важным параметром является мода. Что-то похожее можно вспомнить из геометрии, но это не совсем то. Но что такое мода в статистике? Так называют значение из линейного ряда, которое встречается чаще всего.
Примеры
Давайте поговорим о чем-то более близком к реальности. Что такое статистика страницы веб-сайта? В качестве этого параметра может выступать количество пользователей, которые зашли на ресурс и имели возможность ознакомиться с его содержимым. Правда, с этой точки зрения будет сложно ответить на вопрос, что такое статистика «ВКонтакте».
Отдельной для каждой страницы информацию не собирают. Но ведётся подсчет количества пользователей, что заходят за день, месяц – в общем, постоянно. Это и является ответом на вопрос, что такое статистика на практике в информационных технологиях.
Виды группировки
В рамках научной дисциплины проводят разделение одной совокупности на отдельные группы, что однородны в определённом отношении. Чтобы рассчитать количество интервалов, когда нет четких рамок, часто применяют формулу Стёрджеса:
ЧИ=1+3,322*lg ЧН, где
- ЧИ – число интегралов;
- Lg – логарифм;
- ЧН – число наблюдений.
Зависимо от целей различают три вида группировок:
- Аналитическая. Используется для выявления связей между группировками.
- Типологическая. Исследуемую совокупность разделяет на однородные группы.
- Структурная. Разделение на однородные объединения осуществляется на основании четкого признака.
Типическая группа должна стремиться к тому, чтобы максимально отличаться от других и быть наиболее похожей внутри себя. Они бывают первичными и вторичными. Первые формируются во время статистического наблюдения. Вторичные группировки делают, основываясь на полученных данных.
Классификация статистических методов
Они нашли свое применение почти везде. Поэтому логично предположить, что универсального инструмента нет. В зависимости от специфичности и погружения в конкретные проблемы выделяют такие статистические методы анализа данных:
- Разработка и исследование инструментов общего назначения, которые не учитывают особенности области применения.
- Создание и использование статистических моделей какого-то реального явления или процесса в определённой сфере деятельности.
- Разработка и использование методов и инструментов, чтобы анализировать конкретные данные для решения прикладных задач.
Прикладная статистика
Этот раздел науки занимается обработкой данных произвольной природы. В качестве математической основы прикладной статистики и её методов анализа выступают математическая статистика и теория вероятностей. Всё начинается с описания вида полученных данных, а также механизма их происхождения. Для этого используются вероятностные и детерминированные методы. Последние можно применять только в тех случаях, когда в распоряжении исследователя достаточно данных (пример – отчеты государственных органов статистики, что основываются на информации, предоставленной предприятиями). А вот перенести полученный результат на больший масштаб и оценить перспективы можно исключительно с использованием вероятностно-статистического моделирования.
В простейшей ситуации имеющиеся данные выступают в качестве значения определённого признака, который свойственен изучаемому объекту. Параметры здесь бывают количественными или указательными (в зависимости от категории, к которой они относятся). Второй вариант обычно говорит о качественной характеристике. А что, если взять их несколько? Или добавить количественные? Тогда можно говорить, что получен вектор объекта. Он рассматривается в качестве нового вида данных. При масштабных исследованиях выборки составляются из нескольких наборов векторов. Важным является уточнение и перепроверка полученной информации. Для этого используется повторная выборка.
Заключение
Как видите, статистика позволяет структурировать значительные массивы данных, которые необходимы для возможности предоставления информации о положении дел в определённых сферах. Так, важную роль она играет для инвесторов, поскольку дает возможность наблюдать за динамикой роста экономик государств. Предоставляет интерес статистика и для граждан и властей, говоря им о процессах в стране: демографический рост или кризис, возрастание благосостояния или его падение и так далее.