Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
текст 1.docx
Скачиваний:
18
Добавлен:
19.03.2015
Размер:
38.99 Кб
Скачать

Введение

Мир состоит из объектов, обладающих свойствами. Свойства объектов можно подразделить на свойства 1-го и 2-го порядка.

Свойства 1-го порядка - непосредственно наблюдаемые (оцениваемые, измеряемые) субъектом. Свойства 1-го порядка обычно называют признаками объектов.

Свойства 2-го порядка представляют собой связи между признаками (свойствами 1-го порядка). Знание о таких связях позволяет предугадать значения одних признаков на основании значений других признаков.

Например, значения признака «температура тела», указывают на наличие или степень признака «воспалительный процесс».

Формулировка человеком знаний, т.е. выявление таких связей, основывается на его опыте, накопленном в процессе деятельности с объектами.

Согласно общепринятой метафоре человек накапливает опыт и знания.

Так опыт сохраняется в форме знаков (значений) свойств изучаемых объектов, зафиксированных на носителе. Массивы таких значений называют данными.

Данные - основа знаний

Согласно той же метафоре «ёмкостью» для хранения данных и знаний является память - индивидуальная (биологическая, «внутренняя») память человека и память, основанная на носителях, «внешних» для человека («внешняя» память) - «твёрдых» и электронных.

«Твёрдые» носители (в т.ч. бумага) в целом более надёжны и долговечны по сравнению с человеческой памятью.

Электронные носители также достаточно надёжны (при определенных условиях), а кроме того позволяют проводить поиск и преобразование (см. далее) данных гораздо быстрее, чем это возможно при использовании «твёрдых» носителей.

В результате накопления данных, появляется возможность проводить их анализ и обобщение (редукцию - от лат. «reductio» - «сокращение»), что проявляется в формулировке знаний - знаковых моделей действительности.

В последние десятилетия накопление данных всё в большей степени основывается на электронных технологиях, что позволяет интенсифицировать и «добычу» знаний.

Знания так же, как и данные, фиксируются памятью как «собственной» для человека, т.е. биологической, так и «внешней» (например, на электронной или бумажной основе).

Формулировку знаний способен выполнить только ЧЕЛОВЕК!

Методы, используемые для формализации данных

Одной из наук, которая изучает методы сбора, преобразования, представления и анализа данных, является статистика.

Мы часто встречаемся со словами «статистика», «статистические данные». Слова эти могут употребляться в разном смысле и в разном контексте. Можно найти немало афоризмов и высказываний о статистике, причем весьма иронических:

  • «Статистика знает все!» – писали Илья Ильф и Евгений Петров. – «Известно, сколько какой пищи съедает в год средний гражданин республики… Сколько в стране охотников, балерин … станков, велосипедов, памятников, маяков и швейных машинок. Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!…»

  • Статистика есть наука о том, как, не умея мыслить и понимать, заставить делать это цифры (Василий Осипович Ключевский).

  • Статистика - самая точная из всех неточных наук (Гюстав Флобер).

  • Статистически - дважды два в среднем будет четыре (Ягодзиньский Хенрик).

  • Есть три разновидности лжи: ложь, гнусная ложь и статистика (это высказывание приписывают премьер-министру Великобритании Бенджамину Дизраэли, а известность оно получило благодаря Марку Твену).

<object classid="clsid:38481807-CA0E-42D2-BF39-B33AF135CC4D" id="ieooui"> </object >

Давайте попробуем разобраться в том, что такое статистика.

Статистика имеет многовековую историю. Начало статистической практики относится примерно к времени возникновения государства. Первой опубликованной статистической информацией можно считать глиняные таблички Шумерского царства (III – II тысячелетия до н. э.). Типовые примеры раннего этапа применения статистических методов описаны в Библии, в Ветхом Завете. Там, в частности, приводится число воинов в различных племенах.

С развитием человечества постепенно накапливались данные, которые мы называем сейчас статистическими: сведения о рождаемости, смертности, количестве граждан в городах и государствах и т.п. Но как наука статистика стала развиваться лишь со второй половины XVII века, когда в Европе сложились две основные школы; в Англии – математическая школа статистики, в Германии – описательная школа статистики.

В Англии это направление получило название «политической арифметики» и оно было ближе к современному пониманию статистики. Представители английской школы главным считали выявление на базе огромного числа наблюдений разных закономерностей и взаимосвязей изучаемых явлений. Политические арифметики стремились с помощью обобщения и анализа фактов охарактеризовать состояние и развитие общества. Результаты, полученные этими учеными, внесли большой вклад в развитие современной статистики.

Германская школа статистики собирала в основном описательно-информационный материал, который потом не анализировался. Труды приверженцев этого направления содержали описание стран, их устройства, быта и нравов населения, климата, денег, армии. С сегодняшних позиций эти труды нельзя назвать статистическими, поскольку они представляют собой словесное описание «достопримечательностей государства».

В первой половине XIX века появилось новое направление статистической науки, Оно получило название математико-статистического. Приверженцы этого направления дошли до теоретического обобщения практики учетно-статистических работ, до сотворения теории статистики.

Со временем собирание данных о массовых общественных явлениях приобрело регулярный характер. Были выработаны правила переписей населения и регулярность их проведения. Международной статистикой занимаются в настоящее время такие международные организации как ООН, ЮНЕСКО, ЕС, Мировой банк и другие. Внутри каждого государства развивается государственная статистика каждой отдельной страны. Сложились методы работы, продолжающие лучшие традиции государствоведения.

В научный обиход слово «статистка» вошло в XVIII веке и употреблялось сначала в значении «государствоведение». Сам термин «статистика» произошел от латинских слов stato (государство) status (положение вещей, состояние). В первый раз его употребил немецкий ученый Г. Ахенваль (1719-1772).

Различными авторами было дано множество определений статистики. Известно, что еще девяносто лет тому назад Рюмельн насчитывал 63 определения статистики, включая и свое собственное. Если верить М. Губеру, в 1940 г. насчитывалось уже 100 определений. В настоящее время этих определений имеется гораздо больше.

В книге В.В. Налимова "Вероятностная модель языка. О соотношении естественных и искусственных языков" приведено 158 определений (их можно найти на сайте www.biometrica.tomsk.ru). В этих определениях рассматриваются разные стороны статистики. Если собрать их вместе, то можно получить обобщенное определение статистики:

Статистика – отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных. Статистика разрабатывает специальную методологию исследования и обработки материалов: массовые статистические наблюдения, метод группировок, средних величин, индексов, балансовый метод, метод графических изображений и другие методы анализа статистических данных.

В 1954 г. академик АН УССР Б.В. Гнеденко дал следующее определение: «Статистика состоит из трёх разделов:

1. сбор статистических сведений, то есть сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;

2. статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;

3. разработка приёмов статистического наблюдения и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики».

В зависимости от области применения различают медицинскую статистику, демографическую статистику, экономическую статистику, математическую статистику (которая в свою очередь может применяться в экономических исследованиях и называться эконометрикой, в биологических и медицинских исследованиях и называться биометрикой) и т.п. Все эти разделы базируются на общей теории статистики.

Таким образом, статистика – огромный раздел науки со своими правилами и законами.

Начинать планирование статистической обработки данных надо тогда же, когда планируется само исследование. При этом надо помнить, что статистика используется, в основном, с тремя целями:

    1. Описать и просуммировать полученные данные, представив их в виде небольшого количества цифр или графически, так, чтобы аудитория могла быстро оценить группу, с которой работал исследователь, и ее характеристики.

    2. Вывести общие закономерности на основании полученных данных. Ответить на вопрос: если у меня в исследовании уровень артериального давления снизился, будет ли отмечено снижение в других исследованиях или в практике?

    3. Идентифицировать взаимосвязи или оценить различия между группами. Если мы знаем характеристики одной группы, то насколько мы можем угадать другие характеристики этой группы. Например, если мы знаем результаты диагностического теста, насколько точно мы можем предсказать, что у данного пациента есть заболевание?

Теоретически выделяют два основных типа статистических техник – описательную (descriptive) и доказательную (inferential). Первая группа включает методы, с помощью которых мы сможем представить наши данные в компактном виде, достаточно легком для восприятия, но не жертвуя при этом большими объемами информации или не искажая исходных данных. К таким методам относятся таблицы, графики, показатели центральной тенденции, такие как средние, медианы, моды, а также показатели разброса (дисперсия, стандартное отклонение, межквартильное расстояние и т.п.). Описательные методы характеризуют изучаемую группу. В противоположность этому доказательные методы пытаются ответить на вопрос об обобщаемости полученных результатов. Иными словами, с их помощью исследователи пытаются на основании полученных результатов предсказать, каковы будут результаты при использовании того же метода, например, у всех пациентов с данным заболеванием. Доказательные методы являются наиболее распространенными методами статистического анализа и именно их обычно и вспоминают исследователи, когда речь заходит о статистической обработке данных.

Следует помнить, что в результате применения статистического метода мы получаем не истину в последней инстанции, а всего лишь оценку вероятности того или иного предположения. Кроме того, каждый статистический метод основан на собственной математической модели, и результаты его правильны настолько, насколько эта модель соответствует действительности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]