Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконом4.doc
Скачиваний:
172
Добавлен:
24.03.2015
Размер:
1.64 Mб
Скачать

Он төртінші лекция математикалық статистика элементтерi

Қоғам өмiрiнде, өндiрiсте, ғылымның түрлi саласында, адамның күнделiктi тiршiлiгiнде қандай да бiр статистикалық мәлiметтер жинақталып қалады. Статистикалық мәлiметтердi жинап, жүйелеп, зерттеп, олардан қорытынды шығару мәселесiмен математиканың математикалық статистика деп аталатын бөлiмi айналысады. Халық саны жөнiндегi мәлiметтердi жинаудан басталған статистика кейiннен өмiрдiң әр түрлi саларында да орын алды. Я. Бернулли, П.Л.Чебышев, А.А.Марков, А.М.Ляпунов және т.б. ғалымдар статистикалық мәлiметтердi ықтималдықтар теориясы түрғысынан зерттедi. Математикалық статистиканың дамуына ХХ ғасырда кеңес үкiметiнiң В.И.Романовский, Е.Е.Слуцкий, А.Н.Колмогоров және т.б. ғалымдарымен қатар ағылшынның Стьюдент, Р.Фишер, Э. Пирсон және американдық Ю.Нейман, А.Вальд есiмдi ғалымдарының еңбектерi зор үлес қосты.

1. Таңдама. Математикалық статистиканың негiзгi үғымы – таңдама. Таңдама үғымын анықтауға мүмкiндiк беретiн мысал қарастырайық.

1-мысал. Электр шамының сандартқа сай келу уақыты 1200 сағат. Барлық шамдарды тексерiп шығу мүмкiн емес. Сондықтан дайын шамдардың белгiлi бiр бөлiгiн ғана алып, соны стандартқа зерттейдi.

2-мысал. Консервленген тамақ өнiмiнiң сапасын тексеру үшiн, консервiнi ашып көру керек. Ал барлық консервнi ашып тексеру, тамақты жарамсыз етедi. Сондықтан барлық өнiмнiң белгiлi бiр бөлiгiн ғана алып, соның сапасын зерттейдi.

Статистикада қарастырып отырған объектiлер жиынын бас жиын деп атайды. Бас жиыннан кездейсоқ алынған жиынды таңдама деп атайды. Таңдамадағы объектiлер санын таңдаманың көлемi деп атайды.

1-мысалдағы объект – электр шамы; бас жиын – барлық электр шамдары; ал таңдама – тексеруге алынған электр шамдары. Ал 2-мысалдағы объект – консервленген тамақ өнiмi; бас жиын – барлық консервленген тамақ өнiмi; таңдама – тексеруге алынған консервленген тамақ өнiмi.

Таңдаманы дұрыс құрып алудың маңызы зор. Қазақстандағы мектеп бiтiрушiлердiң математикадан бiлiмдерiн тексеру үшiн таңдама қүрылған болсын. Егер таңдама тек математиканы тереңдетiп оқытатын мектеп оқушыларынан құрылған болса, көрсеткiш жоғары болады. Егер таңдамадағы оқушылар әр облыстан, ауыл және қала мектептерi мен әр түрлi мектептерден (гимназия, лицей, түрлi кәсiптiк бағыттағы мектептер және т.б.) және алынған оқушылар кездейсоқ таңдалған десек, таңдама дұрыс құрылған деп, алынатын көрсеткiш нақты деп есептеуiмiзге болады. Сонымен, таңдаманы зерттелгелi отырған объектiнiң нақты көрсеткiшi бола алатындай етiп құруымыз керек. Таңдаманы зерттеп, алынған нәтиженi “бүкiл жиынтық үшiн де осындай” деп айта алатындай болуымыз керек. Әрине, мұнда 100% кепiлдiктi ешкiм бере алмайды, оның себептерi де түрлiше болады. Сондықтан математикалық статистикада зерттелiп отырған объект табиғатына байланысты нәтижеде кеткен қателiк мөлшерiн бағалау әдiстерi де бар.

2. Таңдама үлестiрiмi. Бiз кездейсоқ шаманың үлестiрiм заңын бiлемiз. Ендi таңдама үлестiрiмi ұғымымен танысайық.

Бас жиыннанн таңдама құрылды дейiк. Таңдама көлемi n болсын. Таңдамадағы мәлiметтердiң әр түрлiлерiн х1, х2, ..., хk деп белгiлейдi де, оларды варианталар деп атайды. Егер варияцияларды өсу ретiмен орналастырсақ, варияциялық қатар аламыз:

х1, х2, ..., хk.

Таңдамада х1 вариантасы n1 рет, х2 вариантасы n2 рет, ..., хk вариантасы nk рет қайталансын. n1, n2, ..., nk сандары варияциялық қатардың жиiлiктерi деп аталады және олардың қосындысы таңдама көлемiне тең:

n1 + n2 + ... + nk = n.

Ал жиiлiктердiң таңдама көлемiне қатынасы варияциялық қатардың салыстырмалы жиiлiгi деп аталады және олардың қосындысы бiрге тең:

W1 + W2 + ... + Wk = 1.

Ендi таңдама үлестiрiмiнiң анықтамасын берейiк.

Анықтама. Таңдаманың варияциялық қатарымен бiрге жиiлiктерi немесе салыстырмалы жиiлiктерi көрсетiлсе, таңдама үлестiрiмi берiлген деп айтады.

Таңдама үлестiрiмiн төмендегiдей кесте түрiнде беруге болады. Бiрiншi кестеде таңдама жиiлiктерiнiң үлестiрiмi берiлсе, екiншi кестеде салыстырмалы жиiлiктерiнiң үлестiрiмi берiлген:

хi

х1

х2

...

хk

xi

x1

x2

...

xk

ni

n1

n2

...

nk

Wi

W1

W2

...

Wk

Мысалы топтағы 10 ұлдан бiр айдың iшiнде қанша әдеби кiтап оқығаны жөнiнде мәлiмет жиналған. Кезекпен сұрағанда ұлдардың жауабы мынадай болған:

2, 1, 3, 0, 2, 7, 0, 3, 1, 1,

яғни көлемi n = 10 болатын таңдама құрылған. Осы мәлiметтердiң iшiндегi әр түрлiлерi, яғни варианталар мыналар: 2, 1, 3, 0, 7. Варианталарды өсу ретiмен орналастырып варияциялық қатар аламыз:

хi: 0, 1, 2, 3, 7.

Сонда топта

бiрде бiр кiтап оқымаған (х1 = 0) екi бала (n1 = 2);

бiр кiтап оқыған (х2 = 1) үш бала (n2 = 3);

екi кiтап оқыған (х3 = 2) екi бала (n3 = 2);

үш кiтап оқыған (х4 = 3) екi бала (n4 = 2);

жетi кiтап оқыған (х5 = 7) бiр бала (n5 = 1)

бар екен. Таңдаманың жиiлiктер үлестiрiмiн жазайық:

хi

0

1

2

3

7

ni

2

3

2

2

1

Жиiлiктер қосындысы таңдама көлемiне тең екенiн тексерейiк. Шынында да,

2 + 3 + 2 + 2 + 1 = 10.

Таңдаманың салыстырмалы жиiлiктер үлестiрiмiн жазу үшiн жиiлiктердi таңдама көлемiне, яғни 10-ға, бөлiп жазамыз:

хi

0

1

2

3

7

Wi

0,2

0,3

0,2

0,2

0,1

Салыстырмалы жиiлiктер қосындысы бiрге тең екенiн тексерейiк. Шынында да, 0,2 + 0,3 + 0,2 + 0,2 + 0,1 = 1.

3. Полигон және гистограмма. Кездейсоқ шаманың үлестiрiм заңы берiлгенде үлестiрiм сынық сызықтарын сала аламыз. Сол сияқты таңдаманың да үлестiрiмiн графиктiк түрде сызып көрсетуге болады. Таңдама жиiлiк үлестiрiмiмен берiлсiн:

хi

х1

х2

...

хk

ni

n1

n2

...

nk

Тiкбұрышты декарттық координаталар жүйесiнде (х1, n1), (x2, n2), ..., (xk, nk) нүктелерiн салып, оларды кесiндiлермен тiзбектей қосайық (1-сурет). Сонда пайда болған сынық сызықтар тiзбегiн жиiлiк полигоны деп атайды.

Егер таңдама салыстырмалы жиiлiк үлестiрiмiмен берiлсе, онда салыстырмалы жиiлiк полигонын салу үшiн тiкбұрышты декарттық координаталар жүйесiнде (х1,W1), (x2,W2), ..., (xk, Wk) нүктелерiн салып, оларды кесiндiлермен тiзбектей қосамыз (2-сурет).

Егер таңдамадағы варианталар саны көп болса, полигон салған қолайсыз. Ол кезде таңдама мәндерi жататын интервалды тең кiшi интервалдарға бөледi, олардың ұзындығын h деп белгiлейiк. Әрбiр кiшi интервалдағы таңдама жиiлiгiн анықтайды, оны әдеттегiдей ni деп белгiлейiк. Әрбiр кiшi интервалдағы таңдама жиiлiгiнiң интервал ұзындығына қатынасын жиiлiк тығыздығы деп атайды. Табаны h, биiктiгi болатын тiктөртбұрыштардан тұратын сатылы фигураныжиiлiк гистограммасы деп атайды. Мысалы, модель болуға қатысқан 50 адамның бойларын өлшегенде мынадай мәлiметтер алынған:

165, 167, 168, 170, 170, 171, 172, 173, 173, 174,

175, 175, 176, 176, 176, 177, 177, 177, 177, 177,

178, 178, 178, 178, 178, 179, 179, 179, 179, 180,

180, 180, 180, 181, 181, 181, 182, 182, 182, 183,

183, 183, 184, 184, 185, 185, 186, 187, 188, 190.

Алынған мәлiметтер 165, 190 интервалында орналасқан. Осы интервалды ұзындығы h = 5 болатын интервалдарға бөлейiк:

165, 170, 170, 175, 175, 180, 180, 185, 185, 190.

Әрбiр интервалдағы жиiлiктер санын анықтау үшiн, осы интервалдарға түсетiн таңдамаларды санап, кестенiң үшiншi тiк жолына жазайық. Жиiлiктер санын 5-ке бөлiп, әр интервалдағы таңдама тығыздығын тауып, кестенiң төртiншi тiк жолына жазайық:

Интервалдар нөмiрi

Интервалдар

Жиiлiктер (ni)

Жиiлiк тығыздығы

1

165, 170

4

0,8

2

170, 175

7

1,4

3

175, 180

20

4

4

180, 185

14

2,8

5

185, 190

5

1

Ендi кестенi пайдаланып жиiлiк гистограммасын салуға болады

3-сурет

4. Таңдаманың кейбiр сандық сипаттамалары. Егер бiзге бiрнеше сандық мәлiметтер берiлсе, оның орташа мәнiн табуды бұрыннан бiлемiз. Ол үшiн сандық мәлiметтердi қосып, мәлiметтер санына бөлетiнбiз. Бiзге берiлген сандық мәлiметтер х1, х2, ..., хn болсын. Олардың саны n. Сандық мәлiметтердiң орташа мәнiнх деп белгiлесек, ол былайша есептеледi:

Мысалы оқушының алты оқу күнiнде мектепке баруға кететiн уақыты (минут есебiмен) мынадай болған:

35, 35, 25, 40, 30, 45.

Оқушының мектепке баруға орташа есеппен бiр күнде қанша уақыт керек екенiн есептейiк. Ол үшiн орташа мән табу формуласын қолданамыз:

.

Сонымен, оқушы мектепке баруға бiр күнде орташа есеппен 35 мин уақыт жiбередi екен.

Егер көлемi n болатын таңдама жиiлiк үлестiрiмiмен берiлсе:

хi

х1

х2

...

хk

ni

n1

n2

...

nk

онда таңдаманың орта мәнiх былайша есептеледi:

,

мұндағы, n = n1 + n2 + ... + nk.

Мысалы таңдама мынадай жиiлiк үлестiрiмiмен берiлсе:

хi

1

3

4

6

ni

10

3

6

1

онда таңдаманың орташа мәнiх былайша есептеледi:

.

Сонымен, таңдаманың орташа мәнi екен.

Тағы бiр мысал қарастырайық. Топтағы 23 студенттің 11-i жыл бойы бiрде бiр әдеби кiтап оқымаған, 8-i тек бiр ғана кiтап оқыған, екеуi 3 кiтаптан және екеуi 30 кiтаптан оқып шыққан. Топтың орташа көрсеткiшi бола алатын бiр студент неше кiтап оқығанын есептейiк. Алдымен берiлгендердi кесте түрiнде жазып алайық:

Кiтаптар саны (xi)

0

1

3

30

Студенттер саны (ni)

11

8

2

2

Орташа мәндi есептейтiн формуланы қолдансақ,

.

Сонымен, топтың “орташа” студенті 3 кiтаптан оқиды екен. Бiрақ осы нәтиженi, топтағы 19 студенттің (топтың 80%) бiр жылда оқыған кiтаптар саны бiрден артпай тұрғанда, дұрыс деп айтуға болмайды. Олай болса, сұраққа жауап беретiн басқа жол iздеу керек.

Мынадай жаңа ұғым енгiзейiк.

Анықтама. Өсу ретiмен орналасқан таңдаманы тең екi бөлiкке бөлетiн мәндi таңдаманың медианасы деп атайды да МD деп белгiлейдi. Егер таңдама көлемi тақ сан болса, медиана тең ортада тұрған мән болады да, ал таңдама көлемi жұп сан болса, медиана тең ортада тұрған екi мәннiң арифметикалық орташасы болады.

Есебiмiзге қайтып келейiк. Алынған таңдаманы бiр қатарға жазып алайық:

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 3, 3, 30,30.

Қатарда 23 сан бар, яғни таңдама көлемi 23 – тақ сан. Таңдама медианасы он екiншi орында тұрған сан, ол жерде 1 тұр, яғни МD = 1. Сонда осы топтың “орташа” студенті жылына 1 кiтап оқыған. Мiне осы нәтиженi дұрыс жасалған деп қабылдауға болады. Шынында да, ықтималдықтар тұрғысынан қарастырсақ, топтағы кез келген студенттің оқыған кiтаптар саны бiрден артпау ықтималдығы мен оқыған кiтаптар саны бiрден кем болмау ықтималдығы өзара тең. Медиана осы ықтималдықтардың теңдiгiн қаматамасыз ететiн сан.

Ендi таңдама көлемi жұп сан болатын жағдайға мысал қарастырайық. Мынадай таңдама берiлсiн: 1, 2, 2, 3, 4, 4, 5, 6.

Таңдама көлемi 8. Ортада 3 және 4 саны тұр. Таңдама медианасы осы екi санның арифметикалық орташасы болады: .

Ендi мода ұғымымен танысайық.

Анықтама. Варияциялық қатардың жиiлiгi ең көп вариантасын мода деп атайды да Мо деп белгiлейдi.

Мысалы мынадай таңдама жиiлiк үлестiрiмiмен берiлсiн:

хi

2

3

4

5

ni

1

15

6

3

Модасын табайық. Ең көп жиiлiк n2 = 15. Оған сәйкес келетiн варианта x2 = 3. Олай болса, таңдаманың модасы Мо = 3.

Практикада сандық мәлiметтердiң (таңдамалардың) орташа мәнiн табу жиi кездеседi. Кейбiр жағдайда осы мәлiметтердiң орташа мәннен қаншалықты алшақ орналасқанын да бiлу қажет болады.

Анықтама. Варияциядағы ең үлкен варианта мен ең кiшi вариантаның айырымы таңдаманың ауқымы деп аталады да R деп белгiленедi.

R = хmax.– хmin.

Топтағы «орташа» студенттің жыл бойы оқыған кiтап саны жөнiндегi есептегi таңдама ауықымын есептейiк. Таңдамадағы ең үлкен варианта хmax = 30, ал ең кiшi варианта хmin = 0. Олай болса таңдама ауқымы мынаған тең: R = 30 – 0 = 30.

Егер таңдама ауқымы үлкен сан болса, онда таңдама орташасы дұрыс көрсеткiш бермейдi. Оны жоғарыда да байқадық.

5. Таңдаманың дисперсиясы. Алдымен таңдамадағы сандардың шамасы үлкен болып келгенде орташа мәндi есептеудiң оңай жолымен танысайық. Мысалы, баскетбол командасындағы ойыншылардың бойлары мынадай болған:

185, 186, 186, 187, 188, 188, 189, 190, 191, 196.

Команда ойыншыларының орташа бойын есептейiк:

Сонымен команда ойыншыларының орташа бойы болды.

Ендi осыны басқалай есептейiк. Команда ойыншыларының бойы а = 188 шамасының маңында өзгередi. Әрбiр мәннен осы шаманы алып тастасақ мынадай қатар аламыз:

–3, –2, –2, –1, 0, 0, 1, 2, 3, 8.

Осы қатардың орташа мәнiн есептейiк:

.

Қатардың орташа мәнi болды. Сонда жаңа қатардың орташа мәнiн а шамасына қоссақ,

188 + 0,6 = 188,6

негiзгi қатардың орташа шамасымен бiрдей болды. Тек екiншi орташа мәндi есептеу бiрiншiмен салыстырғанда әлдеқайда жеңiл.

Жалпы түрде х1, х2, ..., хn берiлген таңдама, ал оның орташа мәнi болсын. Осы таңдама қандай да бiр а шамасы маңында шоғырланған болсын. х1' = х1– а, x2' = х2 а, ..., xn' = хn–а шамалардан мынадай қатар құрайық:

х1', x2', ..., xn'.

Алынған жаңа қатардың орташа мәнiн деп белгiлейiк. Сонда берiлген қатардың орташа мәнi мынаған тең болады:

. (1)

Сандық мәлiметтердiң орташа мәннен шашыраңқы орналасқанындығының тағы бiр көрсеткiшi дисперсия мен орташа квадраттық ауытқу.

Көлемi n болатын таңдама берiлсiн. Таңдамадағы сандық мәлiметтер әр түрлi дейiк: х1, х2, ..., хn

Таңдаманың орта мәнi болсын. Таңдамадағы санды мәлiметтер мен орта мәннiң айырымы ауытқу деп аталады. Оларды жазсақ:

х1 , х2 , ..., хn .

Ендi осы ауытқу квадраттарын алайық:

1 )2 , (х2 )2, ..., (хn)2.

Анықтама. Ауытқу квадраттарының орташасы таңдама дисперсиясы деп аталады да DT деп белгiленедi.

Сонымен, таңдама дисперсиясы мынаған тең екен:

, (2)

Ал егер таңдама жиiлiк үлестiрiмiмен берiлсе:

хi

х1

х2

...

хk

ni

n1

n2

...

nk

онда дисперсия формуласы мына түрде жазылады:

, (3),

мұндағы, n = n1 + n2 + ... + nk.

Әдетте дисперсия оңай есептелетiн мынадай теорема қолданылады.

Теорема. Таңдаманың дисперсиясы таңдама квадратының орташа мәнi мен орташа мән квадратының айырымына тең:

DТ = - (4),

мұндағы

, .

Дисперсия таңдамадағы мәлiметтердiң орташа мәннен қаншалықты шашырап орналасқанын көрсетедi. Дисперсия артқан сайын мәлiметтердiң орташа мәннен шашырауы да арта түседi.

Мысал қарастырайық. Лабораторияда қандай да бiр сұйықты 200 милилитрлiк құтыға құятын екi өлшеуiш прибор бар. Екi прибордың қаншалықты дәл жұмыс iстеуiн тексеру мақсатында, әрқайсысымен 10 реттен алып өлшегенде нәтиже төмендегiдей болған:

Бiрiншi прибор көрсеткiшi (А)

200,1

199,8

200

200,2

199,9

199,8

200,2

199,7

200

200,3

екiншi прибор көрсеткiшi (В)

200

199,8

200

200

199,9

199,9

200,2

200

200,2

200

Берiлген сандық мәлiметтердiң орташа мәнiн табайық. Берiлен мәлiметтер а = 200 шамасында өзгеретiндiктен (1) формуланы қолданайық.

,

.

Екi прибордың да орташа көрсеткiшi бiрдей. Ендi дисперсияларын есептейiк. (2) формуланы қолдансақ,

.

Алынған нәтижелердi салыстырсақ, 0,031>0,013, демек, А приборының мөлшерлеуi В приборының мөлшерлеуiне қарағанда орташа мәннен көп шашырап орналасқан. Осыдан А приборына қарағанда В приборының сапасы жоғары деген қорытынды аламыз.

Таңдаманың басқа да сипаттамаларын қысқаша келтіре кетейік.

1. Таңдаманың - ретті бастапқы моменті деп мынадай шаманы айтады

2. Таңдаманың - ретті орталық моменті деп мынадай шаманы айтады

3. Таңдама ассиметриясы деп мынадай шаманы айтады

4. Таңдама эксцессі деп мынадай шаманы айтады

.