Internet Windows Android
Kengaytirish

Korrelyatsiya matritsasi. Tizimli biznesni optimallashtirish va sifat menejmenti markazi – Faktor tahlili uchun korrelyatsiya matritsasi

Ular ma'lum o'zgaruvchilar to'plamidan bir-biri bilan chambarchas bog'liq (korrelyatsiya qilingan) o'zgaruvchilarning kichik to'plamlarini olishga qaratilgan statistik protseduralar to'plamidir. Bir kichik to'plamga kiritilgan va bir-biri bilan korrelyatsiya qiluvchi, lekin asosan boshqa kichik to'plamlardagi o'zgaruvchilardan mustaqil bo'lgan o'zgaruvchilar omillarni shakllantiradi. Faktor tahlilining maqsadi turli xil kuzatilishi mumkin bo'lgan o'zgaruvchilardan foydalangan holda ochiq kuzatiladigan omillarni aniqlashdir. Tanlangan omillar sonini tekshirishning qo'shimcha usuli, agar omillar to'g'ri tanlangan bo'lsa, asl nusxaga yaqin bo'lgan korrelyatsiya matritsasini hisoblashdir. Ushbu matritsa deyiladi qayta ishlab chiqarilgan korrelyatsiya matritsasi. Ushbu matritsaning asl korrelyatsiya matritsasidan (tahlil boshlangan) qanday og'ishini ko'rish uchun ular orasidagi farqni hisoblashingiz mumkin. Qoldiq matritsa "kelishmovchilik" ni, ya'ni mavjud omillar asosida ko'rib chiqilgan korrelyatsiya koeffitsientlarini etarli darajada aniqlik bilan olish mumkin emasligini ko'rsatishi mumkin. Asosiy komponentlar va omillarni tahlil qilish usullarida yechimning to'g'riligini baholashga imkon beradigan bunday tashqi mezon yo'q. Ikkinchi muammo shundaki, omillarni tanlagandan so'ng, bir xil boshlang'ich o'zgaruvchilarga asoslangan, ammo turli xil echimlarni beradigan cheksiz ko'p aylanish variantlari paydo bo'ladi (omil tuzilmalari biroz boshqacha tarzda aniqlanadi). Matematik jihatdan ekvivalent echimlarning cheksiz to'plamidagi mumkin bo'lgan alternativalar orasidagi yakuniy tanlov tadqiqotchilar tomonidan talqin natijalarini mazmunli tushunishiga bog'liq. Va turli xil echimlarni baholash uchun ob'ektiv mezon yo'qligi sababli, yechimni tanlash uchun taklif qilingan asoslar asossiz va ishonarsiz ko'rinishi mumkin.


Shuni ta'kidlash kerakki, faktorizatsiyaning to'liqligi uchun aniq statistik mezonlar mavjud emas. Shunga qaramay, uning past qiymatlari, masalan, 0,7 dan kam, xususiyatlar sonini kamaytirish yoki omillar sonini ko'paytirish maqsadga muvofiqligini ko'rsatadi.

Met Omilning biror xususiyatga ta'siri o'lchovini ifodalovchi ba'zi xususiyat va umumiy omil o'rtasidagi bog'liqlik koeffitsienti ushbu umumiy omil uchun berilgan xususiyatning omil yuki deb ataladi.

Faktor yuklamalaridan tashkil topgan va ustunlar soni umumiy omillar soniga va satrlar soni asl xususiyatlar soniga teng bo'lgan matritsa omil matritsasi deyiladi.

Faktor matritsasini hisoblash uchun asos asl xususiyatlarning juft korrelyatsiya koeffitsientlari matritsasi hisoblanadi.

Korrelyatsiya matritsasi har bir juft xususiyat o'rtasidagi bog'liqlik darajasini belgilaydi. Xuddi shunday, omil matritsasi har bir xususiyatning har bir umumiy omil bilan chiziqli bog'liqlik darajasini belgilaydi.

Faktor yukining kattaligi moduldagi birlikdan oshmaydi va uning belgisi belgi va omil o'rtasidagi ijobiy yoki salbiy munosabatni ko'rsatadi.

Muayyan omil uchun xususiyatning omil yukining mutlaq qiymati qanchalik katta bo'lsa, bu omil bu xususiyatni shunchalik aniqlaydi.

Nolga yaqin bo'lgan ba'zi bir omil uchun omil yukining qiymati bu omil amalda bu xususiyatga ta'sir qilmasligini ko'rsatadi.

Faktor modeli barcha xususiyatlarning umumiy dispersiyasiga omillarning hissasini hisoblash imkonini beradi. Barcha xarakteristikalar uchun har bir omil uchun omil yuklarining kvadratlarini jamlab, biz uning xarakteristikalar tizimining umumiy o'zgarishiga qo'shgan hissasini olamiz: bu hissa ulushi qanchalik yuqori bo'lsa, bu omil shunchalik muhim va ahamiyatli bo'ladi.

Shu bilan birga, boshlang'ich xususiyatlar tizimini etarlicha yaxshi tavsiflovchi umumiy omillarning optimal sonini aniqlash mumkin.

Alohida ob'ektdagi omilning qiymati (namoyish o'lchovi) ushbu omil uchun ob'ektning omil og'irligi deyiladi. Faktor og'irliklari har bir omil uchun ob'ektlarni tartiblash, tartiblash imkonini beradi.

Muayyan ob'ektning omilli og'irligi qanchalik ko'p bo'lsa, unda hodisaning u tomoni yoki o'sha naqshi shunchalik ko'p namoyon bo'ladi, bu omil bilan namoyon bo'ladi.

Faktor og'irliklari ijobiy yoki salbiy bo'lishi mumkin.

Faktorlar o'rtacha qiymati nolga teng bo'lgan standartlashtirilgan qiymatlar bo'lganligi sababli, nolga yaqin bo'lgan omil og'irligi omilning o'rtacha namoyon bo'lish darajasini, ijobiy - bu daraja o'rtachadan yuqori ekanligini, salbiy - bu haqida . keyin u o'rtacha past bo'ladi.

Amalda, agar topilgan asosiy komponentlar (yoki omillar) soni ko'p bo'lmasa m/ 2, ular tomonidan tushuntirilgan dispersiya 70% dan kam emas va keyingi komponent umumiy dispersiyaga 5% dan ko'p bo'lmagan hissa qo'shadi, omil modeli juda yaxshi deb hisoblanadi.

Agar siz omillarning qiymatlarini topmoqchi bo'lsangiz va ularni qo'shimcha o'zgaruvchilar sifatida saqlamoqchi bo'lsangiz, Skorlar ... (Qiymatlar) tugmachasini yoqing.

Omilli tahlil asosiy metodga qaraganda ancha kuchli va murakkab apparatdir

komponent, shuning uchun u natijalar bo'lgan taqdirda qo'llaniladi

komponentlar tahlili to'liq qoniqarli emas. Ammo bu ikki usuldan beri

bir xil muammolarni hal qilish, komponent natijalarini solishtirish kerak va


omil tahlillari, ya'ni yuk matritsalari, shuningdek, uchun regressiya tenglamalari

asosiy komponentlar va umumiy omillar, o'xshashlik va farqlarni sharhlang

natijalar.

Maksimal mumkin bo'lgan omillar soni m ma'lum bir qator xususiyatlar uchun R tengsizlik bilan aniqlanadi

(p + m)<(р-m)2,

Faktorli tahlilning butun protsedurasi oxirida matematik transformatsiyalar yordamida fj omillari dastlabki belgilar orqali ifodalanadi, ya'ni chiziqli diagnostika modelining parametrlari aniq shaklda olinadi.

Asosiy komponentlar va omillarni tahlil qilish usullari ma'lum bir o'zgaruvchilar to'plamidan bir-biri bilan chambarchas bog'liq (korrelyatsiya) bo'lgan o'zgaruvchilarning kichik to'plamlarini olishga qaratilgan statistik protseduralar to'plamidir. Bir kichik to'plamga kiritilgan va bir-biri bilan korrelyatsiya qiluvchi, lekin asosan boshqa kichik to'plamlardagi o'zgaruvchilardan mustaqil bo'lgan o'zgaruvchilar, shakl omillari 1 ... Faktor tahlilining maqsadi turli xil kuzatilishi mumkin bo'lgan o'zgaruvchilardan foydalangan holda ochiq kuzatiladigan omillarni aniqlashdir.

uchun umumiy ifoda j-chi omilni quyidagicha yozish mumkin:

qayerda Fj (j 1 dan oraliqda k) umumiy omillar, Ui- xarakterli, Aij- chiziqli birikmada ishlatiladigan konstantalar k omillar. Umumiy omillar bir-biri bilan va umumiy omillar bilan bog'liq bo'lmasligi mumkin.

Olingan ma'lumotlarga qo'llaniladigan omil-analitik ishlov berish tartiblari har xil, ammo tahlilning tuzilishi (algoritmi) bir xil asosiy bosqichlardan iborat: 1. Dastlabki ma'lumotlar matritsasini tayyorlash. 2. Xarakteristikalar munosabati matritsasini hisoblash. 3. Faktorizatsiya(bu holda faktoriy yechim jarayonida aniqlangan omillar sonini va hisoblash usulini ko'rsatish kerak). Ushbu bosqichda (shuningdek, keyingi bosqichda) olingan faktorial yechim dastlabki ma'lumotlarni qanchalik yaqinlashtirishini ham taxmin qilish mumkin. 4. Aylanish - omillarni transformatsiya qilish, ularni izohlashni osonlashtirish. 5. Faktor qiymatlarini hisoblash har bir kuzatish uchun har bir omil uchun. 6. Ma'lumotlarni talqin qilish.

omil tahlilining ixtirosi bir vaqtning o'zida bir-biri bilan turli masshtablarning ko'p sonli korrelyatsiya koeffitsientlarini tahlil qilish zarurati bilan bog'liq edi. Asosiy komponentlar va omillarni tahlil qilish usullari bilan bog'liq muammolardan biri shundaki, topilgan yechimning to'g'riligini tekshirishga imkon beradigan mezonlar mavjud emas. Masalan, regressiya tahlilida empirik tarzda olingan bog’liq o’zgaruvchilar ko’rsatkichlarini taklif etilayotgan model asosida nazariy jihatdan hisoblangan ko’rsatkichlar bilan solishtirish va ular o’rtasidagi korrelyatsiyadan yechimning to’g’riligi mezoni sifatida foydalanish mumkin. o'zgaruvchilarning ikkita to'plami uchun korrelyatsiya tahlili sxemasi. Diskriminant tahlilda qarorning to'g'riligi sub'ektlarning u yoki bu sinfga mansubligi qanchalik to'g'ri bashorat qilinganiga asoslanadi (hayotdagi haqiqiy tegishlilik bilan solishtirganda). Afsuski, asosiy komponentlar va omillarni tahlil qilish usullarida yechimning to'g'riligini baholashga imkon beradigan bunday tashqi mezon yo'q.Ikkinchi muammo shundaki, omillarni tanlagandan so'ng cheksiz ko'p aylanish variantlari paydo bo'ladi. bir xil boshlang'ich o'zgaruvchilar, lekin turli xil echimlarni beradi (omil tuzilmalari biroz boshqacha tarzda aniqlanadi). Matematik jihatdan ekvivalent echimlarning cheksiz to'plamidagi mumkin bo'lgan alternativalar orasidagi yakuniy tanlov tadqiqotchilar tomonidan talqin natijalarini mazmunli tushunishiga bog'liq. Va turli xil echimlarni baholash uchun ob'ektiv mezon yo'qligi sababli, yechimni tanlash uchun taklif qilingan asoslar asossiz va ishonarsiz ko'rinishi mumkin.

Uchinchi muammo shundaki, faktorli tahlil ko'pincha noto'g'ri ishlab chiqilgan tadqiqotni saqlash uchun ishlatiladi, agar biron bir statistik protsedura istalgan natijani bermasligi aniq bo'lsa. Asosiy komponentlarning kuchi va omillar tahlili ularga tartibsiz ma'lumotlardan tartibli kontseptsiyani yaratishga imkon beradi (bu ularga shubhali obro' beradi).

Ikkinchi guruh atamalari yechimning bir qismi sifatida tuzilgan va talqin qilinadigan matritsalarga tegishli. Buriling omillar - ma'lum bir qator omillar uchun eng oson talqin qilinadigan yechimni topish jarayoni. Burilishlarning ikkita asosiy toifasi mavjud: ortogonal va qiyshiq... Birinchi holda, barcha omillar ortogonal (bir-biri bilan bog'liq bo'lmagan) bo'lishi uchun tanlangan va tuzilgan. omillarni yuklash matritsasi, bu kuzatilgan o'zgaruvchilar va omillar o'rtasidagi munosabatlar matritsasi. Yuklarning kattaligi har bir kuzatilgan o'zgaruvchi va har bir omil o'rtasidagi bog'liqlik darajasini aks ettiradi va kuzatilgan o'zgaruvchi va omil (yashirin o'zgaruvchi) o'rtasidagi korrelyatsiya koeffitsienti sifatida talqin qilinadi va shuning uchun -1 dan 1 gacha o'zgaradi. ortogonal aylanish faktorial matritsani tahlil qilish asosida talqin qilinadi.. omillarning qaysi biri ma'lum bir kuzatiladigan o'zgaruvchi bilan ko'proq bog'liqligini aniqlash orqali yuklaydi. Shunday qilib, har bir omil birlamchi o'zgaruvchilar guruhi tomonidan berilgan bo'lib, u uchun eng yuqori omil yukiga ega.

Agar qiyshiq aylanish amalga oshirilsa (ya'ni, omillar o'rtasidagi korrelyatsiya ehtimoli apriori ruxsat etilgan bo'lsa), unda bir nechta qo'shimcha matritsalar tuziladi. Faktor korrelyatsiya matritsasi omillar oʻrtasidagi korrelyatsiyani oʻz ichiga oladi. Faktor yuklamalari matritsasi, yuqorida aytib o'tilgan, ikkiga bo'linadi: munosabatlarning tarkibiy matritsasi omillar va o'zgaruvchilar o'rtasida va omillarni xaritalash matritsasi, bu har bir kuzatilgan o'zgaruvchi va har bir omil o'rtasidagi chiziqli munosabatni ifodalaydi (ba'zi omillarning superpozitsiyasining boshqalarga ta'sirini hisobga olmagan holda, omillarning bir-biri bilan bog'liqligi bilan ifodalanadi). Majburiy aylanishdan so'ng, omillarni talqin qilish birlamchi o'zgaruvchilarni (yuqorida tavsiflanganga o'xshash) guruhlashga asoslanadi, lekin birinchi navbatda, omillarni xaritalash matritsasidan foydalaniladi.

Nihoyat, ikkala aylanish uchun ham omil qiymati koeffitsienti matritsasi, har bir kuzatish uchun asosiy o'zgaruvchilarning qiymatlari asosida omil qiymatlarini (omil nuqtalari, omillar bo'yicha ko'rsatkichlar) hisoblash uchun regressiya tipidagi maxsus tenglamalarda qo'llaniladi.

Asosiy komponentlar va omillarni tahlil qilish usullarini taqqoslab, biz quyidagilarni ta'kidlaymiz. Asosiy komponent tahlilini o'tkazish jarayonida barcha o'zgaruvchilar uchun olingan eksperimental ma'lumotlarning umumiy farqini eng yaxshi tushuntirish (ko'paytirishni maksimal darajada oshirish) uchun model quriladi. Natijada, "komponentlar" ta'kidlangan. Faktorli tahlilda har bir o'zgaruvchi bir qator faraziy umumiy omillar (barcha o'zgaruvchilarga ta'sir qiluvchi) va xarakterli omillar (har bir o'zgaruvchi uchun har xil) bilan izohlanadi (aniqlanadi) deb faraz qilinadi. Hisoblash jarayonlari esa o‘lchov xatosidan kelib chiqadigan dispersiyadan ham, muayyan omillar bilan izohlangan dispersiyadan ham xalos bo‘ladigan va faqat faraziy mavjud umumiy omillar bilan izohlangan dispersiyalarni tahlil qiladigan tarzda amalga oshiriladi. Natijada omillar deb ataladigan ob'ektlar paydo bo'ladi. Biroq, yuqorida aytib o'tilganidek, mazmun-psixologik nuqtai nazardan, matematik modellardagi bu farq muhim ma'noga ega emas, shuning uchun kelajakda biz qaysi aniq holat haqida alohida tushuntirishlar berilmasa, biz "omil" atamasini tarkibiy qismlarga nisbatan va omillarga nisbatan qo'llang.

Namuna o'lchamlari va etishmayotgan ma'lumotlar. Namuna qanchalik katta bo'lsa, munosabatlar ko'rsatkichlarining ishonchliligi shunchalik yuqori bo'ladi. Shuning uchun etarlicha katta namunaga ega bo'lish juda muhimdir. Kerakli tanlanma hajmi, shuningdek, umumiy populyatsiyadagi ko'rsatkichlar o'rtasidagi bog'liqlik darajasiga va omillar soniga bog'liq: kuchli va ishonchli munosabatlar va oz sonli aniq belgilangan omillar bilan kichik tanlama etarli bo'ladi.

Shunday qilib, 50 ta mavzudan iborat tanlov juda yomon, 100 - yomon, 200 - o'rtacha, 300 - yaxshi, 500 - juda yaxshi va 1000 - a'lo deb baholanadi ( Komri, Li, 1992). Ushbu mulohazalardan kelib chiqqan holda, umumiy tamoyil sifatida kamida 300 ta mavzudan namunalarni o'rganish tavsiya etiladi. Yuqori omil yuklanishiga (> 0,80) ega bo'lgan etarli miqdordagi marker o'zgaruvchilarga asoslangan yechim uchun 150 ga yaqin mavzu ( Guadagnoli, Veliser, 1988). tomonidan har bir o'zgaruvchi uchun normallik alohida tekshiriladi nosimmetrikliklar(o'rganilayotgan taqsimotning egri chizig'i nazariy jihatdan normal egri chiziqqa nisbatan qanchalik o'ngga yoki chapga siljiganligi) va ortiqcha(mavjud taqsimotning "qo'ng'irog'i" ning yuqoriga yoki pastga egilgan cho'zilish darajasi, chastota diagrammasida vizual tarzda ifodalangan, zichlik grafigining "qo'ng'irog'i" bilan taqqoslaganda, normal taqsimotning xarakteristikasi). Agar o'zgaruvchida sezilarli assimetriya va kurtozis bo'lsa, uni yangi o'zgaruvchini (ko'rib chiqilayotganning yagona qiymatli funktsiyasi sifatida) kiritish orqali bu yangi o'zgaruvchi normal taqsimlanadigan tarzda o'zgartirilishi mumkin (batafsil ma'lumot uchun qarang: Tabachnik, Fidell, 1996, bob. 4).

Xususiy vektorlar va mos keluvchi xos qiymatlar
ko'rib chiqilayotgan misol uchun

Xususiy vektor 1

Xususiy vektor 2

Xususiy qiymat 1

Xususiy qiymat 2

Korrelyatsiya matritsasi diagonallashtirilganligi sababli, omil tahlili natijalarini olish uchun unga xos vektorlar va xos qiymatlarning matritsa algebrasi qo'llanilishi mumkin (1-ilovaga qarang). Agar matritsa diagonali bo'lsa, faktorial tuzilma haqidagi barcha muhim ma'lumotlar uning diagonal shaklida mavjud. Omil tahlilida xos qiymatlar omillar bilan izohlangan dispersiyaga mos keladi. Eng katta xususiy qiymatga ega bo'lgan omil eng katta dispersiyani tushuntiradi va shunga o'xshash, odatda tahlilda hisobga olinmaydigan kichik yoki manfiy o'ziga xos qiymatli omillarga kelgunga qadar. Faktor yuklamalari matritsasi - bu omillar va o'zgaruvchilar o'rtasidagi munosabatlar matritsasi (korrelyatsiya koeffitsientlari sifatida talqin etiladi). Birinchi ustun birinchi omil va o'z navbatida har bir o'zgaruvchi o'rtasidagi korrelyatsiya: vaucher narxi (-.400), kompleksning qulayligi (.251), havo harorati (.932), suv harorati(.956). Ikkinchi ustun ikkinchi omil va har bir o'zgaruvchi o'rtasidagi korrelyatsiya: vaucher narxi (.900), kompleksning qulayligi(-.947), havo harorati (.348), suv harorati(.286). Faktor unga kuchli bog'liq bo'lgan o'zgaruvchilar (ya'ni, yuqori yuklarga ega bo'lish) asosida talqin etiladi. Shunday qilib, birinchi omil asosan "iqlim" ( havo va suv harorati), ikkinchisi esa "iqtisodiy" ( turning narxi va majmuaning qulayligi).

Ushbu omillarni sharhlashda, birinchi omil uchun yuqori yuklarga ega bo'lgan o'zgaruvchilarga e'tibor berish kerak ( havo harorati va suv harorati), o'zaro ijobiy bog'liqdir, ikkinchi omil uchun yuqori yuklangan o'zgaruvchilar ( vaucher narxi va kompleksning qulayligi), bir-biriga salbiy bog'langan (arzon kurortdan katta qulaylikni kutish mumkin emas). Birinchi omil unipolyar deb ataladi (barcha o'zgaruvchilar bir qutbda guruhlangan), ikkinchisi esa bipolyar(o'zgaruvchilar ikki guruhga bo'lingan, ma'no qarama-qarshi - ikki qutb). Ortiqcha belgisi bilan faktorial yuklarga ega bo'lgan o'zgaruvchilar musbat qutbni, minus belgisi bo'lganlar esa manfiy qutb hosil qiladi. Bunda omilni izohlashda “ijobiy” va “salbiy” qutblarning nomlari “yomon” va “yaxshi” baholovchi ma’noga ega emas. Belgini tanlash hisob-kitoblar paytida tasodifiy sodir bo'ladi. Ortogonal aylanish

Yuqori korrelyatsiyalarni maksimal darajaga ko'tarish va past korrelyatsiyalarni kamaytirish uchun aylanish odatda faktoringdan keyin qo'llaniladi. Aylanishning ko'plab usullari mavjud, ammo eng ko'p ishlatiladigan aylanish varimax, bu dispersiyani maksimallashtirish protsedurasi. Ushbu aylanish omil yuklarining farqini maksimal darajada oshiradi, har bir omil uchun yuqori yuklarni yuqoriroq va pastroqlarni kamaytiradi. Bu maqsad bilan erishiladi transformatsion matritsalar Λ:

Transformatsiya matritsasi aylanish uchun r burchakning sinuslari va kosinuslari matritsasi. (Shuning uchun transformatsiya nomi - burilish, chunki geometrik nuqtai nazardan, o'qlar omil fazosining kelib chiqishi atrofida aylanadi.) Aylanishni amalga oshirgandan so'ng va aylanishdan keyin omil yuklarining matritsasi olingandan so'ng, boshqa bir qator ko'rsatkichlarni tahlil qilish mumkin (4-jadvalga qarang). O'zgaruvchining umumiyligi omil yuklamalari yordamida hisoblangan dispersiyadir. Bu faktorial model tomonidan bashorat qilingan o'zgaruvchining kvadratik ko'p korrelyatsiyasi. Umumiylik barcha omillar uchun o'zgaruvchining faktoriy yuklamalari (SKN) kvadratlari yig'indisi sifatida hisoblanadi. Jadval uchun 4 umumiylik turning narxi(-.086) 2 + (. 981) 2 = .970 ga teng, yaʼni dispersiyaning 97% turning narxi 1 va 2 omillar bilan izohlanadi.

Barcha o'zgaruvchilar uchun omil dispersiyasining ulushi o'zgaruvchilar soniga bo'lingan omil uchun SKN (ortogonal aylanish holatida) 7 ... Birinchi omil uchun dispersiya ulushi quyidagilarga teng:

[(-.086)2+(-.071)2+(.994)2+(.997)2]/4 = 1.994/4 = .50,

ya'ni birinchi omil o'zgaruvchilar dispersiyasining 50% ni tushuntiradi. Ikkinchi omil o'zgaruvchilar dispersiyasining 48% ni va (aylanishning ortogonalligi tufayli) ikkala omil birgalikda o'zgaruvchilar dispersiyasining 98% ni tushuntiradi.

Faktor yuklamalari, jamoalar, SKN,
aylanishdan keyin ortogonal omillarning dispersiyasi va kovariatsiyasi

Jamiyatlar ( h2)

Voucher narxi

∑a2=.970

Konfor darajasi

∑a2=.960

Havo harorati

∑a2=.989

Suv harorati

∑a2=.996

∑a2=1.994

∑a2=1.919

Dispersiya foizi

Kovariantning ulushi

Faktor bilan izohlangan eritma dispersiyasining ulushi kasr hisoblanadi kovariatsiya umumiyliklar yig‘indisiga (o‘zgaruvchilar ustidan SKN yig‘indisi) bo‘lingan omil uchun SKN hisoblanadi. Birinchi omil eritma dispersiyasining 51% ni tushuntiradi (1,994 / 3,915); ikkinchisi - 49% (1,919 / 3,915); ikkala omil birgalikda barcha kovariatsiyani tushuntiradi.

Eigenval - omillarning mos keladigan sonining dispersiya qiymatini aks ettiradi. Mashq sifatida biz o'zgaruvchilar uchun hisoblangan qiymatlarni olish uchun ushbu formulalarning barchasini yozishni tavsiya qilamiz. Masalan, birinchi javob beruvchi uchun:

1.23 = -.086(1.12) + .981(-1.16)

1.05 = -.072(1.12) - .978(-1.16)

1.08 = .994(1.12) + .027(-1.16)

1.16 = .997(1.12) - .040(-1.16)

Yoki algebraik shaklda:

Z turning narxi = a 11F 1 + a 12F 2

Kompleksning Z qulayligi = a 2l F 1 + a 22F 2

Z havo harorati = a 31F 1 + a 32F 2

Z suv harorati = a 41F 1 + a 42F 2

Yuk qancha ko'p bo'lsa, o'zgaruvchi omilni aniqlaydi, deb taxmin qilishimiz mumkin. Komri va Li ( Komri, Li, 1992) 0,71 dan katta yuklar (diferansning 50% ni tushuntiradi) a'lo, 0% dispersiya) juda yaxshi, 0% yaxshi, 0% qoniqarli va 0,32 (10% ni tushuntiradi) dispersiya) zaifdir.

Aytaylik, siz (bir oz "ahmoq") tadqiqot bilan shug'ullanyapsiz, unda siz yuz kishining balandligini dyuym va santimetrda o'lchaysiz. Shunday qilib, sizda ikkita o'zgaruvchi mavjud. Agar siz, masalan, turli xil ozuqaviy qo'shimchalarning o'sishga ta'sirini ko'proq o'rganmoqchi bo'lsangiz, foydalanishni davom ettirasizmi? ikkalasi ham o'zgaruvchilar? Ehtimol, yo'q, chunki bo'y qaysi birlik bilan o'lchangan bo'lishidan qat'i nazar, insonga xos xususiyatdir.

O'zgaruvchilar orasidagi bog'liqlik yordamida aniqlash mumkin tarqalish chizmalari... Fitting orqali olingan regressiya chizig'i munosabatlarning grafik tasvirini beradi. Agar siz ushbu diagrammada ko'rsatilgan regressiya chizig'i asosida yangi o'zgaruvchini aniqlasangiz, unda bunday o'zgaruvchi ikkala o'zgaruvchining eng muhim xususiyatlarini o'z ichiga oladi. Shunday qilib, aslida siz o'zgaruvchilar sonini kamaytirdingiz va ikkitasini bitta bilan almashtirdingiz. E'tibor bering, yangi omil (o'zgaruvchi) aslida ikkita asl o'zgaruvchining chiziqli birikmasidir.

Omilli tahlil matematik statistikaning bir bo'limidir. Uning maqsadi, matematik statistikaning boshqa tarmoqlarining maqsadi kabi, fizik shaklidan qat'i nazar, eksperimental yoki kuzatilgan ma'lumotlar massivlarini tahlil qilish va izohlash imkonini beruvchi modellar, tushunchalar va usullarni ishlab chiqishdir.

Eksperimental ma'lumotlarni taqdim etishning eng tipik shakllaridan biri bu matritsa bo'lib, uning ustunlari turli xil parametrlar, xususiyatlar, testlar va boshqalarga, qatorlar esa alohida parametr qiymatlari to'plami bilan tavsiflangan alohida ob'ektlar, hodisalar, rejimlarga mos keladi. . Amalda, matritsaning o'lchami juda katta bo'lib chiqadi: masalan, ushbu matritsaning qatorlari soni bir necha o'ndan bir necha yuz minggacha (masalan, sotsiologik so'rovlarda) va ustunlar soni - dan bir yoki ikkitadan bir necha yuzgacha. Bunday o'lchamdagi matritsalarni to'g'ridan-to'g'ri, "vizual" tahlil qilishning iloji yo'q, shuning uchun matematik statistikada matritsadagi dastlabki ma'lumotni kuzatilishi mumkin bo'lgan o'lchamga "siqish" va eng "muhim"larini olish uchun mo'ljallangan ko'plab yondashuvlar va usullar paydo bo'ldi. dastlabki ma'lumotlardan "ikkilamchi", "tasodifiy" ni tashlab.

Matritsa shaklida taqdim etilgan ma'lumotlarni tahlil qilishda ikki turdagi muammolar paydo bo'ladi. Birinchi turdagi vazifalar ob'ektlarning taqsimlanishining "qisqa tavsifi" ni olishga qaratilgan bo'lsa, ikkinchi turdagi vazifalar parametrlar orasidagi bog'liqlikni ochishga qaratilgan.

Shuni yodda tutish kerakki, ushbu muammolarning paydo bo'lishi uchun asosiy rag'bat nafaqat raqamlarning katta qatorini qisqa vaqt ichida kodlash istagida, balki uslubiy xarakterdagi ancha fundamental sharoitda ham yotadi: darhol. katta miqdordagi raqamlarni qisqacha tavsiflash mumkin edi, keyin ma'lum bir ob'ektiv qonuniyat aniqlanganiga ishonish mumkin, bu esa qisqacha tavsiflash imkoniyatini keltirib chiqardi; va ob'ektiv naqshlarni izlash, qoida tariqasida, ma'lumotlar yig'iladigan asosiy maqsaddir.

Ma'lumotlar matritsasini qayta ishlashning qayd etilgan yondashuvlari va usullari ma'lumotlarni qayta ishlash muammosining qaysi turini echishga mo'ljallanganligi va qaysi o'lchamdagi matritsalarga qo'llanilishi bilan farqlanadi.

Ushbu parametrlarning o'rtacha soniga ega bo'lgan parametrlar o'rtasidagi munosabatlarning qisqacha tavsifi muammosiga kelsak, unda bu holda tegishli korrelyatsiya matritsasi bir necha o'nlab yoki yuzlab raqamlarni o'z ichiga oladi va o'z-o'zidan u hali mavjud bo'lganlarning "qisqa tavsifi" bo'lib xizmat qila olmaydi. parametrlar o'rtasidagi munosabatlar, lekin keyinchalik qayta ishlash uchun bu bilan kerak.

Faktorli tahlil - bu korrelyatsiya matritsasidagi ma'lumotlarni "siqish" uchun mo'ljallangan modellar va usullar to'plamidir. Faktorli tahlilning turli modellari quyidagi gipotezaga asoslanadi: kuzatilayotgan yoki oʻlchangan parametrlar oʻrganilayotgan obʼyekt yoki hodisaning faqat bilvosita xarakteristikasi boʻlib, aslida ichki (yashirin, bevosita kuzatilmagan) parametrlar yoki xususiyatlar mavjud boʻlib, ularning soni. kichik va kuzatilgan parametrlarning qiymatlarini aniqlaydigan. Ushbu ichki parametrlar odatda omillar deb ataladi. Omil tahlilining vazifasi kuzatilgan parametrlarni omillarning chiziqli birikmalari va, ehtimol, ba'zi qo'shimcha, "ahamiyatsiz" qiymatlar - "shovqin" shaklida taqdim etishdir. Shunisi e'tiborga loyiqki, omillarning o'zi ma'lum bo'lmasa-da, bunday parchalanishni olish mumkin va bundan tashqari, bunday omillarni aniqlash mumkin, ya'ni. har bir ob'ekt uchun har bir omilning qiymatlari ko'rsatilishi mumkin.

Faktor tahlili, qanday usullardan foydalanilishidan qat'i nazar, korrelyatsiya matritsasi deb ataladigan testlar to'plami bo'yicha olingan o'zaro bog'liqlik jadvalini qayta ishlash bilan boshlanadi va omil matritsasini olish bilan yakunlanadi, ya'ni. har bir test uchun har bir omilning og'irligi yoki yukini ko'rsatadigan jadval. 1-jadval faqat ikkita omilga ega bo'lgan gipotetik omil matritsasidir.

Omillar jadvalning yuqori qatorida eng muhimidan eng ahamiyatlisiga qadar sanab o'tilgan va 10 ta testning har biridagi og'irliklari tegishli ustunlarda berilgan.

1-jadval

Gipotetik faktorial matritsa

Koordinata o'qlari. Omillarni geometrik tarzda koordinata o'qlari shaklida ifodalash odatiy holdir, ularga nisbatan har bir test nuqta sifatida tasvirlanishi mumkin. Guruch. 1 ushbu protsedurani tushuntiradi. Ushbu grafikda 1-jadvalda ko'rsatilgan 10 ta testning har biri I va II o'qlarga mos keladigan ikkita omilga nisbatan nuqta sifatida ko'rsatilgan. Shunday qilib, test 1 I o'qi bo'ylab koordinatalari 0,74 va II o'qi bo'ylab 0,54 bo'lgan nuqta bilan ifodalanadi. Qolgan 9 ta testni ifodalovchi nuqtalar xuddi shunday tarzda, jadvaldagi og'irlik qiymatlaridan foydalangan holda tuzilgan. 1.

Shuni ta'kidlash kerakki, koordinata o'qlarining pozitsiyasi ma'lumotlar bilan aniqlanmagan. Korrelyatsiyalarning asl jadvali faqat testlarning o'rnini aniqlaydi (ya'ni, 1-rasmdagi nuqtalar) bir-biriga nisbatan. Xuddi shu nuqtalarni koordinata o'qlarining istalgan pozitsiyasi bilan tekislikda chizish mumkin. Shu sababli, omil tahlilini amalga oshirayotganda, eng mos va oson talqin qilinadigan displey olinmaguncha eksalarni aylantirish odatiy holdir.

Guruch. 1. 10 ta testning har biri uchun ikkita guruh omilining og'irligini ko'rsatadigan gipotetik omil xaritasi.

Shaklda. 1, aylanishdan keyin olingan I "va II" o'qlari kesilgan chiziqlar bilan ko'rsatilgan. Ushbu aylanish Thurstone tomonidan taklif qilingan mezonlarga muvofiq amalga oshiriladi ijobiy xilma-xillik va oddiy tuzilish. Birinchisi, o'qlarni barcha muhim salbiy og'irliklar yo'q qilinadigan joyga aylantirishni o'z ichiga oladi. Aksariyat psixologlar salbiy omillar yuklanishini qobiliyat testlariga mantiqiy jihatdan mos kelmaydigan deb hisoblashadi, chunki bunday yuklama shaxsning ma'lum bir omil bo'yicha balli qanchalik yuqori bo'lsa, tegishli testda uning balli past bo'lishini anglatadi. Oddiy dizayn mezoni aslida har bir test imkon qadar kamroq omillarga yuklanishi kerakligini anglatadi.

Ikkala mezonning bajarilishi eng oson va aniq talqin qilinishi mumkin bo'lgan omillarni ta'minlaydi. Agar test bitta omil bo'yicha yuqori yukga ega bo'lsa va boshqa omillar bo'yicha sezilarli yuklamalarga ega bo'lsa, biz ushbu testning mazmunini o'rganish orqali ushbu omilning tabiati haqida biror narsa bilib olishimiz mumkin. Aksincha, agar test olti omil bo'yicha o'rta yoki past yuklarga ega bo'lsa, u bizga ulardan birortasining tabiati haqida ozgina ma'lumot beradi.

Shaklda. 1-rasmdan ko'rinib turibdiki, koordinata o'qlari aylantirilgandan so'ng, barcha og'zaki testlar (1-5) I o'qi bo'ylab yoki juda yaqin joylashgan " va raqamli testlar (6-10) II- atrofida chambarchas guruhlangan. eksa". Aylanadigan o'qlarga nisbatan o'lchangan yangi faktoriy yuklar jadvalda ko'rsatilgan. 2. Jadvaldagi omil yuklari. 2 ning salbiy qiymatlari yo'q, tanlab olish xatolariga aniq bog'liq bo'lgan ahamiyatsiz qiymatlar bundan mustasno. Barcha og'zaki testlar I omil bo'yicha yuqori yuklarga ega "va amalda nolga - omil II bo'yicha". Raqamli testlar esa II omil uchun yuqori yuklaydi va I omil uchun ahamiyatsiz. Shunday qilib, koordinata o'qlarining aylanishi ikkala omilni aniqlash va nomlashni, shuningdek, har bir testning omil tarkibini tavsiflashni sezilarli darajada soddalashtirdi. Amalda, omillar soni ko'pincha ikkitadan ko'p bo'lib chiqadi, bu, albatta, ularning geometrik tasvirini va statistik tahlilini murakkablashtiradi, lekin ko'rib chiqilayotgan protseduraning mohiyatini o'zgartirmaydi.

jadval 2

Aylanishdan keyingi omil matritsasi

Ba'zi tadqiqotchilar o'qlarning aylanish printsipi sifatida nazariy modelni boshqaradilar. Bundan tashqari, mustaqil ravishda amalga oshirilgan, ammo taqqoslanadigan tadqiqotlarda bir xil omillarning qat'iyligini yoki tasdiqlanishini hisobga oladi.

Faktorlarni talqin qilish. Aylanish protsedurasidan so'ng faktoriy yechimni (yoki oddiyroq, faktorial matritsani) olganimizdan so'ng, biz omillarni talqin qilish va nomlashga o'tishimiz mumkin. Ishning ushbu bosqichi statistik tayyorgarlikdan ko'ra psixologik sezgi talab qiladi. Muayyan omilning mohiyatini tushunish uchun biz ushbu omil uchun yuqori yuklarga ega bo'lgan testlarni o'rganishdan boshqa ilojimiz yo'q va ular uchun umumiy psixologik jarayonlarni topishga harakat qilamiz. Ushbu omil bo'yicha yuqori yuklangan sinovlar qanchalik ko'p bo'lsa, uning tabiatini ochish osonroq bo'ladi. Jadvaldan. 2, masalan, I omil "og'zaki, II omil" esa raqamli ekanligi darhol aniq bo'ladi. Jadvalda keltirilgan. 2 omilli yuklamalar, shuningdek, har bir testning omil bilan bog'liqligini aks ettiradi.

Asosiy qoidalar

Omilli tahlil ko'p o'lchovli statistik tahlilning yangi yo'nalishlaridan biridir. Ushbu usul dastlab kirish parametrlari o'rtasidagi bog'liqlikni tushuntirish uchun ishlab chiqilgan. Korrelyatsiya tahlilining natijasi korrelyatsiya koeffitsientlari matritsasi hisoblanadi. Kam sonli xususiyatlar (o'zgaruvchilar) bilan ushbu matritsaning vizual tahlilini amalga oshirish mumkin. Belgilar sonining ko'payishi (10 yoki undan ko'p) bilan vizual tahlil ijobiy natija bermaydi. Ma’lum bo‘lishicha, korrelyatsiyalarning butun xilma-xilligini o‘rganilayotgan parametrlarning funksiyalari bo‘lgan bir qancha umumlashtirilgan omillarning ta’siri bilan izohlash mumkin, omillarning o‘zi esa noma’lum bo‘lishi mumkin, lekin ular o‘rganilayotgan xususiyatlar orqali ifodalanishi mumkin. Faktor tahlilining asoschisi amerikalik olim L.Tyurstondir.

Zamonaviy statistik olimlar omil tahlilini xususiyatlar o'rtasidagi haqiqatda mavjud bo'lgan bog'liqlik asosida tashkiliy tuzilmaning yashirin (yashirin) umumlashtiruvchi xususiyatlarini va o'rganilayotgan hodisa va jarayonlarning rivojlanish mexanizmlarini aniqlash imkonini beradigan usullar to'plami sifatida tushunadilar.

Misol: deylik, n ta avtomobil 2 ta mezon bo‘yicha baholandi:

x 1 - avtomobilning narxi,

x 2 - dvigatelning ishlash muddati.

Agar x 1 va x 2 o'zaro bog'liq bo'lsa, koordinatalar tizimida yangi o'qlar tomonidan rasmiy ravishda ko'rsatilgan yo'naltirilgan va ancha zich nuqtalar klasteri paydo bo'ladi (5-rasm).

6-rasm

Aniq xususiyat F 1 va F 2 - ular zich nuqtalar to'plamidan o'tadi va o'z navbatida ular bilan korrelyatsiya qiladi x 1 x 2.Maksimum

yangi o'qlar soni elementar xususiyatlar soniga teng bo'ladi. Faktorli tahlilning keyingi rivojlanishi ushbu usulni ob'ektlarni guruhlash va tasniflash muammolarida muvaffaqiyatli qo'llash mumkinligini ko'rsatdi.

Faktorli tahlilda ma'lumotlarni taqdim etish.

Faktorli tahlilni amalga oshirish uchun ma'lumot m x n matritsa shaklida taqdim etilishi kerak:

Matritsaning satrlari kuzatish ob'ektlariga (i =), ustunlar esa xususiyatlarga (j =) mos keladi.

Ob'ektni tavsiflovchi atributlar turli o'lchamlarga ega. Ularni bir xil o'lchamga keltirish va xususiyatlarning solishtirilishini ta'minlash uchun dastlabki ma'lumotlarning matritsasi odatda bitta shkalani kiritish orqali normallashtiriladi. Oddiylashtirishning eng keng tarqalgan usuli standartlashtirishdir. O'zgaruvchilardan o'zgaruvchilarga

O'rtacha qiymati j belgisi,

Standart og'ish.

Ushbu transformatsiya standartlashtirish deb ataladi.

Asosiy omilli tahlil modeli

Faktor tahlilining asosiy modeli quyidagicha:

z j - j-chi belgi (tasodifiy qiymat);

F 1 , F 2 , ..., F p- umumiy omillar (tasodifiy qiymatlar, normal taqsimlangan);

u j- xarakterli omil;

j1 , j2 , …, jp har bir omil ta'sirining ahamiyatini tavsiflovchi yuk omillari (model parametrlari aniqlanadi);

Umumiy omillar barcha atributlarni tahlil qilish uchun zarurdir. Xarakterli omillar shuni ko'rsatadiki, u faqat berilgan atributga tegishli, bu atributning o'ziga xosligi bo'lib, uni omillar orqali ifodalab bo'lmaydi. Faktor yuklari j1 , j2 , …, jp ma'lum bir xususiyatning o'zgarishida u yoki bu umumiy omilning ta'siri hajmini tavsiflash. Faktor tahlilining asosiy vazifasi omillar yuklamalarini aniqlashdan iborat. Farqlanish S j Har bir xususiyatning 2 tasini 2 ta komponentga bo'lish mumkin:

    birinchi qism umumiy omillarning ta'sirini belgilaydi - h j 2 ning umumiyligi;

    ikkinchi qism xarakterli omil - belgi - d j 2 ta'sirini belgilaydi.

Barcha o'zgaruvchilar standartlashtirilgan shaklda taqdim etiladi, shuning uchun dispersiya - davlat belgisi S j 2 = 1.

Agar umumiy va xarakterli omillar o'zaro bog'liq bo'lmasa, j-chi xususiyatning dispersiyasi quyidagicha ifodalanishi mumkin:

xossa dispersiyasining ulushi qayerda k th omil.

Har qanday omilning umumiy dispersiyaga to'liq hissasi:

Barcha umumiy omillarning umumiy dispersiyaga qo'shgan hissasi:

Faktorli tahlil natijalarini jadval shaklida taqdim etish qulay.

Faktor yuklari

Jamiyatlar

a 11 a 21 … A p1

a 12 a 22 a p2

… … … …

a 1m a 2m a pm

omillar

V 1 V 2 ... V p

A- omil yuklamalari matritsasi. Uni turli yo'llar bilan olish mumkin, hozirgi vaqtda asosiy komponentlar yoki asosiy omillar usuli eng keng tarqalgan.

Asosiy omillar usulini hisoblash tartibi.

Muammoni asosiy komponentlar yordamida hal qilish dastlabki ma'lumotlar matritsasini bosqichma-bosqich o'zgartirishga qisqartiriladi. X :

NS- dastlabki ma'lumotlar matritsasi;

Z- standartlashtirilgan xususiyat qiymatlari matritsasi,

R- juft korrelyatsiyalar matritsasi:

Xususiy (xarakterli) sonlarning diagonal matritsasi,

j xarakteristik tenglamani yechish orqali topiladi

E- birlik matritsasi,

 j - har bir asosiy komponentning dispersiya indeksi,

dastlabki ma'lumotlarni standartlashtirish sharti bilan, keyin = m

U- tenglamadan topilgan xos vektorlar matritsasi:

Bu haqiqatan ham qarorni anglatadi m har biri uchun chiziqli tenglamalar tizimi

Bular. har bir xos qiymat tenglamalar tizimiga mos keladi.

Keyin toping V- normallashtirilgan xos vektorlar matritsasi.

A faktorli xaritalash matritsasi quyidagi formula bo'yicha hisoblanadi:

Keyin ekvivalent formulalardan biri yordamida asosiy komponentlarning qiymatlarini topamiz:

To'rtta sanoat korxonalarining yig'indisi uchta xarakterli xususiyatga ko'ra baholanadi:

    bir xodimga to'g'ri keladigan o'rtacha yillik ishlab chiqarish x 1;

    rentabellik darajasi x 2;

Aktivlarning rentabellik darajasi x 3.

Natija standartlashtirilgan matritsada taqdim etiladi Z:

Matritsa bo'yicha Z juft korrelyatsiyalar matritsasi olinadi R:

    Juftlik korrelyatsiya matritsasining determinantini topamiz (masalan, Faddeev usuli yordamida):

    Xarakteristik tenglamani tuzamiz:

    Ushbu tenglamani yechish orqali biz quyidagilarni topamiz:

Shunday qilib, asl elementar xususiyatlar x 1, x 2, x 3 uchta asosiy komponentning qiymatlari bilan umumlashtirilishi mumkin va:

F 1 butun o'zgarishlarni tushuntiradi,

F 2 -, va F 3 -

Barcha uchta asosiy komponent o'zgaruvchanlikning 100% ni tashkil qiladi.

Ushbu tizimni hal qilib, biz quyidagilarni topamiz:

 2 va  3 uchun tizimlar xuddi shunday tarzda qurilgan.  2 tizim yechimi uchun:

Xususiy vektor matritsasi U shaklni oladi:

    Matritsaning har bir elementini j-chi elementlarning kvadratlari yig'indisiga ajratamiz

ustun, biz normallashtirilgan matritsani olamiz V.

E'tibor bering, tenglik = E.

    Faktorlarni xaritalash matritsasi matritsa munosabatidan olinadi

=

Matritsaning har bir elementi ma'nosida A asl xususiyat orasidagi korrelyatsiya matritsasining qisman koeffitsientlarini ifodalaydi x j va asosiy komponentlar F r. Shunday qilib, barcha elementlar.

Tenglik shartni bildiradi r- komponentlar soni.

Xususiyatlarning umumiy farqiga har bir omilning umumiy hissasi:

Faktor tahlili modeli quyidagi shaklda bo'ladi:

Asosiy komponentlarning qiymatlarini toping (matritsa F) formula bo'yicha

Asosiy komponentlar qiymatlarini taqsimlash markazi (0,0,0) nuqtada joylashgan.

Bundan tashqari, hisob-kitoblar natijalariga asoslangan analitik xulosalar muhim xususiyatlar soni va asosiy tarkibiy qismlarning nomlarini aniqlashning asosiy tarkibiy qismlari bo'yicha qaror qabul qilingandan so'ng amalga oshiriladi. Asosiy tarkibiy qismlarni tanib olish, ularning nomlarini aniqlash muammolari xaritalash matritsasidan og'irlik koeffitsientlari asosida sub'ektiv ravishda hal qilinadi. A.

Asosiy komponentlar nomlarining so'zlashuvi haqidagi savolni ko'rib chiqing.

belgilaymiz w 1 - nolga yaqin elementlarni o'z ichiga olgan ahamiyatsiz og'irlik koeffitsientlari to'plami ,,

w 2 - muhim og'irliklar to'plami,

w 3 - asosiy komponent nomini shakllantirishda ishtirok etmaydigan muhim og'irliklarning kichik to'plami.

w 2 - w 3 - ismning shakllanishida ishtirok etadigan og'irlik omillarining kichik to'plami.

Har bir asosiy omil uchun ma'lumot tarkibining koeffitsientini hisoblaymiz

Agar ma'lumotlilik koeffitsientlarining qiymatlari 0,75-0,95 oralig'ida bo'lsa, tushuntirish mumkin bo'lgan xususiyatlar to'plami qoniqarli hisoblanadi.

a 11 =0,776 a 12 =-0,130 a 13 =0,308

a 12 =0,904 a 22 =-0,210 a 23 =-0,420

a 31 =0,616 a 32 =0,902 a 33 =0,236

j = 1 uchun w 1 = ,w 2 ={a 11 ,a 21 ,a 31 },

.

j = 2 uchun w 1 ={a 12 ,a 22 }, w 2 ={ a 32 },

j = 3 uchun w 1 ={a 33 }, w 2 ={a 13 ,a 33 },

Xususiyat qiymatlari x 1 , x 2 , x 3, asosiy komponentning tarkibi 100% aniqlanadi. bu holda, xususiyatning eng katta hissasi x 2, uning ma'nosi rentabellikdir. xususiyat nomi uchun to'g'ri F 1 bo'ladi ishlab chiqarish samaradorligi.

F 2 komponent bilan belgilanadi x 3 (aktivlar rentabelligi), keling, uni chaqiraylik asosiy fondlardan samarali foydalanish.

F 3 komponentlar bilan belgilanadi x 1 ,x 2 - tahlilda hisobga olinmasligi mumkin, chunki u umumiy o'zgarishlarning atigi 10 foizini tushuntiradi.

Adabiyot.

    A.A. Popov

Excel: Amaliy qo'llanma, DESS COM.-M.-2000.

    Dyakonov V.P., Abramenkova I.V. Matematika, fizika va Internetda Mathcad7. "Nomidj" nashriyoti, M.-1998, 2.13-bo'lim. Regressiyani amalga oshirish.

    L.A. Soshnikova, V.N. Tomashevich va boshqalar Iqtisodiyotda ko'p o'lchovli statistik tahlil, ed. V.N. Tomashevich. - M. - Nauka, 1980 yil.

    V.A.Kolemaev, O.V. Staroverov, V.B. Turundaevskiy Ehtimollar nazariyasi va matematik statistika. – M. - Oliy maktab - 1991 yil.

    Iberla uchun. Faktor tahlili - M. Statistika.-1980 yil.

Dispersiyalari ma'lum bo'lgan oddiy umumiy populyatsiyalarning ikkita vositasini taqqoslash

X va Y umumiy populyatsiyalari normal taqsimlangan bo'lsin va ularning dispersiyalari ma'lum (masalan, oldingi tajribadan yoki nazariy jihatdan topilgan). Ushbu populyatsiyalardan olingan n va m hajmli mustaqil namunalar uchun tanlama o'rtacha x in va y in topildi.

Ko'rib chiqilayotgan populyatsiyalarning umumiy o'rtachalari (matematik kutilmalar) bir-biriga teng ekanligini, ya'ni H 0: M (X) ma'lum bir ahamiyatlilik darajasidagi tanlanma vositalariga asoslangan nol gipotezani sinab ko'rish talab etiladi. = M (Y).

Tanlangan oʻrtachalar umumiy oʻrtacha qiymatlarning xolis bahosi, yaʼni M (x in) = M (X) va M (y in) = M (Y) ekanligini hisobga olsak, nol gipotezani quyidagicha yozish mumkin: H 0: M ( x in ) = M (y in).

Shunday qilib, namunaviy vositalarning matematik taxminlari bir-biriga teng ekanligini tekshirish talab etiladi. Bu vazifa qo'yiladi, chunki, qoida tariqasida, namunaviy vositalar boshqacha. Savol tug'iladi: namunaviy vositalar sezilarli darajada farq qiladimi yoki ahamiyatsizmi?

Agar nol gipoteza to'g'ri ekanligi, ya'ni umumiy o'rtachalar bir xil ekanligi ma'lum bo'lsa, unda tanlanma o'rtachalar farqi ahamiyatsiz bo'lib, tasodifiy sabablar va xususan, namunaviy ob'ektlarni tasodifiy tanlash bilan izohlanishi mumkin.

Agar nol gipoteza rad etilsa, ya'ni umumiy o'rtachalar bir xil bo'lmasa, unda tanlanma o'rtachalardagi farq sezilarli bo'lib, tasodifiy sabablar bilan izohlab bo'lmaydi. Va bu umumiy o'rtacha (matematik taxminlar) o'zlari boshqacha ekanligi bilan izohlanadi.

Nol gipoteza sinovi sifatida biz tasodifiy o'zgaruvchini olamiz.

Z mezoni - normallashtirilgan normal tasodifiy miqdor. Haqiqatan ham, Z miqdori normal taqsimlangan, chunki u normal taqsimlangan X va Y miqdorlarning chiziqli birikmasidir; bu qiymatlarning o'zlari odatda umumiy populyatsiyalardan olingan namunalardan topilgan o'rtacha namunaviy ko'rsatkichlar sifatida taqsimlanadi; Z - normalangan qiymat, chunki M (Z) = 0, agar nol gipoteza to'g'ri bo'lsa, D (Z) = 1, chunki namunalar mustaqildir.

Kritik maydon raqobatdosh gipoteza turiga qarab tuziladi.

Birinchi holat... Nol gipoteza H 0: M (X) = M (Y). Raqobatchi gipoteza H 1: M (X) ¹M (Y).

Bunday holda, nol gipoteza to'g'riligini hisobga olgan holda, mezonning ushbu sohaga tushishi ehtimolligi qabul qilingan muhimlik darajasiga teng bo'lishi talabi asosida ikki tomonlama tanqidiy maydon quriladi.

Mezonning eng katta kuchi (mezonning raqobatdosh gipotezaning haqiqiyligi bilan kritik mintaqaga tushish ehtimoli) "chap" va "o'ng" kritik nuqtalar tanlanganda erishiladi, shunda mezonning ehtimoli har biriga tushadi. kritik mintaqa oralig'i quyidagilarga teng:

P (Z< zлев.кр)=a¤2,

P (Z> z o'ng cr) = a¤2. (1)

Z normalangan normal miqdor bo'lgani uchun va bunday miqdorning taqsimlanishi nolga yaqin simmetrik bo'lganligi sababli, tanqidiy nuqtalar nolga yaqin simmetrikdir.

Shunday qilib, agar ikki tomonlama kritik mintaqaning o'ng chegarasini zcr orqali belgilasak, chap chegara -zcr bo'ladi.

Demak, Z juda ikki tomonlama kritik mintaqani topish uchun to'g'ri chegarani topish kifoya< -zкр, Z >zcr va nol gipotezani qabul qilish sohasi (-zcr, zcr).

Laplas funksiyasi F (Z) yordamida zcr - ikki tomonlama kritik mintaqaning o'ng chegarasini qanday topishni ko'rsatamiz. Ma'lumki, Laplas funksiyasi (0; z) oraliqda normallashtirilgan normal tasodifiy o'zgaruvchiga, masalan Z ga tegish ehtimolini aniqlaydi:

P (0< Z

Z ning taqsimoti nolga yaqin simmetrik bo'lgani uchun Z ni (0; ¥) oraliqda olish ehtimoli 1/2 ga teng. Demak, bu intervalni zcr nuqtasi bilan (0, zcr) va (zcr, ¥) oraliqlarga ajratsak, P (0) qo’shish teoremasi bo’yicha.< Z < zкр)+Р(Z >zcr) = 1/2.

(1) va (2) tufayli biz F (zcr) + a / 2 = 1/2 ni olamiz. Demak, F (zkr) = (1-a) / 2.

Demak, xulosa qilamiz: ikki tomonlama kritik mintaqaning (zcr) o'ng chegarasini topish uchun (1-) ga teng funktsiya qiymatiga mos keladigan Laplas funksiyasi argumentining qiymatini topish kifoya. a) / 2.

Keyin ikki tomonlama kritik mintaqa Z tengsizliklari bilan aniqlanadi< – zкр, Z >zcr yoki ekvivalent tengsizlik ½Z1> zcr va nol gipotezani tengsizlik bilan qabul qilish sohasi - zcr< Z < zкр или равносильным неравенством çZ ç< zкр.

Kuzatish ma’lumotlaridan hisoblangan mezon qiymatini zobl orqali belgilaymiz va nol gipotezani tekshirish qoidasini tuzamiz.

Qoida.

1. Mezonning kuzatilgan qiymatini hisoblang

2. Laplas funksiyasi jadvalidan F (zkr) = (1-a) / 2 tenglik bo‘yicha kritik nuqtani toping.

3. Agar ç zobl ç< zкр – нет оснований отвергнуть нулевую гипотезу.

Agar ç zobl ç> zcr - nol gipoteza rad etiladi.

Ikkinchi holat... Nol gipoteza N0: M (X) = M (Y). Raqobatchi gipoteza H1: M (X)> M (Y).

Amalda, agar professional mulohazalar bir populyatsiyaning umumiy o'rtacha ko'rsatkichi ikkinchisining umumiy o'rtacha ko'rsatkichidan yuqori ekanligini ko'rsatsa, bu shunday bo'ladi. Masalan, agar jarayonni takomillashtirish joriy etilsa, u ishlab chiqarish hajmining oshishiga olib keladi, deb taxmin qilish tabiiy.

Bunday holda, nol gipotezaning to'g'riligini nazarda tutgan holda, mezonning ushbu sohaga tushish ehtimoli qabul qilingan ahamiyat darajasiga teng bo'lishi talabi asosida o'ng tomonlama tanqidiy maydon quriladi:

P (Z> zcr) = a. (3)

Laplas funksiyasi yordamida kritik nuqtani qanday topish mumkinligini ko'rsatamiz. Biz munosabatdan foydalanamiz

P (0 zcr) = 1/2.

(2) va (3) tufayli biz F (zcr) + a = 1/2 ga egamiz. Demak, F (zkr) = (1-2a) / 2.

Demak, o'ng tomonli kritik mintaqaning (zcr) chegarasini topish uchun (1-2a) / 2 ga teng bo'lgan Laplas funksiyasining qiymatini topish kifoya qiladi, degan xulosaga keldik. U holda o'ng tomonli kritik mintaqa Z> zcr tengsizlik bilan, nol gipotezani qabul qilish hududi esa Z tengsizlik bilan aniqlanadi.< zкр.

Qoida.

1. Zobl mezonining kuzatilgan qiymatini hisoblang.

2. Laplas funksiyasi jadvalidan F (zkr) = (1-2a) / 2 tenglikdan kritik nuqtani toping.

3. Agar Z obs< z кр – нет оснований отвергнуть нулевую гипотезу. Если Z набл >z cr - biz nol gipotezani rad qilamiz.

Uchinchi holat. Nol gipoteza N0: M (X) = M (Y). Raqobatchi gipoteza H1: M (X)

Bunday holda, chap tarafdagi tanqidiy maydon talabdan kelib chiqqan holda quriladi, mezonning ushbu hududga tushish ehtimoli,

nol gipotezaning to'g'rilik pozitsiyasi qabul qilingan P ahamiyatlilik darajasiga teng edi (Z< z’кр)=a, т.е. z’кр= – zкр. Таким образом, для того чтобы найти точку z’кр, достаточно сначала найти “вспомогательную точку” zкр а затем взять найденное значение со знаком минус. Тогда левосторонняя критическая область определяется неравенством Z < -zкр, а область принятия нулевой гипотезы – неравенством Z >-zcr.

Qoida.

1. Zoblni hisoblang.

2. Laplas funksiyalar jadvaliga ko‘ra, F (zcr) = (1-2a) / 2 tengligi bo‘yicha “yordamchi nuqta” zcr ni toping va keyin z'cr = -zcr ni qo‘ying.

3. Agar Zobl> -zcr bo'lsa, nol gipotezani rad etishga asos yo'q.

Agar Zobl< -zкр, – нулевую гипотезу отвергают.

Asosiy tenglamalar

Ilgari, faktorli tahlil bo'yicha deyarli barcha darsliklar va monografiyalarda asosiy hisob-kitoblarni "qo'lda" yoki eng oddiy hisoblash qurilmasi (qo'shish mashinasi yoki kalkulyator) yordamida qanday amalga oshirish kerakligi haqida tushuntirish berilgan. Bugungi kunda o'zaro bog'liqlik matritsasini qurish, omillarni ajratish va ularni aylantirish uchun zarur bo'lgan murakkablik va katta hajmdagi hisob-kitoblar tufayli, omil tahlilini o'tkazishda kuchli kompyuterlar va mos keladigan dasturlardan foydalanmaydigan bironta ham odam topilmasa kerak.

Shuning uchun biz omil tahlili jarayonida eng muhim matritsalarni (ma'lumotlar to'plamini) qanday olish mumkinligi, ular bir-biri bilan qanday bog'liqligi va ma'lumotlarni sharhlashda qanday ishlatilishiga e'tibor qaratamiz. Barcha kerakli hisob-kitoblar har qanday kompyuter dasturi (masalan, SPSS yoki STADIA) yordamida amalga oshirilishi mumkin.

V tab. 1 asosiy komponentlar tahlili va omil tahlili uchun eng muhim matritsalar ro'yxatini taqdim etadi. Ushbu ro'yxat asosan munosabatlar matritsalarini (o'zgaruvchilar o'rtasida, omillar o'rtasida, o'zgaruvchilar va omillar o'rtasida), standartlashtirilgan qiymatlarni (o'zgaruvchilar va omillar uchun), regressiya og'irliklarini (o'zgaruvchilar uchun qiymatlardan foydalangan holda omil qiymatlarini hisoblash uchun) va omilni o'z ichiga oladi. oblique aylanishdan keyin omillar va o'zgaruvchilar o'rtasidagi munosabatlarning matritsalarini xaritalash. V tab. 1 xos qiymatlar matritsalari va tegishli xos vektorlar ham berilgan. O'z qiymatlari (o'ziga xos qiymatlar) va o'z vektorlari omillarni tanlashda ularning ahamiyati, bu borada ko'plab maxsus atamalardan foydalanish, shuningdek, statistik tadqiqotlarda xos qiymatlar va dispersiyaning yaqin aloqasi hisobga olingan holda tavsiflanadi. .

1-jadval

Faktorli tahlilda eng ko'p qo'llaniladigan matritsalar

Belgilanish Ism Hajmi Tavsif
R Munosabatlar matritsasi p x p O'zgaruvchilar o'rtasidagi munosabatlar
D Standartlashtirilmagan ma'lumotlar matritsasi N x p Birlamchi ma'lumotlar - birlamchi o'zgaruvchilar uchun standartlashtirilmagan kuzatish qiymatlari
Z Standartlashtirilgan ma'lumotlar matritsasi N x p Birlamchi o'zgaruvchilar uchun standartlashtirilgan kuzatish qiymatlari
F Faktor qiymatlari matritsasi N x f Faktor bo'yicha standartlashtirilgan kuzatish qiymatlari
A Faktorlarni yuklash matritsasi Faktorlarni xaritalash matritsasi p x f Umumiy omillar uchun regressiya koeffitsientlari, kuzatilayotgan o'zgaruvchilar omillarning chiziqli birikmasi deb faraz qilinadi. Ortogonal aylanish holatida o'zgaruvchilar va omillar o'rtasidagi bog'liqlik
V Faktor qiymat koeffitsienti matritsasi p x f O'zgaruvchan qiymatlardan foydalangan holda omil qiymatlarini hisoblash uchun regressiya koeffitsientlari
S Strukturaviy matritsa p x f O'zgaruvchilar va omillar o'rtasidagi munosabatlar
F Faktor korrelyatsiya matritsasi f x f Faktorlar orasidagi korrelyatsiya
L Xususiy qiymat matritsasi (diagonal) f x f Xususiy qiymatlar (xarakterli, yashirin ildizlar); har bir omil bitta to'g'ri raqamga ega
V Xususiy vektor matritsasi f x f O'z (xarakterli) vektorlar; har bir xos qiymat bitta xos vektorga mos keladi

Eslatma. O'lchamni belgilashda qatorlar soni x ustunlar soni beriladi: R- o'zgaruvchilar soni, N- kuzatishlar soni; f- omillar yoki komponentlar soni. Agar munosabatlar matritsasi R degenerativ emas va teng darajaga ega R, keyin u haqiqatan ham ajralib turadi R xos qiymatlar va xos vektorlar emas f... Biroq, faqat f ulardan. Shuning uchun, qolgan p - f ko'rsatilmaydi.

Matritsalarga S va F faqat qiyshiq aylanishni qo'llaydi, qolganlari uchun - ortogonal va qiya.

Faktorli tahlil uchun tayyorlangan ma'lumotlar to'plami ma'lum shkalalar (o'zgaruvchilar) bo'yicha ko'p sonli sub'ektlarning (respondentlarning) o'lchovlari (so'rovi) natijalaridan iborat. V tab. 2 shartli ravishda omilli tahlil talablarini qanoatlantiradigan deb hisoblash mumkin bo'lgan ma'lumotlar massivi berilgan.

Dengiz bo'yidagi kurortga chipta sotib olish maqsadida sayyohlik agentligiga murojaat qilgan 5 nafar respondentga yozgi ta'til uchun joy tanlashda to'rtta shart (o'zgaruvchi)ning ahamiyati haqida savollar berildi. Ushbu o'zgaruvchan shartlar quyidagilar edi: vaucherning narxi, kompleksning qulayligi, havo harorati, suv harorati. Javobgar nuqtai nazaridan u yoki bu shartning u uchun qanchalik ahamiyatli bo'lsa, unga shunchalik ahamiyat bergan. Tadqiqot vazifasi o'zgaruvchilar o'rtasidagi munosabatlar modelini o'rganish va kurortni tanlashni belgilaydigan asosiy sabablarni aniqlashdan iborat edi. (Albatta, misol illyustrativ va ma'rifiy maqsadlarda juda soddalashtirilgan va uni mazmunli jihati bilan jiddiy qabul qilmaslik kerak.)

Aloqa matritsasi ( tab. 2) korrelyatsiya sifatida hisoblangan. Undagi munosabatlarning tuzilishiga e'tibor bering, vertikal va gorizontal chiziqlar bilan ta'kidlangan. Yuqori chap va pastki o'ng kvadrantlardagi yuqori korrelyatsiyalar chipta narxi va kompleksning qulayligi bo'yicha hisob-kitoblar, shuningdek, havo harorati va suv harorati uchun hisob-kitoblar o'zaro bog'liqligini ko'rsatadi. Qolgan ikkita kvadrant havo harorati va majmuaning qulayligi, shuningdek, kompleksning qulayligi va suvning harorati bog'liqligini ko'rsatadi.

Keling, kichik korrelyatsiya matritsasida oddiy ko'z bilan osongina ko'rinadigan korrelyatsiya strukturasini faktorli tahlil yordamida topishga harakat qilaylik (katta matritsada buni qilish juda qiyin).

jadval 2

Faktor tahlili ma'lumotlari (keys stadi)

Turistlar O'zgaruvchilar
Voucher narxi Konfor darajasi Havo harorati Suv harorati
T1
T2
T3
T4
T5

Korrelyatsiya matritsasi

Voucher narxi Konfor darajasi Havo harorati Suv harorati
Voucher narxi 1,000 -0,953 -0,055 -0,130
Konfor darajasi -0,953 1,000 -,091 -0,036
Havo harorati -0,055 -0,091 1,000 0,990
Suv harorati -0,130 -0,036 0,990 1,000

Faktorizatsiya

Matritsa algebrasidan muhim teorema shuni ko'rsatadiki, ma'lum shartlarni qondiradigan matritsalarni diagonallashtirish mumkin, ya'ni. asosiy diagonalda raqamlar va boshqa barcha pozitsiyalarda nollar bo'lgan matritsaga aylantiriladi. Aloqa matritsalari aynan diagonallashtiriladigan matritsalar turidir. Transformatsiya quyidagi formula bo'yicha amalga oshiriladi:

bular. R matritsani diagonallashtirish uni avval (chapda) V ' bilan belgilangan transpozitsiyalangan V matritsaga, so'ngra (o'ngda) V matritsaga ko'paytirish yo'li bilan amalga oshiriladi.

V matritsadagi ustunlar xos vektorlar, L matritsaning bosh diagonalidagi qiymatlar esa xos qiymatlar deb ataladi. Birinchi xos vektor birinchi xos qiymatga mos keladi va hokazo. (batafsil ma'lumot uchun 1-ilovaga qarang).

Berilgan misolda to'rtta o'zgaruvchi ko'rib chiqilganligi sababli, biz ularning tegishli xos vektorlari bilan to'rtta xos qiymatni olamiz. Ammo omil tahlilining maqsadi imkon qadar kamroq omillardan foydalangan holda munosabatlar matritsasini umumlashtirish va har bir o'ziga xos qiymat turli xil potentsial omillarga mos kelishi sababli, odatda faqat katta o'z qiymatiga ega bo'lgan omillar hisobga olinadi. "Yaxshi" faktorial yechim bilan ushbu cheklangan omillar to'plamidan foydalangan holda olingan hisoblangan munosabatlar matritsasi amalda munosabatlar matritsasini takrorlaydi.

Bizning misolimizda, omillar soniga hech qanday cheklovlar qo'yilmaganda, to'rtta mumkin bo'lgan omillarning har biri uchun 2,02, 1,94, .04 va.00 xos qiymatlari hisoblanadi. Faqat dastlabki ikkita omil uchun xos qiymatlar keyingi ko'rib chiqish mavzusiga aylanishi uchun etarlicha katta. Shuning uchun faqat birinchi ikkita omil qayta ta'kidlanadi. Jadvalda ko'rsatilganidek, ular mos ravishda 2,00 va 1,91 o'z qiymatlariga ega. 3. (6) tenglamadan foydalanib va ​​yuqoridagi misoldagi qiymatlarni kiritsak, biz quyidagilarni olamiz:

(Kompyuter tomonidan hisoblangan barcha qiymatlar bir xil; qo'lda hisob-kitoblar yaxlitlash noaniqliklari tufayli farq qilishi mumkin.)

Xususiy vektorlar matritsasining transpozitsiyalangan matritsaga chapga koʻpaytirilishi E matritsasini beradi (birlari bosh diagonalda va boshqa nollarda). Shuning uchun, (6) formula bo'yicha munosabatlar matritsasining o'zgarishi uni o'zi o'zgartirmaydi, balki uni tahlil qilish uchun qulayroq shaklga aylantiradi, deb aytishimiz mumkin:

Masalan:

3-jadval

Keys tadqiqoti uchun xos vektorlar va mos keladigan xos qiymatlar

Xususiy vektor 1 Xususiy vektor 2
-.283 .651
.177 -.685
.658 .252
.675 .207
Xususiy qiymat 1 Xususiy qiymat 2
2.00 1.91

Korrelyatsiya matritsasi diagonallashtirilganligi sababli, omil tahlili natijalarini olish uchun unga xos vektorlar va xos qiymatlarning matritsa algebrasi qo'llanilishi mumkin (1-ilovaga qarang). Agar matritsa diagonali bo'lsa, faktorial tuzilma haqidagi barcha muhim ma'lumotlar uning diagonal shaklida mavjud. Omil tahlilida xos qiymatlar omillar bilan izohlangan dispersiyaga mos keladi. Eng katta xususiy qiymatga ega bo'lgan omil, odatda tahlilda hisobga olinmaydigan kichik yoki salbiy xos qiymatli omillarga kelgunga qadar, eng katta dispersiyani va hokazolarni tushuntiradi. O'z qiymatlari va xos vektorlarini hisoblash juda mashaqqatli va ularni hisoblash qobiliyati o'zining amaliy maqsadlari uchun omil tahlilini o'zlashtirgan psixolog uchun mutlaq zarurat emas. Biroq, ushbu protsedura bilan tanishish zarar qilmaydi, shuning uchun 1-ilovada biz kichik matritsada o'z qiymatlari va xos vektorlarini hisoblash misolini keltiramiz.

Kvadrat matritsa pxp ning xos qiymatlarini topish uchun p darajali ko‘phadning ildizlarini topish va xos vektorlarini topish uchun p noma’lum p tenglamalarni qo‘shimcha yon cheklashlar bilan yechish kerak, bu p> 3 uchun bo‘ladi. kamdan-kam hollarda qo'lda amalga oshiriladi. Xususiy vektorlar va o'z qiymatlari topilgandan so'ng, omil tahlilining qolgan qismi (yoki asosiy komponent tahlili) ko'proq yoki kamroq aniq bo'ladi (8-11 tenglamalarga qarang).

(6) tenglama quyidagicha ifodalanishi mumkin: R = V'LV, (8)

bular. o'zaro bog'lanishlar matritsasi uchta matritsa - xos qiymatlar matritsasi, mos keladigan xos vektorlar matritsasi va unga ko'chirilgan ko'paytma sifatida qaralishi mumkin.

Transformatsiyadan so'ng L o'z qiymatlari matritsasi quyidagicha ifodalanishi mumkin:

va shuning uchun: R = VÖLÖL V ’(10)

yoki (bu bir xil): R = (VÖL) (ÖL V ’)

Belgilaymiz: A = (VÖL) va A ’= (ÖL V’), keyin R = AA ’(11)

bular. munosabatlar matritsasi ikkita matritsaning mahsuloti sifatida ham ifodalanishi mumkin, ularning har biri xos vektorlar va xos qiymatlarning kvadrat ildizlari birikmasidir.

(11) tenglama ko'pincha asosiy omil tahlili tenglamasi deb ataladi. U munosabatlar matritsasi faktor yuklamalari (A) matritsasining mahsuloti ekanligi va unga ko'chirilganligi haqidagi bayonotni ifodalaydi.

(10) va (11) tenglamalar, shuningdek, faktorli tahlil usullari va asosiy komponentlar bo'yicha hisob-kitoblarning muhim qismi o'z qiymatlari va xos vektorlarini aniqlashdan iborat ekanligini ko'rsatadi. Ular ma'lum bo'lgach, aylanish oldidan faktorial matritsa to'g'ridan-to'g'ri matritsani ko'paytirish orqali olinadi:

Bizning misolimizda:

Faktor yuklamalari matritsasi - bu omillar va o'zgaruvchilar o'rtasidagi munosabatlar matritsasi (korrelyatsiya koeffitsientlari sifatida talqin etiladi). Birinchi ustunda birinchi omil va o'z navbatida har bir o'zgaruvchi o'rtasidagi korrelyatsiya: chipta narxi (-.400), kompleksning qulayligi (.251), havo harorati (.932), suv harorati (. 956). Ikkinchi ustun ikkinchi omil va har bir o'zgaruvchi o'rtasidagi korrelyatsiya: sayohat narxi (.900), kompleksning qulayligi (-.947), havo harorati (.348), suv harorati (.286) . Faktor unga kuchli bog'liq bo'lgan o'zgaruvchilar (ya'ni, yuklarning yuqori bo'lishi) asosida talqin qilinadi. Shunday qilib, birinchi omil asosan "iqlim" (havo va suv harorati), ikkinchisi esa "iqtisodiy" (chipta narxi va majmuaning qulayligi).

Ushbu omillarni izohlashda birinchi omil (havo harorati va suv harorati) uchun yuqori yuklarga ega bo'lgan o'zgaruvchilar o'zaro ijobiy bog'liqligiga e'tibor berish kerak, ikkinchi omil uchun yuqori yuklangan o'zgaruvchilar (sayohat narxi va majmuaning qulayligi) o‘zaro salbiy bog‘langan.(arzon kurortdan katta qulaylikni kutish mumkin emas). Birinchi omil unipolyar (barcha o'zgaruvchilar bir qutbda guruhlangan), ikkinchisi esa bipolyar (o'zgaruvchilar ma'no jihatidan qarama-qarshi bo'lgan ikkita guruhga bo'lingan - ikkita qutb) deb ataladi. Ortiqcha belgisi bilan faktorial yuklarga ega bo'lgan o'zgaruvchilar musbat qutbni, minus belgisi bo'lganlar esa manfiy qutb hosil qiladi. Bunda omilni izohlashda “ijobiy” va “salbiy” qutblarning nomlari “yomon” va “yaxshi” baholovchi ma’noga ega emas. Belgini tanlash hisob-kitoblar paytida tasodifiy sodir bo'ladi. Barcha belgilarni qarama-qarshi belgilar bilan almashtirish (barcha plyuslar minuslar uchun va barcha minuslar plyuslar uchun) yechimni o'zgartirmaydi. Belgilarni tahlil qilish faqat guruhlarni aniqlash uchun kerak (nimaga qarshi). Xuddi shu muvaffaqiyat bilan bir qutbni o'ng, ikkinchisini chap deb atash mumkin. Bizning misolimizda vaucherning o'zgaruvchan narxi ijobiy (o'ng) qutbda bo'lib chiqdi, u salbiy (chap) qutbdagi kompleksning o'zgaruvchan qulayligiga qarshi edi. Va bu omil "Konfor haqida iqtisod" deb talqin qilinishi (deb ataladi) mumkin. Tejamkorlik muammosi muhim bo'lgan respondentlar o'ng tomonda edilar - ular ortiqcha belgisi bilan faktorial qiymatlarni oldilar. Dam olish maskanini tanlashda ular ko'proq arzonligi va qulayligi bilan boshqariladi. Ta'tilda tejamkor bo'lmagan (ular vaucher narxiga unchalik ahamiyat bermaydilar) va birinchi navbatda qulay sharoitda dam olishni xohlaydigan respondentlar chap tomonda edilar - ular minus belgisi bilan omil qiymatlarini oldilar. .

Biroq, shuni yodda tutish kerakki, barcha o'zgaruvchilar ikkala omil bilan ham yuqori darajada bog'liqdir. Ushbu oddiy misolda talqin ravshan, ammo haqiqiy ma'lumotlarda bu unchalik oddiy emas. Odatda omilni izohlash osonroq bo'ladi, agar o'zgaruvchilarning faqat kichik bir qismi u bilan kuchli bog'liq bo'lsa, qolganlari esa yo'q.

Ortogonal aylanish

Yuqori korrelyatsiyalarni maksimal darajaga ko'tarish va past korrelyatsiyalarni kamaytirish uchun aylanish odatda faktoringdan keyin qo'llaniladi. Aylanishning ko'plab usullari mavjud, lekin eng ko'p ishlatiladigan aylanish varimax bo'lib, bu variatsiyani maksimallashtirish protsedurasidir. Bu burilish omil yuklamalarining farqini maksimal darajada oshiradi, har bir omil kunidan yuqori yuklarni yuqoriroq va pastroqlarni pastroq qiladi. Bu maqsad bilan erishiladi transformatsiya matritsasi L:

A burishdan oldin L = A burilishdan keyin,

bular. tebranish oldidan faktorial yuklamalar matritsasi transformatsiya matritsasiga ko'paytiriladi va natijada tebranishdan keyingi faktorial yuklamalar matritsasi hosil bo'ladi. Bizning misolimizda:

Aylanishdan oldin va keyin matritsalarni solishtiring. E'tibor bering, aylanishdan keyingi matritsa aylanishdan oldingi matritsaga qaraganda kamroq faktorial yuklarga ega va yuqoriroqdir. Yuklardagi ta'kidlangan farq omilni talqin qilishni osonlashtiradi, u bilan kuchli bog'liq bo'lgan o'zgaruvchilarni aniq tanlash imkonini beradi.

Transformatsiya matritsasi elementlari maxsus geometrik talqinga ega:

Transformatsiya matritsasi - bu aylanadigan burchakning sinuslari va kosinuslari matritsasi. (Shuning uchun transformatsiya nomi - aylanish, chunki geometrik nuqtai nazardan qaraganda, o'qlar omil fazosining kelib chiqishi atrofida aylanadi.) Bizning misolimizda bu burchak taxminan 19 daraja: cos19 ° = .946 va sin19 ° = .325. Geometrik jihatdan, bu omil o'qlarini boshlang'ich atrofida 19 gradusga aylantirishga to'g'ri keladi. (Aylanishning geometrik jihatlari haqida ko'proq ma'lumot olish uchun pastga qarang.)

Milliy tadqiqot yadro universiteti "MEPhI"
Biznes informatika va menejment fakulteti
murakkab tizimlar
Iqtisodiyot va boshqaruv kafedrasi
sanoatda (№ 71)
Matematik va instrumental ishlov berish usullari
statistik ma'lumotlar
Kireev V.S.,
t.f.n., dotsent
Email:
Moskva, 2017 yil
1

Normalizatsiya

O'nlik shkala
Minimaks normalizatsiya
Standart transformatsiya yordamida normallashtirish
Element bo'yicha o'zgartirishlar yordamida normallashtirish
2

O'nlik shkala

Vi
"
Vi k, maksimal (Vi) 1
10
"
3

Minimaks normalizatsiya

Vi
Vi min (Vi)
"
i
maksimal (Vi) min (Vi)
i
i
4

Standart og'ish yordamida normalizatsiya

Vi
"
V
V
Vi V
V
- selektiv
o'rtacha
- o'rtacha kvadrat namunasi
og'ish
5

Element bo'yicha o'zgartirishlar yordamida normallashtirish

Vi f Vi
"
Vi 1
"
log Vi
, Vi log Vi
"
Vi exp Vi
"
Vi Vi, Vi 1 y
Vi
"
y
"
6

Faktor tahlili

(FA) - bu usullar to'plami
tahlil qilinayotgan xususiyatlarning haqiqatda mavjud bo'lgan bog'lanishlari, bog'lanishlarning o'zlari asosida
kuzatilishi mumkin bo'lgan ob'ektlar, yashirin (yashirin, yashirin) aniqlash imkonini beradi.
tashkiliy tuzilma va rivojlanish mexanizmining umumlashtiruvchi xarakteristikalari
hodisalar, jarayonlarni o‘rgangan.
Tadqiqot amaliyotida omilli tahlil usullari asosan qo'llaniladi
ma'lumotni siqish uchun oz sonli umumlashtirishni olish usuli
elementar belgilarning o'zgaruvchanligini (variatsiyasini) tushuntiruvchi xususiyatlar (omilli tahlilning R-texnikasi) yoki kuzatilgan ob'ektlarning o'zgaruvchanligini (Q-texnikasi)
omil tahlili).
Faktorli tahlil algoritmlari qisqartirilgandan foydalanishga asoslangan
juft korrelyatsiya matritsalari (kovarianslar). Qisqartirilgan matritsa yoqilgan matritsadir
asosiy diagonali to'liq korrelyatsiya birliklari (baholari) bo'lmagan yoki
umumiy dispersiyaning taxminlari va ularning qisqargan, biroz qisqartirilgan qiymatlari. Da
tahlil barcha dispersiyalarni tushuntirib bera olmaydi, deb taxmin qilinadi
o'rganilgan xususiyatlar (ob'ektlar) va uning bir qismi, odatda katta. Qolgan
dispersiyaning tushuntirilmagan qismi o'ziga xoslikdan kelib chiqadigan o'ziga xoslikdir
kuzatilgan ob'ektlar yoki hodisalarni, jarayonlarni ro'yxatga olishda qilingan xatolar,
bular. kiritilgan ma'lumotlarning ishonchsizligi.
7

FA usullarining tasnifi

8

Asosiy komponent usuli

(MGK) o'lchamni kamaytirish uchun ishlatiladi
ning sezilarli yo'qotilishiga olib kelmasdan kuzatilgan vektorlar maydoni
informativlik. PCA uchun zaruriy shart oddiy taqsimot qonunidir
ko'p o'lchovli vektorlar. MGKda tasodifiy miqdorlarning chiziqli birikmalari aniqlanadi
xarakterli
vektorlar
kovariatsiya
matritsalar.
Asosiy
komponentlar ortogonal koordinatalar sistemasini ifodalaydi, unda dispersiyalar mavjud
komponentlar ularning statistik xususiyatlarini tavsiflaydi. MGK FA sifatida tasniflanmagan, garchi u bor
shunga o'xshash algoritm va shunga o'xshash analitik muammolarni hal qiladi. Uning asosiy farqi
qisqartirilgan emas, balki odatiy matritsa qayta ishlanishi kerakligidadir
asosiy diagonalida birliklar joylashgan juft korrelyatsiyalar, kovariatsiyalar.
Lk chiziqli fazoning X vektorlarining boshlang'ich to'plami berilgan bo'lsin. Ilova
asosiy komponentlar usuli Lm (m≤k) fazoning asosiga o'tish imkonini beradi, bunday
ya'ni: birinchi komponent (asosning birinchi vektori) bo'ylab yo'nalishga mos keladi
bunda asl to'plam vektorlarining dispersiyasi maksimal bo'ladi. Ikkinchi yo'nalish
komponentlar (ikkinchi bazis vektorining) boshlang'ichning dispersiyasi bo'ladigan tarzda tanlanadi
birinchi vektorga ortogonallik sharti bilan uning bo'ylab vektorlar maksimal bo'lgan
asos. Qolgan asosiy vektorlar ham xuddi shunday aniqlanadi. Natijada, yo'nalishlar
Bazis vektorlari boshlang'ich to'plamning dispersiyasini maksimal darajada oshirish uchun tanlanadi
asosiy komponentlar (yoki asosiy komponentlar) deb ataladigan birinchi komponentlar bo'ylab
Ma'lum bo'lishicha, vektorlarning dastlabki to'plami vektorlarining asosiy o'zgaruvchanligi
dastlabki bir nechta komponentlar bilan ifodalanadi va uni tashlab yuborish orqali mumkin bo'ladi
kamroq muhim komponentlar, pastki o'lchamdagi bo'shliqqa o'ting.
9

10. Asosiy komponentlar usuli. Sxema

10

11. Asosiy komponentlar usuli. Hisoblar matritsasi

T ball matritsasi bizga asl namunalarning proektsiyalarini beradi (J - o'lchovli
vektorlar
x1, ..., xI)
yoqilgan
pastki fazo
Asosiy
komponent
(A o'lchamli).
T matritsaning t1,…, tI qatorlari yangi koordinatalar tizimidagi namunalarning koordinatalari.
T matritsaning t1, ..., tA ustunlari ortogonal bo‘lib, barcha namunalarning proyeksiyalarini ifodalaydi.
bitta yangi koordinata o'qi.
PCA usuli yordamida ma'lumotlarni tekshirishda grafiklarga alohida e'tibor beriladi
hisoblar. Ular qanday ishlashini tushunish uchun foydali ma'lumotlarni olib yuradilar
ma'lumotlar. Hisoblar grafigida har bir namuna koordinatalarda (ti, tj) ko'pincha tasvirlangan
- (t1, t2), belgilangan PC1 va PC2. Ikki nuqtaning yaqinligi ularning o'xshashligini anglatadi, ya'ni.
ijobiy korrelyatsiya. To'g'ri burchakli nuqtalar
o'zaro bog'liq bo'lmagan va diametrik ravishda qarama-qarshi joylashgan - ega
salbiy korrelyatsiya.
11

12. Asosiy komponentlar usuli. Yuklash matritsasi

P yuk matritsasi asl fazodan o'tish matritsasidir
o'zgaruvchilar x1,… xJ (J-o'lchovli) asosiy komponentlar (A-o'lchovli) fazosiga. Har bir
P matritsaning qatori t va x o'zgaruvchilarni bog'lovchi koeffitsientlardan iborat.
Masalan, a-chi chiziq barcha o'zgaruvchilarning x1, ... xJ proyeksiyasi boshning a-o'qi bo'yicha.
komponent. P ning har bir ustuni mos keladigan xj o'zgaruvchining yangisiga proyeksiyasidir
koordinata tizimi.
Yuklanish grafigi o'zgaruvchilar rolini o'rganish uchun ishlatiladi. Bu haqida
Grafikda har bir xj o'zgaruvchisi koordinatalarda (pi, pj), masalan, nuqta sifatida ko'rsatiladi.
(p1, p2). Hisoblar grafigiga o'xshash tarzda tahlil qilib, siz qaysi o'zgaruvchilarni tushunishingiz mumkin
bog'liq va mustaqil. Juftlangan hisob jadvallarini birgalikda o'rganish va
yuklar ham ma'lumotlar haqida juda ko'p foydali ma'lumotlarni taqdim etishi mumkin.
12

13. Asosiy komponentlar usulining xususiyatlari

Asosiy komponent tahlili quyidagi taxminlarga asoslanadi:
ma'lumotlar hajmini samarali ravishda qisqartirish mumkin degan taxmin
chiziqli o'zgartirish orqali;
ma'lumotlarning ko'p qismi o'sha yo'nalishlar tomonidan amalga oshiriladi degan taxmin
kiritilgan ma'lumotlarning farqi maksimal.
Bu shartlar har doim ham bajarilmasligini osongina ko'rish mumkin. Masalan,
agar kirish to'plamining nuqtalari gipersfera yuzasida joylashgan bo'lsa, unda yo'q
chiziqli transformatsiyani qisqartirish mumkin emas (lekin uni osonlikcha hal qilish mumkin).
nuqtadan sharning markazigacha bo'lgan masofaga asoslangan chiziqli bo'lmagan transformatsiya).
Ushbu kamchilik barcha chiziqli algoritmlar uchun bir xil darajada umumiydir va bo'lishi mumkin
bo'lgan qo'shimcha qo'g'irchoq o'zgaruvchilar yordamida yengish
kirish ma'lumotlar to'plamining elementlaridan chiziqli bo'lmagan funktsiyalar (yadro hiylasi deb ataladi).
Asosiy komponent usulining ikkinchi kamchiligi - bu yo'nalishlar
maksimal dispersiya har doim ham axborot mazmunini maksimal darajada oshirmaydi.
Misol uchun, maksimal dispersiyaga ega o'zgaruvchi deyarli yo'q bo'lishi mumkin
ma'lumot, minimal dispersiyaga ega o'zgaruvchi imkon beradi
sinflarni butunlay ajrating. Bu holda asosiy komponentlar usuli beradi
birinchi (kamroq ma'lumotli) o'zgaruvchiga ustunlik. Hammasi qo'shimcha
vektor bilan bog'liq ma'lumotlar (masalan, tasvir biriga tegishlimi yoki yo'qmi
sinflar) e'tiborga olinmaydi.
13

14. MGK uchun misol ma'lumotlari

K. Esbensen. Ko'p o'lchovli ma'lumotlarni tahlil qilish, abbr. boshiga. ingliz tilidan ostida
ed. O. Rodionova, Iz-in IPKhF RAS, 2005 y
14

15. IGC uchun ma'lumotlarga misol. Belgilar

Balandligi
Balandligi: santimetrda
Og'irligi
Og'irligi: kilogrammda
Soch
Sochlar: qisqa: -1 yoki uzun:
+1
Oyoq kiyimlari
Poyafzal: Evropa o'lchami
standart
Yosh
Yoshi: yillar ichida
Daromad
Daromad: yiliga ming evroda
Pivo
Pivo: yiliga litrda iste'mol
Vino
Sharob: yiliga litrda iste'mol
Jinsiy aloqa
Jins: erkak: -1 yoki ayol: +1
Kuch
Kuch: asoslangan indeks
jismoniy qobiliyatlarni tekshirish
Mintaqa
Hudud: Shimoliy: -1 yoki janub: +1
IQ
IQ,
standart sinov bilan o'lchanadi
15

16. Hisob-kitoblar matritsasi

16

17. Yuklarning matritsasi

17

18. Yangi komponentlar fazosida tanlash ob'ektlari

Ayollar (F) ● va ● doiralar bilan ko'rsatilgan va
erkaklar (M) - kvadratlar bo'yicha ■ va ■. Shimoliy (N)
ko'k ■ va janubda (S) qizil rangda tasvirlangan
rang ●.
Belgilarning o'lchami va rangi daromadni aks ettiradi - qanday
qanchalik katta va engil bo'lsa, u qanchalik katta bo'lsa. Raqamlar
yoshni ifodalaydi
18

19. Yangi komponentlar fazosidagi boshlang'ich o'zgaruvchilar

19

20. Ekran syujeti

20

21. Asosiy omillar usuli

Asosiy omillar usuli paradigmasida atributning o'lchamini kamaytirish muammosi
fazo n ta xususiyatni kichikroq yordamida tushuntirish mumkin ko'rinadi
m-yashirin xususiyatlar soni - umumiy omillar, bu erda m<boshlang'ich xususiyatlar va kiritilgan umumiy omillar (chiziqli birikmalar)
deb atalmish xarakterli omillar yordamida hisobga olinadi.
ishtirokida olib borilgan statistik tadqiqotlarning yakuniy maqsadi
omil tahlili apparati, qoida tariqasida, aniqlash va izohlashdan iborat
yashirin umumiy omillar bir vaqtning o'zida ular qanday qilib minimallashtirish istagi bilan
soni va ularning o'ziga xos qoldiq tasodifiy bog'liqlik darajasi
komponent.
Har bir belgi
natijasidir
ta'siri m gipotetik umumiy va
xarakterli omillardan biri:
X 1 a11 f1 a12 f 2 a1m f m d1V1
X a f a f a f d V
2
21 1
22 2
2m m
2
X n a n1 f1 a n 2 f 2 a nm f m d nVn
21

22. Omillarning aylanishi

Aylanish - oldingi bosqichda olingan omillarni o'zgartirish usuli,
mazmunliroqlarga aylantiradi. Rotatsiya quyidagilarga bo'linadi:
grafik (chizilgan o'qlar, ikki o'lchovdan ortiq bo'lganda qo'llanilmaydi
tahlil),
analitik (ma'lum bir aylanish mezoni tanlanadi, ortogonal va
qiya) va
matritsa-taxminan (aylanish ma'lum bir berilganga yaqinlashishdan iborat
maqsadli matritsa).
Aylanish natijasi omillarning ikkilamchi tuzilishidir. Asosiy
omil tuzilishi (birlamchi yuklardan iborat (oldingi
bosqich) aslida nuqtalarning ortogonal koordinata o'qlariga proyeksiyalaridir. Bu aniq
agar proyeksiyalar nolga teng bo'lsa, struktura oddiyroq bo'ladi. Va prognozlar nolga teng bo'ladi,
agar nuqta biron bir o'qda yotsa. Shunday qilib, aylanishni o'tish deb hisoblash mumkin
bir sistemada ma'lum koordinatalari bo'lgan boshqa koordinatalar tizimi (
birlamchi omillar) va boshqa tizimdagi iterativ tanlangan koordinatalar
(ikkilamchi omillar). Ikkilamchi tuzilishga ega bo'lganda, ular shunga o'xshash narsaga o'tishadi
nuqtalar (ob'ektlar) orqali iloji boricha ko'proq o'qlarni chizish uchun koordinatalar tizimi
qancha proyeksiyalar (va shuning uchun yuklar) nolga teng edi. Bundan tashqari, ular mumkin
ortogonallik bo'yicha cheklovlarni olib tashlash va birinchisidan oxirgisiga qadar ahamiyatni kamaytirish
birlamchi tuzilishga xos omillar.
22

23. Ortogonal aylanish

omillarni aylantiramiz, lekin emas
ularning bir-biriga ortogonalligini buzamiz. Ortogonal aylanish
birlamchi yuklarning asl matritsasini ortogonal bilan ko'paytirishni nazarda tutadi
R matritsasi (bunday matritsa
V = BR
Umuman olganda, ortogonal aylanish algoritmi quyidagicha:
0. B - birlamchi omillar matritsasi.
1.
qidirmoqdalar
ortogonal
matritsa
RT
hajmi
2*2
uchun
ikki
B matritsasining bi va bj ustunlari (omillari) shundayki, matritsa uchun mezon
R maksimal.
2.
bi va bj ustunlarini ustunlar bilan almashtiring
3.
Barcha ustunlar tartiblanganligini tekshiring. Agar yo'q bo'lsa, 1-ga o'ting.
4.
Biz butun matritsa uchun mezon o'sganligini tekshiramiz. Ha bo'lsa, 1-ga o'ting. If
yo'q, keyin algoritmning oxiri.
.
23

24. Varimax aylanish

Bu mezon rasmiylashtirishdan foydalanadi
o'zgaruvchan yuklarning kvadratlarining o'zgarishi:
qiyinchiliklar
omil a
bo'ylab
Keyin umumiy shakldagi mezon quyidagicha yozilishi mumkin:
Shu bilan birga, omil yuklarini bartaraf etish uchun normalizatsiya qilish mumkin
individual o'zgaruvchilarning ta'siri.
24

25. Maksimal chorak aylanish

i-o’zgaruvchining q faktoriy murakkabligi tushunchasini shartlarda rasmiylashtiramiz
omillarning omil yuklamalari kvadratlarining dispersiyasi:
bu yerda r faktor matritsasining ustunlar soni, bij - j-chi omil yuklamasi.
i-o'zgaruvchining omili - o'rtacha qiymat. Quartimax mezonlari
erishish uchun o'zgaruvchilarning butun to'plamining murakkabligini maksimal darajada oshirish
omillarni talqin qilish qulayligi (ustunlarning tavsifini osonlashtirishga intiladi):
Shuni hisobga olib
doimiy (matritsaning xususiy qiymatlari yig'indisi).
kovariatsiya) va o'rtacha qiymatni ochish (shuningdek, quvvat funktsiyasini hisobga olgan holda).
argumentga mutanosib ravishda o'sadi), biz uchun mezonning yakuniy shaklini olamiz
maksimallashtirish:
25

26. Omillar sonini aniqlash mezonlari

Faktor tahlilining asosiy muammosi tanlash va izohlashdir
asosiy omillar. Komponentlarni tanlashda tadqiqotchi odatda duch keladi
sezilarli qiyinchiliklar, chunki aniqlash uchun aniq mezon yo'q
omillar va shuning uchun bu erda natijalarni talqin qilishning subyektivligi muqarrar.
Faktorlar sonini aniqlash uchun bir nechta keng tarqalgan mezonlar mavjud.
Ulardan ba'zilari boshqalarga muqobil, ba'zilari esa
mezonlar boshqasini to'ldirish uchun birgalikda ishlatilishi mumkin:
Kayzer testi yoki xususiy qiymat testi. Ushbu mezon taklif etiladi
Kaiser va, ehtimol, eng keng tarqalgan. Faqat tanlangan
Xususiy qiymatlari 1 ga teng yoki undan katta bo'lgan omillar. Bu shuni anglatadiki, agar
omil kamida bitta dispersiyaga ekvivalent dispersiyani ajrata olmaydi
o'zgaruvchi, u o'tkazib yuborilgan.
Skrining mezoni yoki skrining mezoni. U
birinchi marta psixolog Cattell tomonidan taklif qilingan grafik usul. Shaxsiy
qiymatlar oddiy grafik sifatida ko'rsatilishi mumkin. Cattel shunday topishni taklif qildi
grafikdagi o'z qiymatlarining chapdan o'ngga kamayishi maksimal bo'lgan joy
sekinlashadi. Faqat shunday deb taxmin qilinadi
"Faktorial talus" - "talus" geologik atamani bildiradi
toshloq qiyalik tubida to'plangan qoldiqlar.
26

27. Omillar sonini aniqlash mezonlari. Davomi

Muhimlik mezoni. Bu, ayniqsa, umumiy modelda samarali bo'ladi
agregat ma'lum va ikkinchi darajali omillar mavjud emas. Ammo mezon haqiqiy emas
modeldagi o'zgarishlarni izlash va faqat usul yordamida omil tahlilida amalga oshiriladi
eng kichik kvadratlar yoki maksimal ehtimollik.
Qayta tiklanadigan dispersiya nisbati mezoni. Omillar ulush bo'yicha tartiblangan
deterministik dispersiya, dispersiya ulushi ahamiyatsiz bo'lib chiqsa,
tanlashni to'xtatish kerak. Tanlangan omillarni tushuntirish maqsadga muvofiqdir
tarqalishining 80% dan ortig'i. Mezonning kamchiliklari: birinchidan, tanlovning sub'ektivligi, ikkinchidan, ma'lumotlarning o'ziga xosligi shunday bo'lishi mumkinki, barcha asosiy omillar ta'sir qila olmaydi.
dispersiyaning kerakli foizini jamlab tushuntiring. Shuning uchun asosiy omillar
birgalikda kamida 50,1% dispersiyani tushuntirishi kerak.
Sharhlanuvchanlik va o'zgarmaslik mezoni. Bu mezon birlashtiradi
sub'ektiv manfaatlar bilan statistik aniqlik. Unga ko'ra, asosiy omillar
ularni aniq talqin qilish imkoni bo'lganda farqlash mumkin. U, uning ichida
o'z navbatida, omil yuklamalarining kattaligiga bog'liq, ya'ni omil kamida o'z ichiga oladi
bitta kuchli yuk, uni talqin qilish mumkin. Buning aksi ham mumkin -
agar kuchli yuklar bo'lsa, talqin qilish qiyin, bundan
komponentlar afzalroq tashlanadi.
27

28. MGK dan foydalanishga misol

Bo'lsin
lar bor
quyidagi
ko'rsatkichlar
iqtisodiy
tadbirlar
korxonalar: mehnat zichligi (x1), sotib olingan mahsulotning ishlab chiqarishdagi ulushi (x2),
uskunalarni almashtirish koeffitsienti (x3), korxonadagi ishchilar ulushi
(x4), bonuslar va har bir xodimga to'lanadigan haq (x5), rentabellik (y). Chiziqli
regressiya modeli:
y = b0 + b1 * x1 + b2 * x2 + b3 * x3 + b4 * x4 + b5 * x5
x1
x2
x3
x4
x5
y
0,51
0,2
1,47
0,72
0,67
9,8
0,36
0,64
1,27
0,7
0,98
13,2
0,23
0,42
1,51
0,66
1,16
17,3
0,26
0,27
1,46
0,69
0,54
7,1
0,27
0,37
1,27
0,71
1,23
11,5
0,29
0,38
1,43
0,73
0,78
12,1
0,01
0,35
1,5
0,65
1,16
15,2
0,02
0,42
1,35
0,82
2,44
31,3
0,18
0,32
1,41
0,8
1,06
11,6
0,25
0,33
1,47
0,83
2,13
30,1
28

29. MGK dan foydalanishga misol

Statistik paketda regressiya modelini qurish ko'rsatadi
X4 koeffitsienti ahamiyatli emas (p-qiymat> a = 5%) va uni modeldan chiqarib tashlash mumkin.
nima
X4 chiqarib tashlangandan so'ng, model yaratish jarayoni yana boshlanadi.
29

30. MGK dan foydalanishga misol

PCA uchun Kaiser mezoni shuni ko'rsatadiki, siz 2 ta komponentni tushuntirib berishingiz mumkin
asl farqning taxminan 80% ni tashkil qiladi.
Tanlangan komponentlar uchun siz asl koordinatalar tizimida tenglamalar yaratishingiz mumkin:
U1 = 0,41 * x1 - 0,57 * x2 + 0,49 * x3 - 0,52 * x5
U2 = 0,61 * x1 + 0,38 * x2 - 0,53 * x3 - 0,44 * x5
30

31. CIM dan foydalanishga misol

Endi siz yangi komponentlarda yangi regressiya modelini yaratishingiz mumkin:
y = 15,92 - 3,74 * U1 - 3,87 * U2
31

32. Singular qiymat dekompozitsiyasi (SVD)

Beltrami va Iordaniya singular nazariyasining asoschilari hisoblanadi
parchalanish. Beltrami - asarni birinchi bo'lib nashr etgani uchun
yagona qiymat va Iordaniya - uning nafisligi va to'liqligi uchun
ish. Beltramining ishi Journal of Mathematics jurnalida paydo bo'ldi
Italiya universitetlari talabalaridan foydalanish "1873 yilda asosiy
maqsadi talabalarni tanishtirish edi
ikki chiziqli shakllar Usulning mohiyati n o'lchamli A matritsasining parchalanishida yotadi.
d darajali x m = daraja (M)<= min(n,m) в произведение матриц меньшего
daraja:
A = UDVT,
bu erda n x d o'lchamdagi U va m x d o'lchamdagi V matritsalar iborat
ning xos vektorlari bo'lgan ortonormal ustunlar
AAT va ATA matritsalarining nolga teng bo'lmagan xos qiymatlari va
UTU = V TV = I, va d x d o'lchamdagi D bilan diagonal matritsa
musbat diagonal elementlar tartiblangan
kamayish tartibi. U matritsaning ustunlari,
A matritsaning ustun fazosining ortonormal asosi va ustunlardir
V matritsa A matritsa satr fazosining ortonormal asosidir.
32

33. Singular qiymat dekompozitsiyasi (SVD)

SVD parchalanishining muhim xususiyati shundaki, agar
k uchun faqat k eng katta diagonal elementlardan, shuningdek
U va V matritsalarida faqat birinchi k ustunni, keyin esa matritsani qoldiring
Ak = UkDkVkT
ga nisbatan A matritsasining eng yaxshi yaqinlashuvi bo'ladi
K darajali barcha matritsalar orasida Frobenius normalari.
Ushbu kesish birinchi navbatda vektorning o'lchamini kamaytiradi
bo'sh joy, saqlash va hisoblash talablarini kamaytiradi
model talablari.
Ikkinchidan, kichik birlik raqamlardan voz kechish, kichik
ma'lumotlardagi shovqin tufayli buzilishlar olib tashlanadi, qoldiriladi
faqat ushbu modeldagi eng kuchli effektlar va tendentsiyalar.