Bouw van vliegtuigmotoren Administratief recht Administratief recht Wit-Rusland Algebra Architectuur Levensveiligheid Inleiding tot het beroep "psycholoog" Inleiding tot de economie van de cultuur Hogere wiskunde Geologie Geomorfologie Hydrologie en hydrometrie Hydro- systemen en hydraulische machines Geschiedenis van Oekraïne Culturologie Culturologie Logica Marketing Werktuigbouw Medische psychologie Management Metalen en lassen Technologieën economie beschrijvende meetkunde Fundamentals of economische t Oria Occupational Safety Fire tactiek processen en structuren van het denken Professional Psychology Psychologie Psychologie van het beheer van het moderne fundamenteel en toegepast onderzoek in instrumentatie Sociale Psychologie Sociale en filosofische problemen Sociologie Statistieken theoretische grondslagen van de computer automatische controle theorie Probability Transport Law Turoperator Strafrecht Strafvordering management moderne productie Physics Fysieke verschijnselen Filosofie Koeling en Ecologie Economie Geschiedenis van de economie Basis van de economie Bedrijfseconomie Economische geschiedenis Economische theorie Economische analyse Ontwikkeling van de EU-economie Noodgevallen VKontakte Odnoklassniki Mijn wereld Facebook LiveJournal Instagram

Correlation Tightness Indicators voor het Multi-Factor Correlation-Regression Model




De nabijheid van de relatie tussen de onderzochte indicatoren voor meerdere correlaties wordt bepaald op basis van verschillende coëfficiënten. Om de regressievergelijking adequaat gesimuleerde socio-economische processen of verschijnselen adequaat te weerspiegelen, moet worden voldaan aan de voorwaarden en vereisten van meerdere correlatie- en regressieanalyses.

Correlatie - regressieanalyse : een analytische uitdrukking van de vergelijking (rechtlijnige, kromlijnige) regressie voor een multifactorieel correlatie-regressiemodel. Bepaling van parameters en hun interpretatie.

De nabijheid van de relatie daartussen wordt gemeten door de verhouding van de factorvariantie tot de totale variantie van het resulterende attribuut, de determinatie-index genoemd. De determinatie-index karakteriseert de mate van variatie van de resulterende eigenschap onder invloed van de factor-eigenschap in de totale variabiliteit van de resulterende eigenschap. Als er een verband is tussen de tekens, neemt de snelheid toe, d.w.z. naarmate deze toeneemt, d.w.z. door de nabijheid van de productieve factor en de factoraanduiding te vergroten, neemt de determinatie-index toe en neemt deze af naarmate deze zwakker wordt. Aldus karakteriseert de determinatie-index de nabijheid van de verbinding, de nabijheid van de correlatie met het functionele.

De vierkantswortel van de determinatie-index is de correlatie-index of theoretische correlatieverhouding . De correlatie-index, of theoretische correlatieverhouding, karakteriseert de nabijheid van de verbinding bij elke vorm van afhankelijkheid. Residuele dispersie Het is noodzakelijk om de beste functie te selecteren die de empirische regressielijn het meest nivelleert (benadert). De benaderende functie wordt gekozen door het minimum van de resterende dispersie s 2 OST = S (y t - ) 2 / n of .

Een speciaal geval van de correlatie- index is de lineaire correlatiecoëfficiënt r , die wordt gebruikt om de nabijheid van de relatie met een lineaire relatie te schatten. De correlatiecoëfficiënt neemt waarden van -1 tot +1, wat niet alleen de nabijheid aangeeft, maar ook de richting van de relatie. Het "+" - teken geeft een directe relatie aan tussen de effectieve en factuurtekens, het "-" - teken geeft een omgekeerde relatie tussen beide aan. Als r = 0, dan is er geen verband tussen de tekens. Hoe dichterbij de eenheid is, des te dichter het verband tussen de beschouwde kenmerken.

Bij een lineaire vorm van communicatie is de parameter van de vergelijking van een rechte lijn een regressiecoëfficiënt al en een correlatiecoëfficiënt r als volgt met elkaar verbonden :

en 1 = rs y / s x . In het geval van een rechte lijnverbinding is de lineaire correlatiecoëfficiënt identiek aan de correlatie-index, ze zijn numeriek gelijk: .

De lineaire correlatiecoëfficiënt r wordt gebruikt om de nabijheid van de relatie met een lineaire relatie te schatten: de vergelijking van een rechte lijn = a 0 + a 1 x


border=0


Gebruik de getransformeerde formule om de berekeningen van de lineaire correlatiecoëfficiënt te vereenvoudigen: .

De aard van de relatie wordt bepaald door de waarde van de correlatiecoëfficiënt :

r correlatiecoëfficiëntwaarde communicatie karakter
r = 0 tot 0.3 vrijwel afwezig
0 <r <1 0.3 - 0.5 + rechtdoor arm
-1 <r <0 0,5 - 0.7 - achteruit gematigde
r = 1 0.7 - 1.0 1 - functioneel sterk

De significantie van de lineaire correlatiecoëfficiënt wordt bepaald door t - criterium van de student. Wordt bepaald door de berekende waarde van t calc , die wordt vergeleken met de tabelwaarde t crit . De lineaire correlatiecoëfficiënt wordt als significant beschouwd als de verhouding: t calc > t crit .

met n met n <50.

t crit wordt bepaald door de tabel "De waarde van t - criterium van de student op het niveau van significantie 0,10, 0,05, 0,01 en vrijheidsgraden .

De taak van multifactorcorrelatie - regressieanalyse is ten eerste om een ​​aantal factoren te bestuderen die van invloed zijn op de indicator die wordt bestudeerd en de meest significante te selecteren; ten tweede, bij het bepalen van de mate van invloed van elke factor op het resulterende attribuut door een model te bouwen - de meervoudige regressievergelijking, waarmee je kunt bepalen in welke richting en door welke waarde de effectieve indicator zal veranderen wanneer elke factor in het model verandert; ten derde, in een kwantitatieve beoordeling van de nauwheid van de relatie tussen het effectieve teken en het factoriële teken.

Wiskundig gezien is de taak om de analytische uitdrukking van de functie te vinden = f (x 1 , x 2 , x 3 , ..., x n ), wat de aansluiting van factorieel tekens met de resulterende het beste weergeeft. De resultaten van de theoretische analyse en de mogelijkheid van toepassing ervan op de praktijk zijn afhankelijk van de juiste keuze van de regressiefunctie, daarom moet de vorm van de link het best overeenkomen met de werkelijk bestaande verbanden tussen de resulterende en faculteitseigenschappen. De moeilijkheidsgraad van het kiezen van een functie is dat het effectieve kenmerk met verschillende factoren verschillende vormen van verbinding kan hebben - recht en kromlijnig. De empirische rechtvaardiging van het type functie met behulp van grafieken van gepaarde relaties is praktisch ongeschikt voor meervoudige correlatie en regressie.



De keuze van de vorm van de meervoudige regressievergelijking is gebaseerd op een theoretische analyse van het fenomeen dat wordt bestudeerd. Als de analyse van de onderlinge relaties tussen de effectieve en factorieel tekens niet toestaat dat iemand stilstaat bij enige vorm van verbinding, dan kijken ze door verschillende functies en kiezen de optimale vanuit het oogpunt van de nabijheid van de empirische waarden van het geëvalueerde effectieve kenmerk, maar dit brengt een aanzienlijke bewerkelijkheid met zich mee bij het berekenen van de parameters van verschillende vergelijkingen. Als er speciale software is die het algoritme implementeert voor iteratie over verschillende PCR-vergelijkingen, worden verschillende modellen verkregen, de beste wordt geselecteerd door statistische controle van de parameters van de vergelijking op basis van de Student's t-t- test en Fisher 's F-test .

De keuze van de vorm van de vergelijking van meervoudige regressie wordt in de praktijk uitgevoerd

gebaseerd op het gebruik van vijf soorten modellen :

lineair a 0 + a 1 x 1 + a 2 x 2 + ... + a n x n ;

een vermogen ;

exponentiële ;

parabolisch

hyperbolisch

Stop meestal op lineaire modellen. Dit wordt verklaard door het feit dat, ten eerste, de parameters van lineaire vergelijkingen gemakkelijk kunnen worden geïnterpreteerd, de modellen zelf eenvoudig en handig zijn voor economische analyse, en ten tweede, indien gewenst, kan elke functie worden gereduceerd tot een lineaire vorm door logaritme of veranderende variabelen.

In de lineaire regressievergelijking in de lineaire vorm, tonen de parameters á 1 , а 2 , а 3 , ..., en - de regressiecoëfficiënten de mate van invloed van de relevante factoren op het resulterende attribuut wanneer andere factoren op het gemiddelde niveau zijn vastgesteld, d.w.z. hoeveel y zal veranderen met een toename van de bijbehorende factor met 1 punt van zijn eenheid van verandering; de parameter a 0 is een vrij lid, het heeft geen economische betekenis.

De parameters van de meervoudige regressievergelijking , evenals het paar, worden berekend met de kleinste kwadratenmethode op basis van de oplossing van het systeem van normale vergelijkingen. Aangezien de regressiecoëfficiënten onvergelijkbaar zijn met elkaar (de factoren hebben verschillende meeteenheden), is het onmogelijk om de sterkte van de invloed van elk van de factoren in het model op de resulterende indicator te vergelijken op basis van de regressiecoëfficiënten. Om de relatieve sterkte van de invloed van factoren te bepalen, worden partiële elasticiteitscoëfficiënten en b-coëfficiënten berekend.

De privé-elasticiteitscoëfficiënt geeft aan hoeveel procent gemiddeld de effectieve indicator zal veranderen wanneer de factor met 1% en de vaste positie van andere factoren verandert en voor elke factor afzonderlijk wordt berekend:

waarbij ai de regressiecoëfficiënt voor de i-de factor is; - de gemiddelde waarde van de i-de factor; - de gemiddelde waarde van de effectieve index.

De b-coëfficiënt geeft aan welk deel van de standaardafwijking het resulterende attribuut verandert wanneer de bijbehorende factor verandert met de waarde van de standaardafwijking , waarin s xi , s y - de standaarddeviaties van de i-de factor en de resulterende eigenschap.

Vanwege het feit dat economische verschijnselen worden blootgesteld aan meerdere en complexe oorzaken, moeten significante, systematisch werkende factoren worden opgenomen in de meervoudige regressievergelijking wanneer de invloed van andere factoren wordt geëlimineerd. De be>collineariteit genoemd , en tussen verschillende factoren - multicollineariteit .

De oorzaken van multicollineariteit tussen de tekens zijn ten eerste dat de geanalyseerde tekens dezelfde kant van een fenomeen of proces kenmerken (bijvoorbeeld, het toegestane kapitaal en het aantal werknemers kenmerken de grootte van de onderneming) en het is niet aan te raden om ze tegelijkertijd in het model op te nemen; ten tweede zijn factuurtekens samenstellende elementen van elkaar, dupliceren ze elkaar of geeft hun totale waarde een constante waarde (bijvoorbeeld stroomvoorziening en verhouding kapitaal / arbeid, het aandeel geleend en eigen vermogen). Als multicollineaire factoren in het model zijn opgenomen, dan zal de regressievergelijking geen echte economische relaties weergeven, zullen de modelparameters worden vervormd (overschat), de betekenis zal worden veranderd en de economische interpretatie van de regressie- en correlatiecoëfficiënten zal moeilijk zijn.

Daarom wordt bij het bouwen van een model een van de collineaire factoren uitgesloten op basis van een kwalitatieve en logische analyse, of worden de eerste faktuurtekens omgezet in nieuwe, vergroot. De kwaliteit en adequaatheid van het model voor een echt sociaaleconomisch fenomeen en proces wordt bepaald door de optimaliteit van het aantal factorborden: hoe meer factoren worden opgenomen, hoe beter het model het fenomeen en het proces beschrijft, maar een dergelijk model is moeilijk te implementeren; met een klein aantal factoren is het model niet voldoende adequaat.

Het probleem van het selecteren van factorborden en het verminderen van de dimensie van het model van meerdere correlaties wordt opgelost op basis van heuristische en multidimensionale analysemethoden. De heuristische analysemethoden omvatten de methode van expertbeoordelingen, gebaseerd op intuïtieve, logische vereisten en een inhoudelijke en kwalitatieve analyse van niet-parametrische indicatoren van communicatielaagheid: rangcorrelatiecoëfficiënten, concordantie. De meest gebruikte methode is stapsgewijze regressie , bestaande uit de sequentiële opname van factoren in het model en de beoordeling van de significantie ervan.

Wanneer een factor wordt geïntroduceerd, wordt bepaald hoeveel de som van kwadraten van residuen afneemt en de waarde van de meervoudige correlatiecoëfficiënt R toeneemt.Als de factor xk in het model is opgenomen, neemt de waarde van R toe en de regressiecoëfficiënt a k verandert niet of verandert enigszins, deze factor is significant en de opname ervan in het model nodig.

· De totaliteit van de onderzochte indicatoren moet homogeen zijn volgens de voorwaarden voor de vorming van effectieve en faktuurtekens (onderscheidende waarnemingen moeten van de totaliteit worden uitgesloten);

· Het resulterende attribuut moet de normale distributiewet gehoorzamen, de faculteit moet dicht bij de normale verdeling liggen. Als het volume van het aggregaat voldoende groot is (n> 50), kan de normaliteit van de verdeling worden bevestigd op basis van de berekening en analyse van de Pearson, Yastremsky, Kolmogorov, Boyarsky en andere criteria;

· Het gesimuleerde fenomeen of proces wordt kwantitatief beschreven (de parameters moeten een numerieke uitdrukking hebben) met een of meer vergelijkingen van oorzaak-gevolg-relaties. Het is raadzaam om causale relaties te beschrijven door lineaire of in de buurt van lineaire vormafhankelijkheden;

· Consistentie van de territoriale en temporele structuur van de bestudeerde populatie, de afwezigheid van kwantitatieve beperkingen op de modelparameters;

· Toereikendheid van bevolkingseenheden: hun aantal moet verschillende keren groter zijn dan het aantal factoren in het model. Elke factor zou ten minste 5-6 observaties moeten omvatten, d.w.z. het aantal factorsignalen moet 5-6 maal kleiner zijn dan het volume van de onderzochte populatie.

De be> correlatie en regressieanalyse zijn:

· Een voorlopige theoretische analyse van de essentie van het fenomeen, waardoor causale relaties tussen tekens kunnen worden vastgesteld, de be>

· Voorbereiding van eerste informatie , waaronder vragen over de adequaatheid van observatie-eenheden, de homogeniteit van de set van bestudeerde kenmerken en de nabijheid van hun verdeling naar de normale;

· De keuze van de vorm van de relatie tussen de prestatie-indicator en factoren op basis van de opsomming van verschillende analytische functies;

· De studie van de nauwheid van de relatie tussen de prestatie-indicator en factoren, alsook tussen factoren die gebaseerd zijn op de constructie van een matrix van gepaarde lineaire correlatiecoëfficiënten en screeningen van multicollineaire factoren;

· Selectie van significante (significante) factoren die zijn opgenomen in het multifactor model - de vergelijking van meervoudige regressie, gebaseerd op de overeenkomstige statistische methoden;

· Berekening van parameters van de meervoudige regressievergelijking en beoordeling van de significantie van geselecteerde factoren, correlatie en regressiecoëfficiënten met behulp van de criteria t- Student en F- Fisher ;

· Analyse van de resultaten.

De onderlinge verbanden tussen tekens worden in de regel geanalyseerd op basis van steekproefobservaties, om te controleren of de verkregen afhankelijkheden eerder regulier dan willekeurig zijn, de significantie (materialiteit) van de correlatie- en regressie-indicatoren wordt geschat.

Correlatie - regressieanalyse wordt gebruikt om de indicatoren van het businessplan en de regelgevingsniveaus van economische indicatoren te beoordelen, als gevolg van de efficiëntie van het gebruik van productiemiddelen, het identificeren van bestaande productiereserves, het uitvoeren van een vergelijkende analyse, het beoordelen van het potentieel van ondernemingen, kortetermijnvoorspelling van productieontwikkeling.

Met de meervoudige regressievergelijking kunt u de theoretische, mogelijke waarde van de effectieve indicator voor bepaalde waarden van factuurtekens vinden.

De parameters van de meervoudige regressievergelijking worden berekend met de kleinste kwadratenmethode op basis van het oplossen van een systeem van normale vergelijkingen. Voor een lineaire regressievergelijking met n factoren wordt een systeem opgebouwd uit (n + 1) normale vergelijkingen:

a 0 n + a 1 Sx 1 + a 2 Sx 2 + ... + a n Sx n = Sy,

a 0 Sx 1 + a 1 Sx 2 1 + a 2 Sx 1 x 2 + ... + a n Sx 1 x n = Syx 1 ,

:

a 0 Sx n + a 1 Sx 1 x n + a 2 Sx 2 x n + ... + a n Sx 2 n = Syx n .

De nabijheid van de relatie tussen de onderzochte indicatoren voor meerdere correlaties wordt bepaald op basis van verschillende coëfficiënten.

Gepaarde correlatiecoëfficiënten r meten de nabijheid van de lineaire relatie tussen de factoren en tussen het resulterende merk en elk van de factoren in kwestie zonder rekening te houden met hun interactie met andere factoren.

Partiële correlatiecoëfficiënten karakteriseren de mate van invloed van factoren op het resulterende kenmerk, op voorwaarde dat de andere factoren op een constant niveau worden vastgesteld. Afhankelijk van het aantal factoren waarvan de invloed is uitgesloten, kunnen bepaalde correlatiecoëfficiënten van de eerste orde zijn (met uitzondering van de invloed van één factor), van de tweede orde (met uitzondering van de invloed van twee factoren), enz.

De eerste-orde gedeeltelijke correlatiecoëfficiënt tussen y en x 1, exclusief de invloed van x 2 in een twee-factorenmodel, wordt berekend met de formule: .

waar r yx 1 , r yx 2 , r x1x2 - gepaarde correlatiecoëfficiënten tussen de overeenkomstige tekens.

De cumulatieve meervoudige correlatiecoëfficiënt, R, schat de nabijheid van de relatie tussen het resulterende attribuut en alle factoren. Dit is de hoofdindicator van lineaire meervoudige correlatie. Voor een twee-factorenmodel wordt de cumulatieve meervoudige correlatiecoëfficiënt berekend met de formule:

. De cumulatieve correlatiecoëfficiënt R varieert van 0 tot 1. Hoe kleiner de empirische waarden van de resulterende eigenschap verschillen van degene die zijn uitgelijnd >

De cumulatieve coëfficiënt van meervoudige bepaling , gelijk aan R2 , geeft aan hoeveel van de variatie van de resulterende eigenschap het gevolg is van de invloed van de factoren in het model.

De cumulatieve meervoudige correlatie-index karakteriseert de nabijheid van de relatie tussen het resulterende attribuut en alle factoren met een kromlijnige relatie:

= waarin - de dispersie van de resulterende eigenschap onder invloed van factoren die in het model zijn opgenomen; - resterende dispersie van de resulterende eigenschap, veroorzaakt door de invloed van factoren die door het model niet in aanmerking worden genomen. In de lineaire communicatievorm zijn de cumulatieve coëfficiënt en de meervoudige correlatie-index gelijk aan elkaar.

De significantie van de meervoudige correlatiecoëfficiënt R wordt bepaald door het F-Fisher-criterium. Wordt bepaald door de berekende waarde van F calc , die wordt vergeleken met de tabelwaarde van F crit . De coëfficiënt van meervoudige correlatie wordt als significant beschouwd, afhankelijk van de relatie: F calc > F crit .

of .

n is het aantal waarnemingen, m is het aantal parameters van de vergelijking.

F crit wordt geselecteerd volgens de tabel "Waarde bij een gegeven F - Fisher-criterium op significantieniveau " en .

Оценка существенности включения фактора в модель осуществляется по частному F – критерию Фишера. Фактор считается значимым при соблюдении соотношения: F расч > F крит .

Д л я фактора х 1 : ;

Для фактора х 2 : .





; Datum toegevoegd: 2014-01-25 ; просмотров: 40067 ; Maakt het gepubliceerde materiaal inbreuk op het auteursrecht? | | Bescherming van persoonlijke gegevens BESTEL WERK


Heeft u niet gevonden waarnaar u op zoek was? Gebruik de zoekopdracht:

Beste uitspraken: je kunt iets kopen voor een studiebeurs, maar niet meer ... 8096 - | 6601 - of lees alles ...

Zie ook:

border=0
2019 @ bgvarna.site

Pagina generatie over: 0.008 sec.