Kapcsolatháló elemző ABC

Letenyei László - Vedres Balázs: Kapcsolatháló e-kurzus (Az első hat alkalmat Letenyei László, a második hatot Vedres Balázs tartja). Vedres Balázs: Kapcsolatháló elemzés (a második hat alkalom tematikája)

7. Kétoldali (two-mode) hálók - alapfogalmak, ábrázolás
8. Kétoldali (two-mode) hálók - blokkok
9. Kohézív csoportok azonosítása
10. Kohézív csoportok ábrázolása
11. Statisztikai modellezés - QAP alapok
12. Statisztikai modellezés - QAP regresszió

7. lecke: Kétoldali (two-mode) hálók - alapfogalmak, ábrázolás

A hálózatok elemzése során az eddigiekben olyan hálózatokkal foglalkoztunk, ahol mindenki kapcsolatban lehet mindenkivel. Ez talán természetesnek tűnik. De a hálózatok egy fontos típusát alkotják azok a hálók, ahol két különböző típusú elem kapcsolódhat egymással. Jellegzetes módon ilyen hálózatok például az "affiliációk", amelyek emberek és csoportok egymáshoz tartozását ábrázolják. Ha a reláció a klub tagság, akkor csak arról van értelme beszélni, hogy egy adott ember tagja-e egy klubnak. Nem lehet egy ember tagja egy másik embernek, és egy klub sem lehet tagja egy másik klubnak. Ezért nevezhetjük kétoldalinak ezeket a hálózatokat, mert a két oldal definíció szerint elkülönül és csak a másik oldalhoz kapcsolódhat. Nézzünk most egy konkrét példát egy ilyen kétoldali hálózatra. Az adat file amivel dolgozunk embereket és szervezeteket tartalmaz. Az emberek azok, akik 1990 előtt az MSZMP politikai vagy központi bizottságának a tagjai voltak. A szervezetek pedig vállalatok és politikai, kormányzati intézmények, ahol ezek az emberek tisztséget töltöttek be 2001-ben. Az adatok tehát a volt államszocialista politikai elit pozícióit mutatják sok évvel a rendszerváltás után.

Az adat file neve: mszmp01.zip, amiben egy "kétrészes" UCINET file található.

FIGYELEM: AZ ADATOK CSAK A KURZUS CÉLJAIRA HASZNÁLHATÓK!

Az első feladat hogy nyissuk meg az adatbázist UCINET-ben, és a DISPLAY paranccsal rajzoljuk ki az adat mátrixot. Itt egy hasznos trükk az, ha a DISPLAY parancsnál a "print zeroes as" rovatnál kitöröljük a 0-át és egy üres helyet hagyunk helyette.

Az adatbázisnak 56 sora és 43 oszlopa van. (A pont 56 véletlenül jött ki.) Az adatok tehát nem egy "négyzet" alakú adatbázist alkotnak. A sorokon személyneveket láthatunk, az oszlopokon pedig szervezetek neveit. Mit lehet kezdeni egy ilyen adatbázissal?

Sok minden van amit nem tudunk alkalmazni az eddig tanultak során: -centralitást nem tudunk számítani (legalábbis nem egyszerű)
-strukturális ekvivalencia és blokkmodellezés máshogy működik
-kohézió nem alkalmazható

De:
-a kétoldali hálók átalakíthatók egyoldalú hálókká, méghozzá minden kétoldali háló két egyoldali hálóva alakítható. A klubtagságok emberekXklubok hálója átalakítható egy emberekXemberek és egy klubokXklubok hálóra. Figyelem: ez nem azt jelenti hogy az emberek tagok egymásban, vagy a klubok tagjai egymásnak. Ezek a származtatott hálók az átfedéseket mutatják:
kik azok az emberek akik legalább egy klubban tagon egyszerre, és melyek azok a klubok, ahol van legalább egy ember, aki mindkét helyen tag.

Ennek ellenére nyilvánvaló, hogy a kétoldali hálók érdekes információkat tartalmaznak, és fontos velük foglalkozni.

Tehát, nézzük az MSZMPések hálózatát.

Az első alkalommal a kétoldali hálók rajzolásával foglalkozunk. Nyissuk ki a NETDRAW programot, és nyissuk ki a hálónkat. Ehhez a FILE->OPEN->UCINET DATASET->2-MODE NETWORK parancsot használjuk. Nyissuk ki az "mszmp01" nevű adatot. A következőt kellene látnunk:

Ehhez javaslom, hogy a nyílhegyeket kapcsoljuk ki (PROPERTIES->LINES->ARROW HEADS->VISIBLE kikapcs).

Kétféle elem van az ábrán: piros körök és fekete négyzetek. A körök emberek, a négyzetek pedig intézmények, ahol pozícióban vannak ezek az emberek. (Feltűnhet, hogy olyan szervezetek is vannak itt mint az országos tervhivatal. Ez azért van, hogy a múltbeki kormányzati kötődések láthatóak
legyenek. A céges kapcsolatok csak 2001-esek.)
Ez az ábra még nem igazán átlátható. A következő lépésben szedjük ki az "MSZMP_Kozponti_Bizottsag" nevű szervezetet (jobb egérgomb, aztán delete), hogy jobban lássuk a többi pozíciót. A MSZMP KB kötődés most nem érdekes számunkra, mert tudjuk hogy mindenki (majdnem) ide tartozott. (A maradék néhány a politikai bizottságoz, ezt is kiszedhetjük.) Az így keletkező ábrát rendezzük el újra (a kis villám gombbal). A következőt kellene látnunk:

Sokan magukra maradtak. Ezek olyan emberek akiknek 2001-ben nem volt más pozíciójuk, csak a volt MSZMP KB, PB. Ezeket az embereket vegyük ki a további elemzésből az ISO gombra kattintva (igazából egy áthúzott ISO gombot kell keresni). Ezután az MDS gombra kattintva (multidimensional scaling) az
elkülönülő komponenseket láthatóvá tehetjük.

Most ezután használjuk a villám gombot. A "villám" igazából egy "spring embedder" algoritmus, azaz a statisztikai módszer elrendezéséből (az előbb használt MDS-ből) kiindulva úgy helyezi el a csomópontoka és a köztük lévő kapcsolatokat, hogy azok lehetőleg láthatók legyenek, ne legyenek egymás tetején. Azért spring embedder, mert kb úgy működik, mintha a kapcsolatok rugók lennének, amik megfelelő helyre rántják a csomópontokat. A következőt kellene látnunk:

Figyelem: a spring embedder nem statisztikai módszer, hanem iteratív (és ezért útfüggő) alkalmazás, tehát kétszer nagyon ritkán kapjuk ugyanazt az ábrát.
Most már szépen elkülönülnek a komponensek. Még egy dolgot tehetünk, színezzük az egyes komponenseket, hogy jobban látható legyen ki hova tartozik. Ezt az ANALYSIS-> COMPONENTS paranccsal tegyük.
A láthatósághoz mindig hozzátartozik egy kis kézi kiigazítás, az én ábrám a végén ilyen lett:

A feladat az hogy értelmezzük az ábrán látható struktúrát.
A következő alkalmakkal további adatokat nézünk a mostani szocialista párt és az MSZMP hálóinak összefüggéséről.

8. lecke: Kétoldali (two-mode) hálók - blokkok

Elemezzük tovább a politikusok és cégek hálózatát. A mostani alkalommal szintén egy kétoldali hálót elemzünk, és ezúttal átalakítjuk azt egyoldalivá (azaz a szokásos hálózati adatstruktúrát alkalmazzuk). Ezuton egy kibőv1tett adatbázissal dolgozunk, amelyben az MSZMP utolsó elitje mellett szerepelnek azok is, akik az MSZP politikai elitjébe tartoztak 1990 és 2001 között. A mostani alkalommal az mszp01.zip csomagban lévő adatbázisokat használjuk. AZ ADATOK CSAK AZ ÓRA KERETÉBEN HASZNÁLHATÓAK FEL.A ZIP file-ban három adatfile van:

mszp_mszmp_cegek - ez a politikusok céges pozícióinak kétoldali hálója, 177 ember 265 cég.
mszp_mszmp_attrib - ez a politikusok kategóriáját tartalmazó attribútum vektor, 1=MSZMP, 2=MSZP, 3=mindkettő
mszp_mszmp_affil - ez a politikusok származtatott egyoldalú hálója, az alábbiakban kiderül, hogyan jött létre.

Az első lépésként ismét ábrázoljuk a kétoldali hálót NETDRAW-ban.

Itt már túl sok a szereplő ahhoz, hogy a neveket is feltüntessük. Az adatfile-ban persze benne vannak a szemelynevek (cegnevek ezuttal nem), ugyhogy mindenki megkeresheti Apró Piroskát. (A félreértések elkerülése végett - ha érdeklődés van rá, a FIDESZ gazdasági hálóit is szivesen bemutatom.)Ezen az ábrán csak a legnagyobb komponens látható, piros körök a személyek, és kék négyzetek a cégek. Aki igazán szorgalmas, megprobálhatja reprodukálni az ábrát (a komponensek elemzésével), de ez nem feladat.A következő lépés a kétoldali hálózat egyoldalivá alakítása. Ehhez nézzünk először egy kis példát. Tegyük fel hogy három politikus pozícióit elemezzük: Péter, Gyula és Pál. Ők négy cégnél vannak pozícióban: Bank, Olajcég, Szalámigyár, és Erőmű. A következő kétoldali hálózatot találjuk:

Ebből kialakíthatunk egy olyan hálózatot, ami azt mutatja, ki hányszor szerepel együtt cégeknél. Más szóval kik között van affiliáció. Ezt a következő kis hálózat mutatja:

Péter kétszer szerepel együtt saját magával, azaz két pozíciója van összesen. Kétszer szerepel együtt Gyulával (a Banknál és az Olajcégnél), és csak egyszer Pállal (a Banknál). Gyulának összesen három pozíciója van, kétszer szerepel együtt Péterrel, és egyszer Pállal. Pálnak két pozíciója van, és egyszer szerepel együtt Péterrel (a Banknál) és egyszer Gyulával (szintén a Banknál).UCINET-ben ezt a következőképpen állíthatjuk elő: DATA->AFFILIATIONS

Mivel az emberek sajátmagukkal való együttszereplése nem túl értelmes, ezért az átlót cseréljük nullákra, a TRANSFORM -> DIAGONAL paranccsal.A hálózatnak a következőképpen kellene kinéznie:

Először is: miért van ennyi elszigetelt egyedülálló politikus? Ők azok akik olyan cégeknél vannak, ahol nincs más (baloldali) politikus, ezért az együtt-szereplések hálózatában elszigeteltek lettek. Az ábra közepén kirajzolódik egy nagy komponens, és a közepén egy sűrű csoport. Itt érdekes a neveket megnézni! Ezt mindenki megteheti a cimkék megjelenítésével.

A szineket az ábrán a politikai attribútum adat alapján adtam. Ezt a következőképpen tehetjük meg: NETDRAW-ban FILE->OPEN->UCINET DATASET->ATTRIBUTE DATA. Ezutan megadhatjuk, hogy a szineket az ujonnan kinyitott attributumok adják.

Jelen esetben a pirosak a volt MSZMP politikusok, a feketék az MSZP-sek, a kékek pedig akik mindkét elitben benne voltak. Mit lehet megállapítani a szinek alapján?

Most már egy egyoldalú, "szokásos" hálózattal dolgozunk, tehát alkalmazhatók a korábban tanult módszerek.

Mit mutat a fokszámok ranglistája?

Végül egy kérdésre kellene statisztikai alapon választ adni: Elkülönül-e az MSZP és a volt MSZMP elitje a gazdasági pozíciók hálózatában? Azaz: a gazdasági elit szempotjából beszélhetünk-e külön MSZMP és MSZP csoportról?

Ehhez az egyoldalú hálót osszuk blokkokra a politikai kötődés mentén. UCINET-ben TRANSFORM->BLOCK

Az eredménynek a következőképpen kellene kinéznie:

Mit jelentenek a "Reduced BlockMatrix" számai? A 306.000 azt jelenti, hogy a volt MSZMP csapaton belül 306 olyan eset van, hogy két politikus együtt szerepel egy cégnél. Az MSZP-n belül 40 ilyen eset van. Az MSZP és az MSZMP között 56 kapcsolat van. Mit jelent mindez? Sok vagy kevés? Szignifikáns a különbség? Egyáltalán mi között kellene a különbséget nézni?

A legfontosabb házi feladat: találjunk választ ezekre a kérdésekre. Annyit segítek hogy a kereszttábla-elemzés régi jó bevált módszereit kellene segítségül hívni.

9. lecke: Kohézió

A kohézió elemzése során az alapkérdés az, kik tartoznak jól elkülöníthető csoportokba, ahol a csoporton belüli kapcsolatok sűrűk, és a csoporton kívülre mutató kapcoslatok relatíven ritkábbak. Ez az elemzési szempont hasonlít a blokk elemzésre, de annak egy speciális esete. A blokk elemzés fogalmaival élve, itt olyan blokk-felosztást keresünk, ahol az átlóban lévő blokkok maximálisan sűrűek, míg az átlón kívüliek ritkák.

Nézzük az MSZP-MSZMP elitjének cégeken keresztüli affiliációit mint induló adatbázist (mszp_mszmp_affil). Elsőklnt NETDRAW-ban fogunk dolgozni.

A kohézió első fogalma amivel dolgozni fogunk a k-core (k-mag). A k-magok olyan csoportok, ahol a résztvevők mindegyike kapcsolódik a csoporton belüli többi résztvevőhöz. Minnél nagyobb a k-mag, annál erősebb kohézióról beszélhetünk. Belátható ugye, hogy három vagy négy ember esetén nem olyan nagy dolog, ha mindenki mindenkivel kapcoslatban van. Tizenöt ember esetén ugyanez már erős kohéziót jelent. Itt mindenkinek kapcoslatban kell lennie a másik tizennégy személlyel.

Nyissuk meg a NETDRW-ban az mszp_mszmp_affil hálózatot. Utána az ANALYSIS menüben válasszuk a K-CORES opciót. Valami ilyesmit kellene kapni:

A csomópontok színe a különböző k-mag csoportokat jelöli, a méretük pedig a k-mag méretével arányos. Az ábra közepén a piros nagy méretű pontok tartoznak a leginkább kohézív csoportba. A k-mag értéke itt 14, azaz ez egy 15 fős csoport ahol mindenki kapcsolódik a többi 14-hez.

A k-mag elemzés jó kiindulópont a kohézió elemzéséhez, de nem adja meg a kohézív csoportokat, hanem csak az azonos szintű kohézió szerint választja külön a csomópontokat. Nézzük például a rózsaszín pontokat - ugyannahoz a k-mag kategóriához tartoznak, de láthatóan nem egy csoportban vannak.

Most egy olyan módszert fogunk használni ami elvileg már elkülöníti a csoportokat is. Ehhez a UCINET-t használjuk.

Az első lépés az, hogy elemi átfedő kohézív csoportokat azonoítunk. Én az N-CLIQUE opciót választottam. Ritkább hálóknál a N-CLIQUE jobban működik, mint a CLIQUE. Az N-CLAN is használható szokott lenni, de itt valahogy nem adott értelmes eredményt. Ebből is látszik, hogy a hálózatelemzés, mint bármilyen más kutatási módszer, nem alkamazható gépiesen, nem nélközhető az elemzői érzék, intuíció.

Házi feladat: egy mondatban kérem definiálni a CLIQUE (klikk), N-CLIQUE (n-klikk), és N-CLAN (n-klán) fogalmakat. Aki talál különösen jó internetes erőforrásokat erről, kérem ossza meg a többiekkel.

Tehát UCINTE-ben dolgozunk, az első lépés az adatbázis dichotomizálása. A kohézív csoportok azonosításához csak azt az információt tudjuk figyelembe venni, hogy ki kivel kapcsolódik, a kapcsolat erősségét nem. Ezután a NETWORKS - SUBGROUPS - N-CLIQUES opciót választjuk.

Érdemes a minimum méretet 3 helyett 2-re állítani, hogy a diádok se maradjanak ki. (Ronald Breiger tanácsa.) Amire igazás szükségünk lesz, az az NClqOver nevű adatfile. Ez azt mutatja, ki hány N-klikkben szerepel együtt. Értelemszerően akik sokban szerepelnek együtt azok ugyanabba a kohézív csoportba tartoznak.

A következő lépés klaszter elemzés. TOOLS - CLUSTER - HIERARCHICAL. A következő ábra mutatja a beaállításokat.

Az eredmények közül a PART nevű file-ra lesz szükségünk. Ezt használhatjuk az eredeti hálózat blokk-felosztására.

A következő ábra illusztrálja, mit kellene látnunk. Elvileg az átlóbeli blokkoknak a lehető legsűrűbbnek kell lenniük.

A mátrix első nagy csoportja gyakorlatilag megegyezik a központi k-maggal. Az elemzés eredményeit ugyanúgy megjeleníthetjük NETDRAW-ban, mint a k.mag elemzés eredményeit.

Jól látszik, hogy itt mér nem a kohézió szintje, hanem az egyes kohézív csoportok vannak különféle színekkel jelölve. A kis párosok (diádok) mind különböző színűek például. Ismét elkülönül a központban a sűrű csoportosulás. Vannak gyengébb pontjai az emelzésnek, például a fekete és piros csoport között nem sok elkülönülés látszik.

Házi feladat: a kohézív csoportok definícióinak a felkutatása, és ugyanennek az elemzésnek az elvégzése klikkek és n-klánok alapján.

10. lecke: A kohézió ábrázolása

A kohézió elemzésének a témakörében most az ábrázolás további lehetőségeit vegyük sorra. Eddig a hálózati gráfban szinezéssel jelöltük a kohézív klasztereket. Most visszatérünk a kohézív csoportok átfedéseinek az elemzéséhez. A klaszterelemzés során ezeket az átfedéseket megszüntettük, mintegy erőszakkal határokat (klaszter határokat) húztunk az átfedéseken keresztül.

Most a klikkek átfedéseit ábrásolással vizsgáljuk. Az első megközelítés a klikkek átfedéseinek a közvetlen vizsgálata. A hálózatban azonosított klikkeket tulajdonképpen egy kétoldalú hálóként is felfoghatjuk. Elsőként tehát ábrázoljuk a klikkek kétoldali hálózatát. Most az egyszerűség kedvéért klikkeket (tehát nem 2-es klikkeket vagy klánokat) elemzünk.

Házi feladat annak kipróbálása, hogy mit látunk 2-es klikkekkel.

A kiindulópont az mszp_mszmp_affilGT0 nevű hálózat, ami a cégeken keresztüli affiliációk dichotomizált egyoldalú hálója. Azonosítsuk a klikkeket UCINET-ben. A klikkek elemzése során kaptuk a CliqueSets nevű kétoldali hálót. Ezt fogjuk most NETDRAW-ban ábrázolni.

A kohézió elemzésében mi az amit eddig nem láttunk? Az átfedések vizsgálatával különféle kohézíokat különböztethetünk meg. Ha csak az átfedések számát nézzük, akkor nem tudjuk elkülöníteni azt az esetet, ahol egy nagyobb csoport egyetlen nagy klikkben szerepel együtt (homogén kohézió) attól, ahol egy ugyanakkora csoport több klikkben szerepel, de mindegyikben csak a csoport egy része van benne (persze úgy hogy az átfedések miatt megvan a csoport kohézíója) (fragmentált kohézió). Ennek a kétféle kohézíónak a szociológiai tartalma is más: az első esetben mindenki lát mindenkit, egy közös nyilvánosságról van szó. A második esetben a csoport fragmentáltabb, és sokkal nagyobb tere lehet a koalícióalkotásnak, mások kijátszásának.

Az átfedések kétoldali hálójában a homogén kohéziót az jelzi, ha egy klikk körül nagyobb csillag alakzatot látunk. A fragmentált kohézió esetén sok kevés tagú klikk hálózatát látjuk.

A kétféle kohéziót még jobban elkülöníthetjük, ha az átfedések egyoldali hálóját ábrázoljuk. Ez a CliqueOverlap nevű hálózat. NETDRAW-ban a PROPERTIES-LINES-SIZE-TIE STRENGTH használatával adhatjuk ezt meg. Én 10-re állítottam a legvastagabb vonalat. A kovetkező ábra ezt mutatja.

Jól látható, hogy a kohéziónak két típusa van. A középső régió bal oldalán egy homogén kohéziójú csoportot látunk. Itt sokan vannak egymással összekötve, de a vonalak vékonyak. Mit jelent ez? Sokan tartoznak egymáshoz, de kis számú klikkben vannak benne, tehát az össszetartozásukat egy (vagy kevés) nagy klikk biztosítja. Itt nincsenek olyan klikkek ahonnan mások ki vannak zárva. Ezzel ellentétben a bal oldali rész vastag vonalakból áll. Itt fragmentált kohézió a jellemző. Ezek a szereplők kisebb csoportok átfedéseiben szerepelnek.

Házi feladat: nézzük meg a neveket, és próbáljuk jellemezni a kétféle kohézióval rendelkező csoportot. Van-e a kohézió típusának összefüggése a politikai stratégiával?

11. lecke: QAP alapok

A hálózatelemzés eddig tanult módszerei a hálózatok ábrázolására, csoportok, blokkok felfedezésére szolgáltak. Ezek a módszerek nagyrészt leíró jellegűek voltak, most olyan módszert veszünk, ami hipotézisek statisztikai ellenőrzésére is alkalmas. Az utóbbi évtizedben számos statisztikai módszer jelent meg hálózati hipotézisek tesztelésére. Ezek legtöbbje statisztikai szempontból bonyolult, kisebb hálózatok esetén is nagy számításigényű, és az értelmezés sok esetben nehézkes. (Gondolok itt elsősorban Tom Snijders vagy Stanley Wasserman modelljeire.) Mi egy olyan módszert veszünk sorra, ami viszonylag egyszerű, kis számításigényű, és az értelmezés megszokott. Ez a Pearson korreláció és a lineáris regresszió hálózatokra alkalmazott modellje.

Hogyan jön a korreláció a hálózatokhoz? Mi között számítunk itt korrelációt?

Először is szükségünk van két hálózati adatbázisra, amelyek ugyanarról a csoportról szólnak (tehát ugyanazok a szereplők vannak bennük, ugyanolyan sorrendben). Ezután korrelácót számíthatunk a két mátrix között a megfelelő cellák öszehasonlításával. Ezt hívják Qadratic Assignemnt Procedure-nek (QAP). Ha a korreláció 1, akkor a két hálózat tökéletesen megegyezik. Ha a korreláció -1 akkor az egyik hálózatban ott vannak kapcsolatok ahol a másikban nincsenek.

Házi feladat: találjunk ki példákat olyan hálózatokra, ahol a relációk közötti korreláció erős pozitív (+1-hez közeli), és ahol erős negatív (-1-hez közeli).

Eddig a pontig a módszer semmiben sem különbözik egy szokásos korreláció számítástól. A proléma a hagyományos módszer alkalmazásában ott van, hogy a szignifikancia becsléséhez nem használhatjuk a T vagy F próbát, mivel azok alkalmazása azon a feltevésen nyugszik, hogy az esetek függetlenek. Ez a hálózatok esetében nem igaz.

Miért nem igaz ez a feltevés? Egyáltalán, mik az esetek?

A hálózatok közötti korreláció számításánál az esetek a diádok. Tehát ha egy 20 személyes hálózatunk van, akkor 20x20=400 esetünk van. Ha az átló nem értelmezett, akkor 400-20=380 esetünk van.

Ezek az esetek nem tekinthetők függetlennek. Józsi és Béla kapcsolata egymással nem tekinthető függetlennek Józsi és Krisztina kapcsolatától. Ha azt gondoljuk, hogy függetlennek tekinthető, nincs szükségünk hálózatelemzésre. Az egész hálózati gondolkodás alapfeltevése a diádok összefüggése. Ha ebben nem hinnénk, semmi értelme nem lenne, hogy ezeket a szép gráfokat rajzolgassuk!

Az esetek függetlenségének a feltevése nem tartható, így a korreláció szignifikanciájának a becslésére is új módszerre van szükség. Ez a módszer a permutációs teszt. A szignifikancia teszt általában azt a hipotézist teszteli, hogy a tapasztalt eredmények (pl korreláció) a véletlen játékának az eredménye. Ha az esetek függetlenek, a véletlen játékát jól leírhatjuk viszonylag egyszerű függvényekkel. Ha az esetek függetlenek, ez nem ilyen egyszerű. A permutációs teszt lényege, hogy közvetlenül áll1tjuk elő a véletlen játékát. A kiindulópont az eredeti korreláció. Ezután az egyik mátrixot összekeverjük (a sorokat és oszlopokat permutáljuk), és a kevert mátrix és a másik, eredeti között ismét kiszámítjuk a korrelációt. Ezt megsimételjük sokszor (általában több ezerszer), és a kapott korrelációkat összehasonlítjuk az eredetivel. Ha a véletlen permutációk során 1000-ből 200 esetben kaptunk az eredetivel egyenlő vagy annál nagyobb korrelációt, nem igazán mondhatjuk, hogy az eredeti korreláció nem lehet a véletlen műve. 20% a valószínűsége, hogy a véletlen játéka is ad ekkora korrelációt. Ha csak a permutációk 5%-a adna ilyen nagy korrelációt, már biztosabban állíthatnánk, hogy elvethető a véletlen mint hipotézis.

A következő példa egy kisvállalat szervezeten belüli kapcsolatairól szól. 20 ember dolgozik ebben a cégben. Két kapcoslatot hazonlítunk most össze, a munka során előforduló tanácskérést (A tanácsért megy B-hez) és a munkán kívüli barátkozást (A barátnak tartja B-t).

Az adatok a kisvall.zip file-ban vannak tömörítve. A következő ábrán a tanácskérés és barátkozás kapcsolatai láthatók.

A QAP korrelációt a UCINET-ben a kovetkezőképpen számíthatjuk ki: TOOLS-STATISTICS-MATRIX-QAP CORRELATION. A következő ábrán látható mit kell megadnunk. Két adatmátrix kell - ez esetben a "tanacs" és a "barat" nevű hálózatok. A permutációk számának 10000-et adtam meg, lassabb gépeken ez lehet kisebb, de 1000-nél ne legyen kevesebb.

A következő ábra mutatja az eredményt.

Minket igazából csak a Pearson correlation és a hozzá tartozó szignifikancia szint érdekel. A korreláció a barátság és a tanácskérés relációja között 0.316. Mit jelent ez? Hogy ha van tanácskérési kapcsolat két ember között, akkor nagyobb valószínűséggel találunk barátsági kapcoslatot is. A szignifikancia szint 0.000. Mit jelent ez? Az elvégzett tízezer véletlen permutáció esetében egyszer sem találtunk 0.316-al egyenlő vagy annán nagyobb korrelációt. Nyugodtak lehetünk, hogy csak a véletlen nem lehet a két reláció együttjárásának az oka.

Házi feladat: számítsuk ki a tanácskérés és segítségnyújtás ("segitseg" nevű háló), valalmint a barátság és segítségnyújtás közötti korrelációt is, értelmezzük az eredményeket.

12. lecke: QAP regresszió

Az előző alkalommal párosával hasonlítottuk össze a hálózatokat, és teszteltük a véletlen mint hipotézis magyarázó erejét. Most több hálózati változóból építünk regressziós modelleket. A módszer nagyon hasonló lesz, szintén azonos méretű mátrixokkal fogunk dolgozni, és szintén permutációs tesztet alkalmazunk az együtthatók szignifikanciájának a becsléséhez.

Ismét a kisvállalat húsz dolgozójának a hálózatát elemezzük. Most már többváltozós módszerrel dolgozunk, tehát ki kell választanunk a függő változót, amit magyarázni szeretnénk. Az itt használt példában a tanácskérés relációja lesz a függő változó. Mit jelent az hogy egy hálózat a függő változó? Azt jelenti, hogy a dolgozók között tanácsadási kapcsolatok meglétét vagy hiányát szeretnénk modellezni más változók alapján. A kérdés az: mia alapján választanak tanácsadókat a dolgozók?

A következő független változókat fogjuk használni:

osztaly - azonos osztályba (szervezeti alegységbe) tartozók - a hipotézis az, hogy az azonos osztályba tartozók fognak egyméshoz tanácsért menni.

hier - szervezeti hierarchia, azonos illetve alsóbbtól a felsőbbek felé mutat kapcsoalt, de a felsőbb szinten lévők nem kapcsolódnak az alsóbb szinten lévőkhöz - a hipotézis az, hogy a felsőbb szinten lévők nem kérnek tanácsot a lejjebb lévőktől.

szmszkapcs - az SZMSZ által előírt kapcsolódások a dolgozók között (szervezeti folyamatok darabszáma, ahol kapcsolódniuk kellene) - a hipotézis az, hogy a tanácskérés követi az SZMSZ-ben előírt folyamatokat.

tapasztalt - a dolgozók munkábaállási éve közötti különbség - a hipotézis az, hogy ahhoz mennek a dolgozók tanácsért, aki régebb óta dolgozik, mint ők, tehát több a tapasztalata

egyuttido - a két dolgozó szervezetnél töltött odejének közös hányada - a hipotézis az, hogy minnél több időt töltött együtt két dolgozó, annál nagyobb a valószínűsége a tanácsadási kapcsolatnak.

tudastbecsul - mások tudásának nagyra becsülése - a hipotézis itt az, hogy akinek a tudását nagyra becsülik, attól kérnek tanácsot.

ismerte - ismerték egymást már mielőtt a céghez érkeztek - a hipotézis az, hogy akik korábban is ismerték egymást, azok mennek egymáshoz tanácsért.

Lássuk a regressziós modellt. UCINET-ben a következőt kell választanunk: TOOLS-STATISTICS-MATRIX-REGRESSION-ORIGINAL.

A függő változó a tanacs, a független változóknak pedig sorban gépeljük be a fent felsorolt hálózatokat:

A kövekezőhöz hasonló eredményeket kellene kapnunk:

Összességében jól illeszkedik a modell, a tanácskérési kapcsolatok varianciájának 32,9 százalékát tudjuk magyarázni.

Nézzük sorban a hipotéziseket.

A szervezeti egységek, osztályok számítanak a tanácsadásban, az OSZTALY együttható szignifikáns. Tehát akik egy osztályban dolgoznak inkább egymáshoz mennek tanácsért, mint osztályon kívüliekhez.

A szervezeti hierarchia szintén számít, a HIER változó szignifikáns. Tehát a főnökök nem valószínű, hogy tanácsot kérnek a beosztottaktól.

Az SZMSZ-ben előírt kapcsolatok, a szervezeti tapasztalat, és az együtt töltött idő nem látszik befolyásolni a tanácsadók kiválasztását.

Ha valaki nagyra becsüli valaki másnak a tudását, akkor inkább fog tanácsot kérni tőle, mint a kevésbbé becsült tudásúaktól.

Érdekes módon a korábbi ismerettség erősen befolyásolja a tanácsadók választását. Úgy látszik a korábbról meglévő kapcsolat olyan bizalmat ad, amit a szervezetnél nem lehet megszerezni.

Házi feladat: teszteljük ugyanezeket a hipotéziseket a segítség és a barátság relációira is. Értelmezzük az eredményeket. Mit lehet mondani a három reláció modelljeinek az összehasonlításával?

VÉGE A KURZUSNAK, KÖSZÖNJÜK A MUNKÁT!