Kürtösi Zsófia

2002, kézirat

 

 

A társadalmi kapcsolatháló elemzés módszertani alapjai[1]

 

A társadalmi kapcsolatháló elemzés, a hálózati elvű megközelítés a szociológia egyik legfiatalabb irányzata. Megjelenése a múlt század első harmadára tehető, fejlődésében azonban a 70-es évek hoztak nagy fordulatot, amikor sor került néhány fontos módszertani innováció bevezetésére. Az ekkor kidolgozásra kerülő módszertan és megközelítési mód az, ami az irányzat sajátos arculatát meghatározza. A hálózati megközelítés egyik kritikája éppen ezt a nagyon sajátos technikai alapot veszi célba és a „technikai apparátus kifinomultsága kapcsán egyfajta módszertani formalizmus, öncélúság veszélyét” hangsúlyozza (Tardos, 1995:77).

Az itt következő oldalakon a hálózatelemzés módszertani alapjait kívánom áttekinteni különös tekintettel arra, hogy milyen előnyöket, milyen újdonságokat hoz a hálózatelemzés a szociológiai megközelítésben és adatelemzésben.

 

Az első probléma annak meghatározása, hogy mit értünk társadalmi kapcsolathálózaton. Stanley Wasserman és Katherine Faust (1994) a következő definíciót adja erre: a társadalmi háló cselekvők véges számú „készletéből”, valamint a köztük fennálló kapcsolatokból (relations) áll. A cselekvők lehetnek egyének, szervezetek, vállalatok, nemzetek, azaz kollektív társadalmi egységek is, a kapcsolatot pedig a cselekvők közt fennálló meghatározott típusú kötések halmazaként határozhatjuk meg. Hogyan definiálhatjuk és jellemezhetjük ezeket a kötéseket? A „kötés” (tie) definíció szerint cselekvők közt létesít összeköttetést, mely összeköttetés különböző tartalommal bírhat, így jelentheti anyagi (pl. csere, kereskedelem, ajándékozás, kölcsönzés) vagy nem anyagi (pl. információ, tanács, segítségnyújtás) erőforrások transzferálását egyik aktortól a másikig, biológiai kapcsolatot (rokonság, házasság), fizikai összeköttetést (út, híd, rendszeres közvetlen buszjárat települések közt, személyek egymás mellett ülése), társulást, csoporthoz tartozást (klubtársak), egy személy értékelését a másik által (barátság, tisztelet kifejezése) vagy éppen formális kapcsot (autoritás, hatalom). A hálózatok túlnyomó többségben olyan aktorok közt definiáltak, melyek ugyanahhoz a „készlethez”, csoporthoz tartoznak (mindannyian szomszédok, iskolatársak stb.), ugyanakkor elképzelhetők un. több-módú (mode) hálózatok, ahol az aktorok kettő vagy több különböző típusú csoporthoz tartoznak, így például egy lehetséges több-módú hálózat a segélyező szervezetek és a rászoruló egyének közt fennálló kapcsolatháló, ahol a támogatások áramlását vizsgálhatjuk a két csoport között, vagy a személyek és társasági események közt fennálló kapcsolatok, ahol az egyének részvételét vizsgáljuk ez egyes eseményeken. Ezekben az esetekben többfajta hálózati vizsgálat is elképzelhető, mivel nemcsak a két vagy több különböző típusú aktorcsoport közt vizsgálhatjuk a kapcsolatokat, hanem az egyes csoportokon belül is, azaz például a segélyszervezetek közti kapcsolatokat is feltárhatjuk.

 

A hálózatelemzésnél két fajta változó áll rendelkezésünkre. A strukturális változók az aktorok közt fennálló különböző kötéseket jellemzik, mérik. A kötések egyik jellemző lehetséges tulajdonsága az irányítottság. Az irányított kötéseknek van kezdőpontjuk és irányuk, azaz az egyik aktortól a másikig mutatnak, olyan kapcsolatok jellemezhetők ezzel, mint az országok export tevékenysége, vagy pénz kölcsönzése. Egy másik lehetséges tulajdonság a kötés dichotóm vagy értékkel rendelkező volta: a dichotóm kötéseknél csak a kötés jelenlétét vagy hiányát detektálja a kutató, míg az értékkel rendelkező kötéseknél a kötés értéke utalhat az erősségre, gyakoriságra, intenzitása. A másik változótípus a hálózati vizsgálatoknál az un. kompozíciós változó, ami az aktorok tulajdonságairól nyújt információt, így személyek esetén korról, nemről, társadalmi hovatartozásról, iskolában szerzett jegyekről, szervezetek esetén a dolgozók számáról, adózott eredményről, a bejegyzés dátumáról vagy éppen az üzleti célokról.

 

A hálózati határok, mintavétel

A populáció meghatározása valamint a mintaválasztás a hálózatelemzés egyik kulcsproblémája. A kutató viszonylag könnyű helyzetben van akkor, ha a vizsgálat fókuszában az aktorok viszonylag kicsi és valamilyen külső tényező által lehatárolt, jól definiált csoportja áll, például a szervezet egy osztálya, egy klub tagjai, óvodai csoport vagy egy falu lakossága. Egyéb esetekben a kutatónak magának kell döntenie, hogy hol húzza meg a hálózati vizsgálat kereteit, ez azonban azzal a veszéllyel jár, hogy meghatározó kapcsolatok kerülnek átvágásra. Ennek kivédésére gyakran alkalmazott módszer az interakciók gyakorisága, a kötések intenzitása alapján meghatározni a populációhoz tartozó aktorok készletét. Egy másik definíciós lehetőséget alkalmazott Laumann, Marsden és Prensky (1989), akik a realista megközelítést alkalmazva azokat tekintették hálózati tagnak, akiket maguk a hálózat szereplők tartottak annak, így például Laumann és Pappi (1973) közösségi vezetőket kérdezett meg arról, kiket tekintenek a közösség további befolyásos szereplőinek. A másik lehetőség az un. nominalista megközelítés, ahol elméleti alapokon húzzák meg a hálózati határokat, ilyenkor a hálózati tagok nem feltétlenül érzik magukat egy közösségbe tartozónak, mégis fennáll köztük valamiféle kapcsolat.

Azokban az esetekben, mikor nem vehető számba az összes aktor, vagy nem húzhatók meg a hálózati határok, különböző mintavételi technikákat kell alkalmazni annak érdekében, hogy meghatározható legyen az aktorok egy megszámlálható és mérhető mennyisége. A minta azt a célt szolgálja, hogy valamilyen módon reprezentálja az egész, a kutató számára fontos sokaságot, így a mintajellemzőkből becsülhetők a sokasági jellemzők. A hálózatok vizsgálatánál a mintában fellelhető kapcsolatok, kötések összességéből vonnak le következtetéseket a teljes hálózat hálózati jellemzőire, például a hálózati sűrűségre, a kötések szorosságára vagy a reciprocitás fokára vonatkozóan. Speciális hálózati vizsgálatnak tekinthetők az ego-centrikus hálózatok, ahol nem a teljes hálózat a vizsgálat tárgya vagy egy ebből vett minta, hanem egymástól izolált egyedek, és a körülöttük kirajzolódó hálózati mintázatok. Ebben ez esetben a mintavétel követheti a hagyományos mintavételi eljárásokat. Ego-centrikus hálózatok jellemzőit vizsgálta például az amerikai General Social Survey, ahol a kutatók egy átlagos amerikai beszélgetési hálózatait kívánták feltérképezni, de születtek ilyen jellegű vizsgálatok Magyarországon és Franciaországban is. Az ego-centrikus hálózatokat gyakran alkalmazzák szociális támogató rendszerek felmérésére is. Számtalan hipotézis van arra nézve, hogy az egyén körülvevő hálózat mennyiben határozza meg a fizikai és érzelmi jólétet.

 

Az adatgyűjtésre felhasználhatók a hagyományos szociológiai, antropológiai módszerek, mint kérdőív, interjú, megfigyelés, kísérlet, de emellett léteznek más adatgyűjtési módok is.

A kérdőív talán a leggyakrabban alkalmazott technika. Főként személyek, vagy személyek révén megtestesülő szervezetek közti kapcsolatok felmérésére alkalmas. Több jellegzetes kérőív szerkesztési mód vagy kérdéstípus különböztethető meg a hálózati adatok gyűjtésénél, így például alkalmazhatunk előre generált névlistát, ahol a megkérdezettet arra kérjük, jellemezze kapcsolatait a listán felsorolt személyekkel, de hagyatkozhatunk a válaszadó szabad emlékezetére is, ilyenkor a megkérdezettek maguk generálják a kapcsolati névlistát. Gyakran a kutatók csak meghatározott számú kapcsolatra kíváncsiak, így előre maximálják a lehetségesen megadható válaszok számát, például arra kérik a válaszadót, hogy sorolja fel a három legjobb barátját. Egy másik lehetőség, ha nem korlátozzák a leírható kapcsolatokat, így a válaszadók maguk döntik el, hány kapcsolatot sorolnak fel. Jellemző a kapcsolatok fontosságának értékeltetése, amit megtehetünk a kapcsolatok rangsoroltatásával vagy pontoztatásával.

A kérdőív mellett az interjú is használható módszer, főképp azokban az esetekben, mikor a kérdőív túl személytelen és több információval kecsegtet személyes kapcsolat fenntartása, például vállalati felsővezetők esetén (Galaskiewicz, 1985).

A harmadik lehetséges adatgyűjtő módszer a megfigyelés. Ez különösen akkor használható jó hatásfokkal, ha kis közösségek személyes kontaktusait akarják vizsgálni, de akkor is megfelelő, ha az alanyok nem képesek verbális kommunikációra illetve kérdőív kitöltésre így például bölcsődei csoport esetén, vagy állatok kapcsolatainak feltérképezésénél. Ez az adatgyűjtési mód különösen jól használható olyan hálózatok leírásához is, mikor az aktorok közti kapcsolatot az eseményeken való részvétel jelenti.

A kapcsolatok felderítését régebbi feljegyzések is segíthetik: naplók, újságok, levéltári anyagok, klubok tagsági listája, így például az elit vizsgálatokhoz felhasználhatók újságok társasági, vagy gazdasági egyesülésekről, igazgatótagsági változásokról szóló hírei, az innováció terjedésének vizsgálatára pedig felhasználhatók tudományos lapok az idézettség megállapítására.

Kevésbé használt, speciális adatgyűjtési mód a kognitív társadalmi struktúra feltérképezés, ilyenkor arról kérdezzük az alanyt, hogy hogyan gondolkodik a környezetében lévők kapcsolatairól. Krackhardt és Porter (1985) például egy gyorsétterem munkatársait kérdezte arról, hogyan érzékelik a munkatársaik közti baráti kapcsolatokat.

Egy másik ritkábban használt adatgyűjtés a kísérlet, ahol az aktorok közti kapcsolatokat kísérleti környezetben vizsgálják, a kísérletvezető előre meghatározhatja a hatalmi pozíciókat vagy akár a lehetséges kommunikációs utakat.

A speciális hálózati adatgyűjtési módokhoz tartozik a kisvilág vizsgálat is. A kisvilág vizsgálat annak meghatározására szolgál, hogy a válaszadó milyen távol áll egy előre meghatározott célszemélytől az ismeretségek tekintetében. Nemcsak a láncok hossza érdekes, hanem a láncban résztvevő aktorok tulajdonságai is. Milgram (1967) volt az első aki ezt a vizsgálati módot alkalmazta. Az indító populációtól egy csomag eljuttatását kérik egy előre meghatározott célszemély részére, úgy, hogy megadják a célszemély különböző adatait és azt kérik a láncindítóktól, hogy olyan embernek adják tovább a csomagot, aki személyes ismerősük és akiről feltételezik, hogy ismerheti a célszemélyt. A láncban résztvevők ráírják nevüket a továbbküldött csomagra, így az nem megy kétszer ugyanazon az úton, illetve küldenek személyes adataikról egy feljegyzést a kutatónak is, aki így össze tudja hasonlítani a sikeres és sikertelen láncok különböző jellemzőit.

A keresztmetszeti vizsgálatok mellett a hálózati kutatók számára is fontosak a longitudinális adatok, ahol a hálózati jellemzők, kapcsolatok időbeni változását vizsgálják. Az egymást követő időszakokban újra és újra lekérdezik a kapcsolat hálózatot, így fény derül a kapcsolatok stabilitására vagy a kapcsolati evolúcióra. Ilyen longitudinális vizsgálatot végzett például Veronique Schutjens és Eric Stam, akik induló vállalkozások kapcsolatainak alakulását vizsgálták az indulást követő három éven át.

 

A hálózati adatok mérésének problémái

Születtek vizsgálatok arra vonatkozóan is, hogy vajon mennyire precízek a válaszadók által megadott kapcsolati adatok. A vizsgálatokat folyamán egyrészt megfigyelték a válaszadók interakcióit, kapcsolathálózatát, másrészt megkérdezték őket kapcsolataikról. Azt tapasztalták, hogy a válaszadók által közölt adatok körülbelül fele valamilyen módon hibás, eltér a megfigyeltektől. Ugyanakkor más kutatók arra hívták fel a figyelmet, hogy azok az igazán fontos kapcsolatok, interakciók, amikre a válaszadó jól emlékszi, mert ezek adják az interakciók stabil mintázatát. A precizitás kérdése azokban az esetekben is felmerül, mikor szervezetek kapcsolatai a kutatás célpontjai és a kutató nem a kompetens személytől szerez információkat.

 

Kapcsolathálók megközelítésmódjai

Gráf-elméleti megközelítés

Az egyik legismertebb és legrégebben használt hálózati megközelítés a gráfelmélet alkalmazása. Az elmélet azért adja hasznos megközelítését a kapcsolathálóknak, mert egyrészt megvan a megfelelő szókészlete a hálózati alakzatok leírására, másrészt biztosítja a matematikai alapokat a hálózati jellemzők mérhetőségéhez. A gráfok jól modellezik a valós kapcsolathálókat és képesek vizualizálni olyan kapcsolati mintázatokat, melyek egyébként felfedezetlenek maradnának.

A gráfok pontokból és az őket összekötő vonalakból álló alakzatok. A pontok az aktorokat jelzik, a vonalak pedig a köztük lévő kapcsolatokat. A legegyszerűbb esetben a vonalak nem irányított, dichotóm relációt jeleznek, azaz a vonal léte vagy nem léte a kapcsolat létére vagy nem létére utal és a kapcsolat iránya nem meghatározott, így például a barátság hálózatok ezen gráffal nem ábrázolhatók, hiszen a barát választása már irányított kapcsolatot jelent, mivel elképzelhető, hogy az egyik személy megjelöli a másikat barátjaként, de ez a választás nem kölcsönös. Nem irányított gráfokkal például házassági, rokonsági vagy munkakapcsolatok (együtt dolgozik valakivel) jól ábrázolhatók. Fontos megjegyezni, hogy amennyiben a gráfot ábrázoljuk, a pontok elhelyezkedése, valamint a vonalak hossza nem hordoz információt. Két izomorf (a két gráfban ugyanazok a pontok kapcsolódnak) gráf teljesen eltérően is ábrázolható, a pontok elhelyezkedése segítheti vagy ronthatja a gráf értelmezését (ld. 1. ábra). Az ábrázolt gráfot szociogramnak is nevezik.

 

1. ábra: Izomorf gráfok

 

 

 

 

 


Elképzelhető, hogy a kutató a kiválasztott csoport egy részét akarja valamilyen szempontból tanulmányozni: párokat, hármasokat vagy más alcsoportokat. Ennek megfelelően a gráfok tekintetében beszélhetünk diádokról, triádokról vagy általánosan algráfokról. Az algráf az eredeti gráf pontjainak és vonalainak egy részét tartalmazó gráf. Beszélhetünk pont és vonal generálta algráfokról. A pont generálta algráf az eredeti gráf pontjainak egy részét tartalmazza és hozzá az összes, e pontok közt az eredeti gráfban is fennálló vonalat, míg a vonal generálta algráf az eredeti gráf vonalkészletének egy részét tartalmazza és mindazokat a pontokat, amiket ezek a vonalak összekötnek. A diádok és triádok is algráfok: a diád egy aktorpár, akik közt vagy van vagy nincs kapcsolat, míg a triád három pontot tartalmaz, és a köztük lévő kapcsolattól függően négy lehetséges állása van (egyik pont közt sincs kapcsolat, egy pár közt van kapcsolat stb.). Granovetter (1973) szerint amennyiben a vonal erős kapcsolatot jelöl, az a triád, amiben csak egy vonal hiányzik, elég valószínűtlen, mivel ez azt jelentené, hogy egy személy két másikhoz kapcsolódik erős kötésekkel, de az a kettő nem ismeri egymást.

A pontokat jellemezhetjük a velük összeköttetésben lévő vonalak számával, ez a pont foka (degree). A fok legkisebb értéke 0, ha a pontnak nincsenek kapcsolatai, azaz izolált, maximális értéke g-1, ahol g a gráf pontjainak száma. A fok az adott fokkal jellemzett aktor aktivitását mutatja, mivel nem irányított gráfról beszélünk, nem különböztetjük meg, hány kapcsolatot küld vagy fogad az aktor, csak azt, hány kapcsolatban „van benne”. A gráf jellemezhető az átlagos fokkal is, ahol a számlálóban a gráfban lévő pontok fokainak összege, a nevezőben pedig a pontok száma található:

 

A fokok varianciája is kiszámítható, azaz, az egyes pontok fokainak átlagtól való átlagos eltérésének négyzete.

 

Ez a mutató arra világít rá, milyen mértékű különbségek vannak az aktorok aktivitásai közt, ami a centralitás számításának egyik alapja.

A gráfot jellemezhetjük sűrűségével is. A sűrűség azt mutatja meg, hogy az összes lehetséges kapcsolatból mennyi található meg a valóságban. A mutató számlálójában a meglévő kapcsolatok száma, nevezőjében a lehetséges maximális kapcsolatszám található. Ez nem irányított gráfoknál g(g-1)/2, míg irányított gráfoknál g(g-1). A mutató maximális értéke 1, ha minden lehetséges kapcsolat fellelhető, míg 0, ha nincsenek kapcsolatok.

          ahol L a gráfban fellelhető vonalak száma

 

A gráfbeli pontoknál nemcsak a közvetlen összeköttetések, hanem a közvetett kapcsolatok is fontosak, azaz hogy el lehet-e jutni egyik pontból a másikba, és ha igen, hány útvonalon és hány köztes pont érintésével. Az elméletalkotók különböző kategóriákat alkottak a gráf ezen jellemzőinek megnevezésére: walk, trail, path, tour, cycle. Az egyik legfontosabb a sétány (walk) definiálása, ami pontok és a hozzájuk tartozó vonalak sorozatából áll, ponttal kezdődik és végződik. A sétány esetében nincs kikötés arra vonatkozóan, hogy a kezdő és végpont azonos legyen-e, illetve az sem tiltott, hogy a pontok vagy vonalak többször is szerepeljenek a sorozatban. A sétány hossza megegyezi a benne foglalt vonalak számával, amennyiben egy vonal többször is előfordul, akkor az előfordulásnak megfelelően kell beszámítani. Szigorúbb kikötések vonatkoznak az ösvényre (path), ami szintén pontok és vonalak sorozata, de itt minden pont és vonal csak egyszer lehet érintve. Az ösvény ponttal kezdődik, és ponttal végződik, hossza pedig egyenlő a benne lévő vonalak számával. Ha két pont közt van ösvény, az azt jelenti, hogy az egyik pontból vonalak és pontok egymásra következő sorozatán át elérhető a másik pont. Ha a gráf minden pontja közt található ösvény, a gráfot kapcsolt gráfnak nevezzük. Ha a gráf nem kapcsolt, de vannak algráfjai, ahol az összes pont közt lehet ösvényt találni, akkor azokat az algráfokat komponenseknek nevezzük.

Elképzelhető, hogy két adott pont közt több lehetséges ösvény is van és ezek esetleg eltérő hosszúságúak. A legrövidebb ösvény hossza adja meg a távolságot a két pont között (path distance). Nem irányított gráfban a távolság ni és nj (két pont) között egyforma, míg irányított gráf esetén lehetnek eltérések. Ez a fajta távolság definíció és mérés gyakran használt jellemzője két pontnak, de a centralitás méréseknél is van jelentősége. A pont asszociációs számának hívjuk a leghosszabb ösvény hosszát az adott pont és a gráf tetszőleges másik pontja közt. A gráf átmérője is az ösvény fogalmához kapcsolható, mivel ez a leghosszabb ösvényt jelenti, ami a gráfban egyáltalán található.

A gráf összekötöttsége (connectivity) arra utal, hogy vajon a gráf kapcsolat marad-e, amennyiben pontokat vagy vonalakat törlünk a gráfból. Az összekötöttséggel kapcsolatos legfontosabb fogalom a metszőpont (cutpoint). Egy pontot (ni) akkor nevezünk metszőpontnak, ha a gráf kevesebb komponens tartalmaz ni jelenlétével, mint ni jelenléte nélkül, azaz az adott pont (és a hozzá tartozó vonalak) törlésével a gráfban nő a komponensek száma. A kommunikációs hálózatokban a metszőpont fontos személyeket jelöl, mivel ha eltávolítjuk őket a hálózatból, a megmaradó hálózatban lévő aktorok közt nem áramlik az információ. Ez az elmélet kiterjeszthető pontok csoportjára is, azaz a gráfban megnevezhető olyan több pontból álló alakzat (cutset), aminek eltávolításával a gráf két vagy több komponensre szakad. Ilyenkor általában az a kérdés, hány pont eltávolítása okozza a gráf szétszakadását, Harary (1969) ezt pont összekötöttségnek (point connectivity) nevezte, azaz azt vizsgálta, mennyi az a minimum elégséges k darab pont, aminek eltávolításával a gráf már nem kapcsolt. Ha gráf tartalmaz egy metszőpontot, akkor k=1, ha a gráf már eleve nem kapcsolt, akkor k=0 mivel nem kell egyetlen pontot sem elvennünk ahhoz, hogy a gráf „szétkapcsolt” legyen. Ugyanez az elképzelés vonalakra is alkalmazható. A híd (bridge) olyan vonal, aminek eltávolításával a gráfban lévő komponensek száma nő. Ugyanúgy, ahogy a pontoknál, itt meghatározható az a minimális vonalszám, amit el kell távolítani a gráf szétkapcsoltságához (line connectivity). Minél nagyobb egy gráf sűrűsége, minél nagyobb az ösvénye száma, minél több viszonylag rövid ösvény van két pont között és minél nagyobb a pontok fokszáma, a gráf annál kohézívebb. Az ilyen gráfokat kis átmérő és rövid geodéziai távolságok jellemzik. A kohézív gráfokat kevésbé veszélyezteti a több részre szakadás az egyes vonalak vagy pontok eltávolításával.

 

Eddig olyan gráfokról beszéltünk, ahol a vonalak léte vagy nem léte a kapcsolat létére vagy nem létére utalt, de nem ruháztuk fel a vonalakat irányítottsággal. Nagyon sok kapcsolatnak előre meghatározott iránya van: a kölcsönadás, export, barátválasztás, tanácsadás mind irányított kapcsolatok. Az irányított kapcsolatokat tartalmazó gráfokat irányított (directed) gráfoknak nevezzük. Az irányított gráfban már nem egyszerű vonalak vannak, hanem a pontokat nyilak (arc) kötik össze, maximális számuk g(g-1), mivel megkülönböztetjük az ni től az  nj –be illetve az nj től az  ni –be mutató kapcsolatokat. Az irányított gráfoknál is megkülönböztetünk diádokat és más algráfokat. Itt a diádok már összetettebb kapcsolatokkal rendelkeznek, mint az előző esetben: négy lehetséges összeköttetés valósul meg köztük. Nulldiádról beszélünk, ha egyik kötés sem lelhető fel a diádban, aszimmetrikusról, ha legalább egy fellelhető és reciprok diádról, ha mindkét kötés fennáll. A gráfokat szokták a gráfban fellelhető null, aszimmetrikus és reciprok diádok számának összességével is jellemezni.

Irányított gráfoknál a pontok esetében kétfajta fokot különböztetünk meg, a befelé és a kifelé irányuló kapcsolatoknak megfelelően (indegree és outdegree). Egy pont esetén az „indegree” a pont felé mutató kapcsolatok száma, míg az „outdegree” a pontból mutató kapcsolatok száma. Az előbbi méri a népszerűséget, elfogadottságot, az utóbbi pedig az aktor expanzivitását, ezek az elnevezések főként személyek esetén értelmezhetők és kevésbé egy ország kereskedelmi kapcsolatainak vizsgálatánál. Olyan esetekben, mikor előre meghatározzuk a megadható lehetséges kapcsolatok számát (jelölje meg 3 legjobb barátját), az outdegree-t előre korlátozzuk. Ugyanúgy, ahogy nem irányított gráfoknál, itt is jellemezhető a gráf a különböző fokok átlagával és varianciájával. A bejövő és kimenő kapcsolatok számától függően az elméletalkotók a pontokat négy kategóriába csoportosítják, izoláltnak nevezik azt az esetet, mikor mind az indegree, mind az outdegree nullával egyenlő, ha egy pontnál a bejövő kapcsolatok száma nulla, de a kimenőké nagyobb mint nulla, az a pont küldő (transmitter), ellenkező esetben fogadó (receiver), míg ha mindkettő nagyobb nullánál, akkor hordozóról (carrier) vagy közönséges pontról beszélünk (ordinary). Az irányított gráfoknál is számítható sűrűség, annyival kiegészítve, hogy itt a maximális kapcsolatszámnál mindkét irányú kapcsolatot figyelembe kell venni, így a nevezőben g(g-1) lesz. Az irányított gráfoknál is definiálhatók ösvények azzal a kiegészítéssel, hogy az ösvényben résztvevő pontok közti nyilak mind egy irányba mutatnak. Ugyanakkor az irányított gráfoknál félösvények is definiálhatók (semipath), ahol az ösvény pontok és a köztük lévő nyilak egymásra következő sora, de a nyilak iránya irreleváns.

Az irányított gráfoknál az elérhetőség és az összekötöttség komplexebb fogalom, mint az egyszerű gráfoknál. Két pont gyengén kapcsolt, ha köztük félösvény található, egyoldalúan kapcsolt, ha ösvény vezet egyik ponttól a másikig, erősen kapcsolt, ha ösvény vezet egyik ponttól a másikig és viszont és rekurzívan kapcsolt, ha erősen kapcsolt és az oda és vissza irányuló ösvényekben ugyanazon pontok és nyilak sora található, csak pont fordított sorrendben. Ugyanezek a fogalmak az egész gráfra is értelmezhetők, így gyengén kapcsolt a gráf, ha az összes pontpár gyengén kapcsolt, egyoldalúan kapcsolt a gráf, ha az összes pontpár egyoldalúan kapcsolt stb.

A távolság értelmezése is más az irányított gráfoknál, mint az egyszerűeknél. A távolság az általános értelmezés szerint a legrövidebb ösvény hossza két pont között. Irányítottság esetén a távolság ni től njig a legrövidebb ösvény, ami ni ből nj –be mutat, ugyanakkor elképzelhető, hogy ez a távolság nem egyezik azzal a távolsággal, ami nj és ni között van. Az irányított gráf átmérője csak erősen vagy rekurzívan kötött gráfoknál értelmezhető, egyéb esetekben a kapcsolatok definiálatlansága miatt ez sem számítható.

A két alapvető gráfforma mellett léteznek még más gráfformák is, amik az előzőek továbbgondolásai. Így a jelölt gráfok (signed) nemcsak pontokból és a hozzájuk tartozó vonalakból állnak, hanem a vonalak vegyértékeiből, jelöléseiből is, ami lehet pozitív vagy negatív. Ez különösen akkor használható, ha pozitív és negatív viszonyulásokat akarunk mérni, például szövetségeket és ellenségeskedéseket. A jelölt gráfok is lehetnek irányítottak, ekkor a nyilak pozitív vagy negatív értéket vehetnek fel.

Amennyiben a kapcsolat iránya, általános tartalma mellett az erősséget vagy intenzitást is jelöljük, értékelt (valued) gráfhoz jutunk, ezek a gráfok is lehetnek irányítottak. Az érték sokféle információt hordozhat, így nem irányított gráf esetén jelentheti például két család közti házasságok számát, két személy esetén a köztük lévő interakciók számát, irányított gráfoknál a kölcsönadott pénzmennyiséget, országoknál az exportmennyiséget. A jelölt gráf ekkor sepciális értékelt gráfnak is tekinthető, ahol a lehetséges értékek +1 és –1. Speciális értékelt gráf a Markov lánc, ahol az értékek valószínűségek, így azokat összegezve 1-et kell, hogy kapjunk. Úgy is elképzelhető az értékadás, hogy a megkérdezett személlyel sorbarendeztetjük kapcsolatait például fontosság szerint és a sorrendiségnek megfelelő sorszámot illesztjük az egyes kapcsolatokhoz.

Az értékelt gráfoknál a pont foka még nem általánosított fogalom, de egy jellemező megoldási mód lehet, hogy nem irányított gráfok esetén a pontokhoz kapcsolódó vonalak értékeit átlagoljuk, irányított gráfok esetén pedig ezt külön megtesszük a be- és kifutó nyilakra. Az értékelt gráfoknál az ösvénynek is lehet értéke. Az ösvény értéke megegyezik azzal az értékkel, ami az ösvényben található vonalak vagy nyilak értékei közt a legkisebb. Ilyen esetekben azt is lehet definiálni, hogy van-e olyan ösvény, amiben nem gyengébbek a vonalak vagy nyilak egy bizonyos értéknél. Ha azt mondjuk, hogy definiálunk egy ösvényt „c szinten”, ez azt jelenti, hogy az ösvényben minden vonal értéke nagyobb vagy egyenlő c-vel. Az elérhetőség is ennek megfelelően határozható meg: két pont elérhető egymásból c szinten, ha van köztük legalább egy olyan ösvény, amiben szereplő vonalak értékei mind nagyobbak vagy egyenlők c-vel. Az ösvényhossz értékelt gráfoknál az egyik javasolt definíció szerint az ösvényben szereplő vonalak értékeinek összege. Ez annyiban vet fel problémát, hogy az ösvény nagyobb hossza egyaránt következhet a nagy értékekből és a nagy vonalszámból.

Speciális gráfok az un. multigráfok, amik többfajta kapcsolat megjelenítésére is szolgálnak, így ha ugyanazoktól a személyektől kérdezünk a baráti és tanácsadói kapcsolatokra, multigráfhoz jutunk.

 

Szociometriai megközelítés:

A szociometria pozitív vagy negatív érzelmi töltésű kapcsolatok vizsgálatát jelenti. A kapcsolati adatokat gyakran ábrázolják mátrix formátumban, amit szociomátrixnak vagy szomszédsági mátrixnak neveznek. Ebben a két dimenziós mátrixban, amennyiben egymódú hálózatról van szó a sorokban és oszlopokban is ugyanazok az aktorok állnak ugyanabban a sorrendben, a mátrix elemei (xij) azt jelölik, az aktorok közül melyek állnak közvetlen kapcsolatban egymással. Így a mátrix un. kvadratikus, azaz négyzetes mátrix, mivel sorainak és oszlopainak száma megegyezik. Ha a két aktor közt (legyenek ni és nj) van kapcsolat, a mátrix i-edik sorában és j-edik oszlopában 1 szerepel, ellenkező esetben 0. A szociomátrix szimmetrikus a főátlójára, azaz xij=xji, míg a diagonálisban szereplő értékek nem értelmezhetők (ezek reflexív kapcsolatra utalnának). A teljes gráfban a diagonálison kívül minden érték 1-es.

Egy másik megközelítésben a sorok megfeleltethetők az aktoroknak (pontoknak), míg az oszlopok a köztük lévő kapcsolatnak (vonalaknak), ez az un. eseménymátrix. Ez a mátrix nem feltétlenül kvadratikus, mivel a pontok és vonalak száma nem feltétlenül egyenlő. A mátrixban szereplő értékek azt jelzik, hogy az adott pont melyik vonallal áll kapcsolatban. A mátrix minden oszlopában pontosan két 1-es érték található, mivel minden vonalat két pont zár le. Mindkét fajta mátrix tökéletesen le tudja képezni a gráfok által hordozott információkat.

Az irányított gráfok is ábrázolhatók mátrixokkal. A kapcsolatok irányai a mátrix soraitól az oszlopai felé tartanak, azaz xij jelzi azt, hogy ni től megy-e kapcsolat nj felé. Mivel a kapcsolatok nem feltétlenül alapulnak kölcsönös választáson, ez a mátrix nem szimmetrikus, azaz xij és xji nem azonos. Az értékelt gráfok is ábrázolhatók mátrix formátumban, ekkor a mátrix elemei azok az értékek, melyek a vonalakhoz, vagy irányított gráf esetén a nyilakhoz tartoznak.

Fontos tulajdonsága a mátrixoknak a permutálhatóság, azaz a sorok és oszlopok sorrendje változtatható anélkül, hogy a szociomátrix által hordozott információk változnának, amennyiben a sorok és oszlopok sorrendje azonos marad. Ez elsősorban azért fontos, mert a sorok és oszlopok újrarendezésével olyan információk is láthatóvá válnak, amik egyébként nem. (Elképzelhető, hogy az 1 értékek a mátrix jobb felső és bal alsó sarkában csoportosulnak az újrarendezés után, ami két elkülönülő algráfra utal.) A mátrixpermutációkra épül többek közt a blokkmodell analízis módszertana.

A mátrixokkal végzett alapműveletek egyik legfontosabbika hálózatelemzés szempontjából a mátrixszorzás. A szorzatmátrix értékei a tényezőmátrixok megfelelő soraiban és oszlopaiban álló elemek páronkénti összeszorzásából és ezen szorzatok összegzéséből adódnak. A márixok négyzetre vagy magasabb hatványra emelésével lehetőség van meghatározni az elérhetőséget, a pontok közti meghatározott hosszúságú sétányok számát. A mátrix négyzetre emelésével  , ahol az összeg egy eleme () akkor egyenlő 1-gyel, ha mind xik és xkj 1, ami pontosan azt jelenti, hogy mind az ni és nk, valamint nk és nj pont közt kapcsolat van (azaz a három pont közt van sétány). Ezért a fent említett összeg gyakorlatilag megszámlálja a 2 egység hosszúságú (azaz két vonalból álló) sétányokat a gráf két pontja között. Ha magasabb hatványra emeljük a mátrixot, a hatvánnyal megegyező hosszúságú sétányok számáról kaphatunk információkat a pontok között. Így azt is meg tudjuk vizsgálni, van-e egy előre meghatározott k-nál rövidebb hosszúságú sétány két pont közt. Ahhoz, hogy megtudjuk, két pont elérhető-e, van-e köztük összeköttetés, a mátrix összes lehetséges hatványát meg kell vizsgálni. A maximum hatvány, amire még érdemes emelni (g-1), mert az ösvény ennél nem lehet hosszabb. Ha összegeznénk az összes hatványozott mátrixot (X+X1+X2+   +Xg-1), megkapnánk az összes sétányt a lehetséges összes pontpár közt, aminek hossza egyenlő vagy kisebb mint g-1. Ebből generálható egy elérhetőségi mátrix, ahol a mátrix elemei 1-et vesznek fel, amennyiben az előbbi összegmátrix értéke az adott két pont közt nem nulla és nulla értéket vesznek fel egyéb esetekben. Az elérhetőségi mátrix tehát azt mutatja meg, van-e bármilyen hosszúságú sétány a pontok között, ahol a mátrix értéke 0, ott az egyik pontból semmilyen úton nem lehet eljutni a másikba.

Az irányított gráfoknál is alkalmazható ez az elv, azzal, hogy itt az ösvényeknek és sétányoknak meghatározott iránya van, tehát a négyzetes mátrixnál a mátrix adott xij pontjában szereplő érték az jelzi, van-e és ha igen, mennyi olyan sétány, ami 2 hosszúságú és i pontból j pont felé mutat minden egyes nyíl. Hasonlóképpen értelmezhetők a hatványozott mátrixok illetve ezek összegei, mint az előző esetben, és éppúgy definiálható elérhetőségi mátrix is.

A hatványozott mátrixok vizsgálatával fényt deríthetünk a pontok közti távolságokra is, mivel a távolság a legrövidebb ösvény hossza. A távolság úgy állapítható meg, hogy megnézzük, melyik az a p hatvány, amire a mátrixot emelve az adott pontok (ni és nj) közt a mátrix értéke (xij) már nem nulla, a távolság az a p-edik hatvány, amire az első nem nulla értéket adja xij.

A pontok fokszáma is könnyen kiszámítható a mátrixokból. Mivel a pont foka a vele közvetlen kapcsolatban lévő pontok száma (azaz a vele érintkezésben lévő vonalak száma), a fok mind a szomszédsági, mint az eseménymátrixból megállapítható. A szomszédsági mátrixból a sor vagy oszlop összegekből számítható, ami az egyszerű, nem irányított gráfok esetén egyenlő, az eseménymátrixban pedig a sorösszegeket kell megnézni, hiszen ott minden olyan mátrixelem 1, ahol a sorban megnevezett pont az oszlopban megnevezett vonallal érintkezik. Az irányított gráfok esetén megkülönböztetünk befelé és kifelé irányuló kapcsolatokat, így a sor és oszlopösszegek különbözőek lesznek. A sorösszegek mutatják a pontból kifelé irányuló kapcsolatokat, míg az oszlop összegek a pont felé irányulókat.

A kapcsolatháló sűrűsége a mátrixból úgy számolható, hogy minden mátrixelemet összegzünk, ezek a meglévő kapcsolatok, és ezt osztjuk le a lehetséges kapcsolatok számával.

 

A legtöbb gráf egyszerű gráf, azaz nem reflexív, ami azt jelenti, hogy nem engedünk meg benne az aktorok önmagukra való visszamutatását, azaz például a barátság hálózatoknál nem feltételezzük, hogy egy aktor önmagát választja barátjának, vagy önmagától kér tanácsot. De vannak esetek, mikor a reflexivitás megengedhető, például ha egy szervezet vizsgálatánál az egyes osztályok közti kapcsolat mellett az osztályokon belüli kapcsolatokat is vizsgáljuk, ilyenkor a mátrix főátlója is értelmezhető.

 

Centralitás és presztízs

A gráfelméleti megközelítést jól lehet alkalmazni a legfontosabb aktor meghatározására. A fontos aktorok általában a hálózat stratégiai pontjai helyezkednek el, de a fontosság számítása több módon is megközelíthető, attól függően, hogy mi alapján tekintünk valakit fontosnak. Tekinthetjük azt központi személynek, aki a legnagyobb kapcsolati aktivitást mutatja, és akihez sokan kapcsolódnak, vagy aki sok emberrel tart fenn minél szorosabb kapcsolatot, esetleg olyan aktorokat, akik hálózatmegszakító pozícióban vannak.

A centralitás fogalmát általában nem irányított gráfoknál, míg a presztízst irányított gráfok esetén alkalmazzák. A centralitásnál elsősorban az a fontos számunkra, hogy az aktor részt vesz kapcsolatokban, az pedig kevésbé, hogy küldője vagy fogadója ezeknek. A presztízs azonban nemcsak attól függ, hányan választják az aktort más hálózati szereplők (indegree), hanem attól is, hogy milyen presztízsűek a választók. Minél több magas presztízsű aktor választja kapcsolatának az elemzett személyt, annak annál magasabb az elismertsége. A presztízzsel szinonímaként használják a státuszt, rangot, népszerűséget.

Ahhoz, hogy csoportokat hasonlíthassunk össze, csoportszintű centralitást és presztízst is érdemes számolni. Ebben az esetben a centralitás varianciája az igazán fontos információ, azaz milyen mértékű különbségek vannak az egyes aktorok centralitásai közt.

Az egyik jellemző centralitás számítási mód a fok centralitás (degree centrality, CD), ahol abból indulunk ki, hogy az aktor aktivitását a fok (azaz a hozzá közvetlenül kapcsolódó más aktorok száma) jól méri. Amennyiben a centralitást egyszerűen minden aktornál a fokkal tesszük egyenlővé, az a probléma adódik, hogy ez a szám függ a hálózat nagyságától, így csak hálózaton belül használható az adatok összehasonlításra, de két különböző hálózat egy-egy pontját már nem lehet összehasonlítani, ezért érdemes elosztani ezt a számot a maximális értékkel, ami g-1, ahol g a hálózatban szereplő aktorok száma.

Ez a számítási mód az aktorok aktivitására koncentrál. A fok centralitás alapján többféle csoport szintű indexet lehet számítani. A Freeman (1979) által javasolt általános formulának megfelelően például a számlálóban a legnagyobb megfigyelt érték (fok) és az aktorok fokainak különbségéből képzett összeg áll, míg a nevezőben az elméletileg lehetséges legnagyobb különbség az aktorok centralitásai közt:

Ez az index akkor éri el a maximumát (1-et), ha egy aktor minden más aktorral közvetlen kapcsolatban áll, míg a többieknek csak vele van összeköttetésük és egymással nincs (legalábbis közvetlenül). Az index minimum értéke 0, ha nincs különbség az egyes aktorok centralitásai között. A másik lehetőség a csoport centralitásának összevont kiszámítására a fokok varianciájának kiszámítása. A minimum érték itt is 0, ez akkor fordul elő, ha minden aktor azonos fokkal rendelkezik, míg maximum értéke g függvénye, így érdemes valamilyen formában standardizálni. Csoportszintű indexnek használható a sűrűség is, de ez nem minden esetben mér jól, mivel a hálózat méretének növekedésével nagy esély van a hálózat sűrűségének csökkenésére, tehát a kettőt együtt kell figyelembe venni.

A következő centralitás számítási mód a közelség centralitás (closeness centrality, CC), ami abból indul ki, hogy egy aktor akkor van központi helyzetben, ha minden aktort viszonylag könnyen és gyorsan elér, így nem kell más szereplőkre hagyatkoznia például az információ gyűjtésénél. A számítás azon az elképzelésen alapul, hogy a centralitás fordítottan arányos az aktorok közti távolsággal, így ha összegezzük egy aktor összes többi aktortól mért távolságát, és ennek vesszük a reciprokát, megkapjuk a közelségen alapuló hálózati szereplőre jellemző centralitást.

Az index minimuma 0, ez akkor fordul elő, ha egy vagy több pont nem elérhető a vizsgált pontból, maximum értéke pedig (g-1)–1, amit akkor ér el a vizsgált aktor, ha a hálózat minden más pontjával szomszédos. Ha az indexet standardizáljuk a maximális értékével, az index értéke 0 és 1 között változik. Az elméletalkotók ennek az elvnek az alapján definiálták a gráf középpontját, amit úgy kaphatunk meg, hogy a távolságmátrixból (ahol minden elem a pontok egymás közti távolságát jelenti) minden sornak megkeressük a maximumát, majd ezen maximumok minimumát. Ez az un. Jordan középpont. Ebből az indexből is számítható csoport szintű index. Az egyik lehetőség a Frreman féle általános index elvén képzett képlet, ahol a számláló a maximum közelség index és az egyes aktorok indexei különbségének összegéből áll, a nevező pedig az elméletileg lehetséges maximum. Egy másik lehetséges számítási mód az egyedi aktor indexek varianciájának kiszámítása.

A harmadik centralitás számítási lehetőség az un. köztes centralitás (betweenness centrality, CB), ahol a kiindulási pont az, hogy igazán azoknak a szereplőknek van hatalma, akik képesek kontrollálni a hálózatban áramló erőforrásokat, azaz akik sok másik szereplő között helyezkednek el. Így például ha egy adott pontból a legrövidebb távolság két másikon keresztül vezet, a két közbülső aktor meghatározó lehet a hálózati kapcsolatokban. Így tulajdonképpen azokat az ösvényeket kell összegeznünk, melyek minimális hosszúságúak, és keresztülhaladnak az adott szereplőn. A legegyszerűbb azt feltételezni, hogy a két aktor közti kapcsolaton keresztül áramló erőforrások mindig a legrövidebb utat választják (legyen gil az i és l aktorok közt fellelhető legrövidebb utak száma), és ha több ilyen is van, akkor mindegyik egyformán valószínű (1/gil). Így tulajdonképpen csak azokat a távolságokat kell figyelembe venni, amiken a közbülső pont rajta van (legyen gil(nj) azoknak a távolságoknak a száma, amik i és l aktor közt húzódnak és tartalmazzák j aktort).

 

 

Ha egy aktor az összes legrövidebb ösvényen rajta van, az index eléri a maximum értékét, ha egyiken sincs rajta, akkor az index értéke 0. Ha az indexet standardizálni akarjuk, le kell osztanunk a maximum értékével, ami jelen esetben (g-1)(g-2)/2. Ez az index is számítható a hálózat teljes szintjén. Az index hibája egyrészt az, hogy feltételezi a két pont közti legrövidebb távolságok választásának egyforma valószínűségét. Ehelyett inkább az a valószínű, hogy azon a legrövidebb ösvényen áramlik az információ, ahol a magas fokszámú aktorok vannak. A másik hiba, hogy csak a legrövidebb ösvényeket veszi számba, holott elképzelhető, például a kommunikációs hálózatokban, hogy az információ elrejtése céljából nem a legrövidebb utat választják az aktorok. Az információs centralitást (information centrality) mindezeket figyelembe véve számítják.

A négy centralitás index irányított kapcsolatokra is számítható a megfelelő átalakításokkal (például a fok centralitásnál csak a kifelé irányuló kapcsolatokat veszik figyelembe). Ugyanakkor irányított gráfoknál inkább presztízst számolnak, mint centralitást.

A legegyszerűbb presztízs index a fok presztízs (degree prestige). Itt az aktor felé irányuló kapcsolatokat veszik számba, azt tekintik magas presztízsűnek, akit sokan választanak. Az index a maximumával standardizálható (g-1), így maximális értéke 1 lesz, amit akkor vesz fel, ha minden más hálózati szereplő az adott szereplőt választja.

Egy másik presztízs számítási mód a szomszédsági presztízs (proximity prestige), ahol az index azt méri, milyen közel vannak más szereplők az adott kiválasztott aktorhoz. Ez a közelség különbözni fog a nem irányított gráfok esetén számítottól, mivel a távolság egy ponttól és egy pontig különböző értéket vehet fel, itt a pont felé irányuló kapcsolatokat indító pontok közelségét vizsgálják a kiszemelt ponthoz.

A rangpresztízs (rank prestige) azt is számításba veszi, hogy milyen tulajdonságokkal rendelkeznek azok, akik a vizsgált szereplőt választják. Így ha sok magas presztízsű aktor van viszonylag közel a vizsgált hálózati szereplőhöz, akkor annak rangja is magasabb lesz. Ugyanakkor minden hálózati szereplő rangját az határozza meg, hogy őt milyen rangúak választják, így ez a lánc a végtelenségig folytatható.

 

Strukturális ekvivalencia

A strukturális ekvivalencia számítás a közel azonos kapcsolati helyzetben lévő aktorok azonosítására, és ezáltal a hálózat komplexitásának redukálására használható. Két aktor strukturálisan ekvivalens, ha azonos kötéseik vannak a többi hálózati szereplővel. Ez annyit jelent, hogy i aktortól ugyanazon szereplők felé indulnak kötések, mint j aktortól, illetve i aktor felé ugyanazon aktoroktól indulnak kötések, mint j aktor felé, azaz a két pont pontosan ugyanazon más pontokkal szomszédos (a két aktor egymás felé irányuló kapcsolatait ilyenkor nem vesszük számba, azaz csak a többi, g-2 számú aktorhoz való kapcsolódást vizsgáljuk). A szociomátrixban ez úgy jelenik meg, hogy a két strukturálisan ekvivalens aktornak a sorai és oszlopai azonosak, azaz ugyanott vannak 1-ek és 0-ák (kivéve az egymás felé irányuló kapcsolatok esetét). Nem irányított gráfok esetén elegendő csak a sorokat vagy csak az oszlopokat figyelembe venni. Ha két aktor strukturálisan ekvivalens, akkor helyettesíthetők. Az alábbi ábrában (ld. 2. ábra) a két fekete aktor strukturálisan ekvivalens, mivel mindkettő ugyanafelé a három aktor felé irányít kapcsolatokat és nem fogad kapcsolatokat, ugyanígy strukturálisan ekvivalens a három zöld színnel jelzett aktor, mivel ugyanattól a két aktortól fogadnak és ugyanafelé az egy aktor felé küldenek kapcsolatot. Így három csoport képezhető az ekvivalencia alapján.

 

2. ábra. Strukturálisan ekvivalens aktorok

 

 

 

 

 

 


A strukturális ekvivalencia értelmezhető bonyolultabb gráfok esetén is. Így például az értékkel rendelkező gráfoknál (valued) akkor strukturálisan ekvivalens két aktor, ha a kapcsolatok értékei is megegyeznek. Így például ha az értékek a kapcsolatok szorosságát jelzik, akkor a strukturális ekvivalencia két aktornál akkor áll fenn, ha pontosan ugyanazon aktorokkal tartanak fenn szoros kapcsolatot és ugyanazokkal kevésbé szorosat.

A strukturális ekvivalencia megállapítása elsősorban arra szolgál, hogy egyszerűsítsük a hálózati adatokba sűrített információt. A szociomátrix sorainak és oszlopainak permutálásával egymásmellé helyezhetők azok az aktorok, amik strukturálisan ekvivalensek, így olyan almátrixok állnak elő, melyekben tiszta esetben csak nullák vagy csak egyesek szerepelnek. Az almátrixok mentén felbonthatjuk az eredeti mátrixot és helyettesíthetjük a csupa 1-esekből álló almátrixot 1-el, míg a csupa nullából álló almátrixot 0-val, így kapjuk meg az image mátrixot.

 

3. ábra: Az eredeti mátrix és a permutált mátrix

 

1

2

3

4

5

6

 

 

1

6

2

3

4

5

1

-

1

1

1

0

0

 

1

-

0

1

1

1

0

2

0

-

0

0

1

0

 

6

0

-

1

1

1

0

3

0

0

-

0

1

0

 

2

0

0

-

0

0

1

4

0

0

0

-

1

0

 

3

0

0

0

-

0

1

5

0

0

0

0

-

0

 

4

0

0

0

0

-

1

6

0

1

1

1

0

-

 

5

0

0

0

0

0

-

 

4. Ábra: az image mátrix és a redukált gráf

B3

 

B2

 

B1

 

B1

B2

B3

B1

0

1

0

B2

0

0

1

B3

0

0

0

 

Az image mátrix a különböző strukturálisan ekvivalens pozíciók közt ír le kapcsolatot, mivel egységként kezeli az azonos pozícióval rendelkezőket. Az image mátrix ábrázolható egy redukált gráf formájában, ahol az egyes csoportok képezik a gráf pontjait és a vonalak jelzik az azonos pozícióval rendelkezők csoportjai közt a kapcsolatot. A redukált gráfban elképzelhetők reflexív kapcsolatok is, azaz amennyiben a strukturálisan ekvivalens aktorok az adott pozíción belül is kapcsolódnak egymáshoz, akkor az image mátrix átlójában is állhatnak 1-esek. Az image mátrix tartalmaz minden strukturális információt, mégis jóval egyszerűbb, mint az eredeti mátrix. Az image mátrixot hívjuk blokkmodellnek.

A strukturális ekvivalencia mellett más ekvivalencia definíciók is alkalmazhatók. Így a pozíció analízisnél az első lépés annak eldöntése, hogyan definiáljuk az ekvivalenciát. Ezek után az adott definíció alapján megmérjük, mely aktorok és milyen mértékben ekvivalensek. Harmadik lépésként az ekvivalens aktorok csoportba (strukturálisan ekvivalens pozícióba) sorolása történik meg illetve ennek megjelenítése, amire alkalmazhatunk például image mátrixot vagy redukált gráfot. Utolsóként azt is érdemes megvizsgálni, hogy mennyire megfelelő a besorolás, ábrázolás.

 

A strukturális ekvivalencia mérésénél tehát a beérkező és kifelé irányuló kötéseket vizsgáljuk. Elképzelhető az is, hogy két aktor nem tökéletesen strukturálisan ekvivalens, mivel van olyan kötésük, ami különbözik annak ellenére, hogy kötéseik nagy része megegyezik. Így az ekvivalecia valójában egy skálán mérhető, lesznek aktorok, amik inkább ekvivalensek, míg mások kevésbé. A skála egyik végpontja a tökéletes strukturális ekvivalencia.

A strukturális ekvivalencia mérésénél különböző módszerek alkalmazhatók, így például az euklideszi távolságon alapuló mérési módszer, vagy a korreláción alapuló mérés. Az euklideszi távolságon alapuló mérésnél ki kell számolnunk ezt a távolságot a két aktor sorai és oszlopai között, ami úgy történik, hogy a két aktor sorainak és oszlopainak értékeit páronként kivonjuk egymásból, és e különbségek négyzeteit összegezzük, majd gyököt vonunk.

 

 ahol  és

 

Ha a két aktor strukturálisan ekvivalens, akkor a szociomátrixban soraik és oszlopaik megegyeznek, így az euklideszi távolság köztük 0, ellenkező esetben ennél nagyobb, a maximális értéke. Páronként kiszámolva a távolságokat ezek mátrixba rendezhetők, ahol a mátrix elemei a sor és oszlop aktor közti távolságot jelzik.

Ha több különböző tartalmú kapcsolatot egyszerre vizsgálunk, akkor a távolság kiszámításánál ezt is figyelembe kell venni. A maximális érték ekkor , ahol R a különböző tartalmú kapcsolatok számát jelzi.

Egy másik lehetőség a strukturális ekvivalencia számítására a korreláció alapján való számítás. Itt a két aktor sorai és oszlopai közti Pearson féle korrelációt számítjuk ki, ha két aktor strukturálisan ekvivalens, a korrelációs koefficiens értéke 1 lesz. Mivel minden lehetséges aktorpár közt kiszámítjuk a korrelációt, ezek mátrixba rendezhetők, ahol a mátrix értékei 1-ek, ha a sor és oszlop aktor strukturálisan ekvivalens.

A különböző strukturális ekvivalencia számításnál különböző eredményeket kaphatunk. Elképzelhető, hogy míg a korrelációszámításos módszer tökéletes ekvivalenciát jelez, az euklideszi távolság alapján kapott érték ezt nem erősíti meg.

Miután megkaptuk a hasonlóságokat jelző mátrixokat (a távolságmátrixot vagy a korrelációs mátrixot), a következő feladat az aktorok csoportokba rendezése hasonlóságuk illetve közelségük alapján. A cél az, hogy az egymáshoz közel lévő aktorok egy csoportba kerüljenek, míg a távolabbiak egy másikba. Az egyik lehetőség a csoportosításra az un. CONCOR eljárás, a másik pedig a hierarchikus klaszter analízis.

A CONCOR az iterált korrelációk konvergenciáján alapul. Ez annyit jelent, hogy egymás után többször számolunk korrelációt a sorok és oszlopok között. Az első lépés tehát a hálózati adatokat tartalmazó mátrix sorai és oszlopai közti korreláció számítás, aminek eredményeként megkapjuk a korrelációs mátrixot. A CONCOR eztán ezt a korrelációs mátrixot tekinti inputnak és újra korrelációt számol a sorok és oszlopok közt, kiszámítva a korreláció korrelációit. Így egy következő korrelációs mátrixhoz jutunk. Erre újra alkalmazva a korrelációszámítást egy harmadik korrelációs mátrixhoz jutunk. Egymás után sokszor megismételve ezt az eljárást a mátrixban található értékek vagy 1-et vagy –1-et vesznek fel. Ezek után permutálva a sorokat (és oszlopokat) olyan almátrixokat kaphatunk, ahol csak 1-ek vagy csak –1-ek állnak, így ezeket a blokkokat helyettesíthetjük 1-el vagy –1-el. Ezzel két pozíciót azonosítottunk. Azonban valószínű, hogy több pozíció is van a hálózatban, így az eljárás az almátrixokra is alkalmazható, így finomabb csoportosítást is kaphatunk, minden újabb eljárással az eredetileg egy csoportba sorolt aktorokból két csoport képződik (ennek az eljárásnak többek közt az az egyik problémája, hogy mindig csak kettős bontásokra képes, azaz mindig páros számú csoportot kínál fel, ami nem feltétlenül tükrözi vissza a valóságot). A kérdés az, hogy meddig folytassuk a csoportképzést, milyen finomságú csoportosítást alkalmazzunk. Az eredmények egy dendrogrammal ábrázolhatók.

A hierarchikus klaszter analízis a másik lehetséges eljárás az adatok csoportosítására. Ez az eljárás arra szolgál, hogy a hasonló aktorokat csoportokba sorolja, így azok kerülnek majd egy csoportba akik az általunk definiált bizonyos értékkel jelzett hasonlóságnál inkább hasonlóak. Az input adatok itt a hasonlóságot jelző euklideszi távolságokat vagy a korrelációs együtthatókat tartalmazó mátrixok lehetnek, az eredmények pedig dendrogrammal ábrázolhatók, itt is a kutatónak kell döntenie a csoportszámról.

Az aktorok strukturális ekvivalenciájának síkbeli ábrázolására alkalmazható a többdimenziós skálázás. Ennek a lényege, hogy alacsony dimenziószámú térben megjeleníti az aktorokat olyan módon, hogy a hasonlóak egymáshoz közel kerülnek, míg a kevésbé hasonlóak egymástól távolabb esnek a koordinátarendszerben.

 

Blokkmodellek

A blokkmodell elemzés alapvetően a hálózati aktorok diszkrét csoportokra bontásáról, azaz pozíciókhoz rendeléséről, valamint ezen pozíciók közt fennálló kapcsolatok meghatározásáról szól többfajta tartalommal bíró kötések fennállása esetén. A blokkmodell tehát egy modell vagy hipotézis egy multirelacionális hálózatról. Míg az eredeti hálózati adatok egy  szociomátrixban ábrázolhatók, a blokkmodell ezt egy  mátrixra redukálja, ahol B a pozíciók száma. Míg a strukturális ekvivalencia elemzés elsősorban az aktorok strukturálisan ekvivalens pozíciókba rendezéséről szól, a blokkmodell analízis nagy hangsúlyt fektet a pozíciók közti és a pozíciókon belüli kapcsolatok elemzésére. A blokkmodellezésnél az első feladat az aktorok pozíciókhoz rendezése, a második pedig a pozíciók közti és a pozíciókon belüli kapcsolatok feltárása.

Induljuk ki abból, hogy az eredeti szociomátrix sorait és oszlopait permutáljuk oly módon, hogy az egymáshoz hasonlók kerüljenek egymás mellé, így olyan mátrixhoz jutunk, ahol az almátrixok zömében 0-ákat vagy 1-eket tartalmaznak. Valószínűleg kevés olyan almátrix lesz, amely teljesen 0-ákból vagy csak 1-ekből áll (ezek lennének a tiszta esetek), azaz a tiszta eseteken kívül nem lehet egyértelműen eldönteni, hogy zéróblokkról (0-val jelölt blokk) vagy egyblokkról (1-el jelölt blokk) van-e szó. Annak meghatározására, hogy vajon egy blokkot 1-el vagy 0-val jelöljünk-e, több kritérium is megadható. A tökéletes illeszkedés kritériuma szerint az almátrixokban csak 1-ek vagy csak 0-k állnak, ekkor az image mátrix elemei ennek megfelelően 0-ák vagy 1-ek lesznek. A zéróblokk kritérium szerint akkor nincs kapcsolat két pozíció közt (azaz akkor beszélhetünk zéróblokkról), ha a sorpozíció egyetlen eleme sem indít kapcsolatot az oszlop pozíció elemei felé, minden egyéb esetben van kapcsolat, azaz 1-el kell jelölni a blokkot. Az egyblokk kritérium pont ellenkező oldalról közelíti meg a problémát, akkor van kapcsolat két pozíció közt, ha a sorpozíció minden aktora indít kapcsolatokat az oszloppozíció minden aktora felé, ellenkező esetben (ha csak egy 0 is található az almátrixban) a két pozíció közt nincs kapcsolat, így azt 0-val kell jelölni. A sűrűség kritérium szerint akkor tekintünk egy kötést meglévőnek két pozíció közt, ha az almátrix sűrűsége egy bizonyos értéknél nagyobb vagy egyenlő. Egy adott blokkban a sűrűség a jelenlévő és lehetséges kapcsolatok arányából számítható:

 ahol Bk és Bl két pozíció, gk és gl az ezen pozíciókban lévő aktorok száma, xijr pedig a k-adik pozícióba tartozó i, és az l-edik pozícióba tartozó j közt fennálló kapcsolatot jelöli adott r kapcsolattípus esetén. Ugyanígy számolhatunk sűrűséget a pozíción belül is, azzal, hogy a lehetséges kapcsolatok száma miatt a képlet itt a következőképp módosul:

, ahol

Ha az így kiszámított sűrűség egy általunk megadott értéknél nagyobb vagy egyenlő, 1-el jelöljük a blokkot, egyébként 0-val. A viszonyítási érték lehet a teljes hálózati sűrűség, vagy mivel többfajta kapcsolathálót vizsgálunk, a kapcsolattípusonkénti sűrűséget is vehetjük alapul.

 

A blokkmodellek felvázolása után sokkal érdekesebb kérdés az értelmezésük. Az egyik lehetőség az értelmezésre az, ha megnézzük, hogy az egyes pozícióba került aktorok milyen tulajdonságokkal rendelkeznek, mert ha van szisztematikus kapcsolat a pozícióba való besorolás és az aktor jellemzők között, az megerősítheti a modellt. A hálózati pozíció és az aktorok személyes jellemzői között fennálló kapcsolat kétirányú is lehet, egyrészt a jellemzők befolyásolhatják a pozíciót, ugyanakkor a hasonló pozíció hatással lehet a személyes jellemzőkre, például véleményhasonlóságok kialakulására.

A másik értelmezési mód a pozíciók kapcsolat központú értelmezése. Az egyéneknél használ jelzőket, mint izolált, fogadó, küldő stb. a pozíciókra is alkalmazhatjuk. Burt (1976) ezen a logikán alapuló tipológiája a következő: megkülönbözteti azokat a pozíciókat, amik fogadnak és amik nem fogadnak kötéseket, valamint azokat a pozíciókat ahol a tagok kötéseinek több mint a fele kifelé illetve befelé irányul. Ez a kétfajta felosztás négy pozíciót eredményez:

 

 

kevés kötést fogadnak

sok kötést fogadnak

Inkább befelé van kötésük

Izoláltak

Elsődlegesek

Inkább kifelé vannak kötéseik

Sycophant?

Brókerek

 

Fontos ezen esetekben azt is figyelembe venni, hogy mekkora a pozíció mérete, mivel ha az egész hálózat méretéhez képest a pozíció viszonylag nagy, akkor valószínűbb, hogy a pozíció tagok egymás felé is nagyszámú kötést irányítanak. Ezért figyelembe kell vennünk az adott pozíció által küldött kapcsolatok és az adott pozíció által pozícióba küldött kapcsolatok arányát, azaz

-et.

A képlet alapján számított érték lehet a választóvonal a befelé irányuló kapcsolatok megítélésénél. Így a Burt féle pozíciócsoportosítás némileg módosul a következőképpen:


 

A pozíción belüli kötések aránya

A pozíció által fogadott kötések száma közel 0

A pozíció által fogadott kötések száma nagyobb mint 0

Izolált

elsődleges

Sycophant?

bróker

 

A harmadik lehetőség a blokkmodellek értelmezésére az image mátrix. Az imázs mátrix mintázatai igazolhatják vagy cáfolhatják a kutató által felállított teóriákat. Így például egy olyan imázs mátrix, aminek csak a főátlójában vannak 1-ek, kohézív alcsoportokra utal, de detektálható a centrum-periféria modell is, ahol van egy centrum, ami főként kapcsolatokat fogad, és belső kapcsolatai vannak, valamint egy vagy több olyan nem centrum helyzetű pozíció, ami egymáshoz nem, csak a centrumhoz kapcsolódik. A perifériák belső kapcsolódására nincs kitétel. Ilyen esetekben az image mátrix a következőképp alakul:

 

5. ábra: Centrum-periféria ideális képe három pozíció esetén

1

1

1

1

0

0

1

0

0

 

Ehhez hasonló a centralizált modell, ahol az összes kapcsolat egy pozíció felé mutat, de a visszafelé irányuló kapcsolatok nincsenek meg. Ekkor az image mátrixnak csak egy oszlopában állnak 1-ek.

Számtalan tiszta elméleti eset fogható meg az image mátrix ábrázolása és értelmezése révén, de a blokkmodellek értelmezésére akár a három módszer együttesen is alkalmazható. Ezt alkalmazta Anheier, Gerhards és Romo (1995), akik a kölni írók kapcsolathálóját tárták fel hat blokkba sorolva a megkérdezetteket. Az elitnek nevezhető réteget két csoport alkotta: a kulturális elit, akik magas presztízsűek voltak, nagy hírnévvel rendelkeztek, a szervezeti elit, ahová tekintélyes írók tartoztak ugyan, de elismertségük elsősorban a szervezeti ügyekben betöltött központi szerepüknek volt tulajdonítható (így például író-olvasó találkozókat szerveznek, erőteljes szerepet vállalnak az írók formális szövetségeiben stb.). Az elit két csoportjára jellemzőek voltak az erős belső kapcsolatok. Az elit alattiak csoportjába változatos irodalmi műfajokat művelők tartoztak, tagjai viszonylag jól ismerték egymás munkásságát, általában nem főfoglalkozásként művelték az irodalmat. A periférikus pozíciók közt megkülönböztethető volt két félperiférikus pozíció és a periféria, amiket alacsony belső sűrűség jellemzett. A periférikus pozíciók közti különbség elsősorban az elit felé irányuló kapcsolataikban volt fellelhető.

 

Összegzés

Az itt bemutatásra került módszerek elsősorban a teljes hálózatok kutatásához, leíró vizsgálatához, alapvető jellemzőinek feltárásához, megjelenítéséhez mutattak módszertani eszközöket. A cél a jelentősebb módszertani alapvetések áttekintése volt, amikre építve kifinomultabb vizsgálati módszerek is megérthetők. A hálózati elemzések módszertani gazdagságának csak egy szeletét sikerült ezeken az oldalakon bemutatni, számtalan, például a modellek, hipotézisek tesztelésével foglalkozó, rész nem került górcső alá. Fontos azonban felhívni a figyelmet arra, hogy a módszertani ismeretek nem helyettesíthetik az elméleti megalapozásokat, az eredmények értelmezésének szükségességét és a kutatói kreativitást.

 

 

Irodalom:

Anheier, H.K., Gerhards,J. és Romo, F.P. (1995): A tőke és a társadalmi struktúra formái a kulturális mezőkben: Bourdieu társadalmi topográfiájának vizsgálata. In Lengyel Gy. - Szántó Zoltán (szerk.): Tőkefajták: a társadalmi és kulturális erőforrások szociológiája. Budapest: Aula, 1998

Burt, R.S. (1976): Positions in networks. Social Forces, 55, pp 93-122.

Freeman, L.C. (1979): Centrality in social networks: I. Conceptual clarification. Social Networks, 1, pp 215-239.

Galaskiewicz, J. (1985): Social Organization of an Urban Grants Economy. New York: Academic Press

Granovetter, M. (1973): The strength of weak ties. American Journal of Sociology, 81, pp 1287-1303

Harary, F. (1969): Graph Theory. Reading, MA: Addison-Wesley

Krackhardt, D. and Porter, L.W. (1985): When friends leave: A structural analysis of the relationship between turnover and stayersattitudes. Administrative Science Quarterly, 30, pp 242-261

Laumann, E.O. and Pappi, F. (1973): New directions in the study of elites. American Sociological Review, 38, pp. 212-230

Laumann, E.O., Marsden, P.V. és Prensky, D. (1989): The boundary specification problem in network analysis. In Freeman, L.C., White, D.R., and Romney A.K. (eds.): Research Methods is Social Network Analysis, pp 61-87, Fairfax, VA: George Mason University Press

Milgram, S. (1967): The small world problem. Psychology Today, 22 pp. 61-67.

Tardos, R. (1995): Kapcsolathálózati megközelítés: új paradigma? Szociológiai Szemle 4., pp 73-80

Wasserman, S. and Faust, K. (1994): Social Network Analysis: Methods and Applications. Cambridge: Cambridge University Press.



[1] Az anyag elsősorban a Stanley Wasserman és Katherine Faust szerzőpáros által 1994-ben megjelentetett Social Network Analysis: Methods and Applications c. könyv alapján készült.