Gradfördelning - Degree distribution

I studien av grafer och nätverk är graden av en nod i ett nätverk antalet anslutningar den har till andra noder och gradfördelningen är sannolikhetsfördelningen för dessa grader över hela nätverket.

Definition

Den grad av en nod i ett nätverk (ibland kallad felaktigt som konnektivitet ) är antalet anslutningar eller kanter noden har till andra noder. Om ett nätverk är riktat , vilket innebär att kanterna pekar i en riktning från en nod till en annan nod, så har noder två olika grader, in-grad, vilket är antalet inkommande kanter och ut-grad, vilket är antalet av utgående kanter.

Gradfördelningen P ( k ) i ett nätverk definieras sedan som fraktionen av noder i nätverket med grad k . Således om det finns n noder totalt i ett nätverk och n k av dem har grad k , har vi .

Samma information presenteras ibland också i form av en kumulativ gradfördelning , fraktionen av noder med grad mindre än k , eller till och med den kompletterande kumulativa gradfördelningen , fraktionen av noder med grad större än eller lika med k (1 - C ) om man betraktar C som den kumulativa gradfördelningen ; dvs komplementet till C .

Observerade gradfördelningar

Gradsfördelningen är mycket viktig för att studera både riktiga nätverk, såsom Internet och sociala nätverk , och teoretiska nätverk. Den enklaste nätverksmodell, till exempel, den (Erdős-Renyi modell) slumpgraf , i vilken var och en av n noder är oberoende ansluten (eller ej) med sannolikheten p (eller 1 - p ), har en binomialfördelning grader k :

(eller Poisson i gränsen för stora n , om den genomsnittliga graden hålls fast). De flesta nätverk i den verkliga världen har dock graddistributioner som skiljer sig mycket från detta. De flesta är mycket snedställda , vilket innebär att en stor majoritet av noder har låg grad men ett litet antal, så kallade "nav", har hög grad. Vissa nätverk, särskilt Internet, world wide web , och vissa sociala nätverk har argumenterat för att ha graders distributioner som ungefär följer en kraft lag : där γ är konstant. Sådana nät kallas skalningsfria nätverk och har uppmärksammats särskilt för sina strukturella och dynamiska egenskaper. En undersökning av ett brett spektrum av verkliga nätverk antyder dock att skalningsfria nätverk är sällsynta när de bedöms med statistiskt noggranna åtgärder. Vissa forskare har ifrågasatt dessa resultat och hävdat att definitionerna som används i studien är felaktigt strikta, medan andra har hävdat att den exakta funktionella formen av gradfördelningen är mindre viktig än att veta om gradfördelningen är fettsvansad eller inte. Övertolkningen av specifika former av examensfördelningen har också kritiserats för att inte ha övervägt hur nätverk kan utvecklas över tiden.

För hög grad av fördelning

Överskridande gradfördelning är sannolikhetsfördelningen för en nod som nås genom att följa en kant av antalet andra kanter som är kopplade till den noden. Med andra ord är det distributionen av utgående länkar från en nod som nås genom att följa en länk.

Antag att ett nätverk har en gradfördelning , genom att välja en nod (slumpmässigt eller inte) och gå till en av dess grannar (förutsatt att den åtminstone har en granne), då ges inte sannolikheten för att noden ska ha grannar . Anledningen är att, när någon nod väljs i ett heterogent nätverk, är det mer troligt att nå naven genom att följa en av de befintliga grannarna till den noden. Den verkliga sannolikheten för att sådana noder har grad är vilken som kallas den överskottsgraden för den noden. I konfigurationsmodellen , vilka korrelationer mellan noder som har ignorerats och varje nod antas vara ansluten till andra noder i nätverket med samma sannolikhet, kan överskridande gradfördelning hittas som:

var är modellens medelgrad (medelgrad). Det följer av det faktum att genomsnittsgraden för vilken nod som helst är större än genoms genomsnittsgrad. I sociala nätverk betyder det att dina vänner i genomsnitt har fler vänner än du. Detta är känt som vänskapsparadoxen . Det kan visas att ett nätverk kan ha en gigantisk komponent om dess genomsnittliga överskottsgrad är större än en:

Tänk på att de två sista ekvationerna bara är för konfigurationsmodellen och för att härleda överdriven gradfördelning av ett riktigt ordnätverk, bör vi också lägga till gradskorrelationer.

Metoden Generera funktioner

Genereringsfunktioner kan användas för att beräkna olika egenskaper hos slumpmässiga nätverk. Med tanke på fördelningen grad och överskottsgrad fördelning av något nätverk, och respektive, är det möjligt att skriva två potensserier i följande former:

och

kan också erhållas från derivat av :

Om vi ​​känner till genereringsfunktionen för en sannolikhetsfördelning kan vi återställa värdena genom att differentiera:

Vissa egenskaper, t.ex. momenten, kan enkelt beräknas från och dess derivat:

Och i allmänhet:

För Poisson -fördelade slump nätverk, såsom ER diagrammet , är att anledningen till teorin om slumpmässiga nätverk av denna typ är särskilt enkel. Sannolikhetsfördelningarna för 1: a och 2: a närmaste grannar genereras av funktionerna och . I förlängningen genereras distributionen av -th grannar av:

, med iterationer av funktionen som verkar på sig själv.

Det genomsnittliga antalet första grannar, är, och det genomsnittliga antalet andra grannar är:

Graddistribution för riktade nätverk

In / ut-gradfördelning för Wikipedia's hyperlänkgraf (logaritmiska skalor)

I ett riktat nätverk har varje nod en viss grad och en viss grad som är antalet länkar som har gått in och ut ur den noden med respekt. Om är sannolikheten för att en slumpmässigt vald nod har in- och utgrad kan genereringsfunktionen tilldelad denna gemensamma sannolikhetsfördelning skrivas med två värdesaker och som:

Eftersom varje länk i ett riktat nätverk måste lämna någon nod och ange en annan, är det genomsnittliga antalet länkar som går in i en noll noll. Därför,

,

vilket innebär att generationens funktion måste uppfylla:

var är medelvärdet (både in och ut) för noderna i nätverket;

Med hjälp av funktionen kan vi återigen hitta genereringsfunktionen för in / ut-gradfördelningen och i / ut-överdriven gradfördelning, som tidigare. kan definieras som genereringsfunktioner för antalet ankommande länkar vid en slumpmässigt vald nod, och kan definieras som antalet ankommande länkar till en nod som nås genom att följa en slumpmässigt vald länk. Vi kan också definiera genereringsfunktioner och för antalet som lämnar en sådan nod:

Här, det genomsnittliga antalet 1st grannar, eller som tidigare infördes som är och det genomsnittliga antalet 2nd grannar kan nås från en slumpmässigt vald nod ges av: . Detta är också antalet första och andra grannar från vilka en slumpmässig nod kan nås, eftersom dessa ekvationer är uppenbart symmetriska i och .

Graddistribution för signerade nätverk

I ett signerat nätverk har varje nod en positiv och en negativ grad som är det positiva antalet länkar och det negativa antalet länkar som är kopplat till den noden med respekt. Så och beteckna negativ gradfördelning och positiv gradfördelning för det signerade nätverket.

Se även

Referenser