Lineáris algebra/Permutáló mátrixok
A permutáló mátrix fogalma
[szerkesztés] Definíció (P.1.):
[szerkesztés]
Egy n×n-es mátrixot permutáló mátrixnak (magyarul: átrendező mátrixnak) nevezünk, ha minden sorában és minden oszlopában egy és csak egy cellában 1-es áll, a többi elem a sorokban, illetve oszlopokban nulla.
A fentiek szerint egy P permutáló mátrix minden i∈Nn sorindexéhez létezik egy f(i) oszlopinex, amelyre pi,f(i) = 1, míg a j∈Nn, j≠f(i) oszlopindexekre pi,j = 0. Az f(i) oszlopindexet a mátrix i-edik sorának főindexének, avagy sor-főindexének nevezzük, a pi,f(i) = 1 elemet pedig a mátrix i-edik sora főelemének, vagy sor-főelemének.
Hasonló igaz az oszlopokra is, minden j oszlopindexhez létezik egy g(j) sorindex, amelyre pg(j),j = 1, míg az i∈Nn, i≠g(j) sorindexekre pi,j = 0. A g(j) oszlopindexet a mátrix i-edik oszlopának főindexének, avagy oszlop-főindexének nevezzük, a pg(j),j = 1 elemet pedig a mátrix j-edik oszlopa oszlop-főelemének.
Ha mást nem mondunk, főindexen sor-főindexet értünk.
A „permutáló mátrix” kifejezés rövidítésére a p.m. betűket is alkalmazzuk a továbbiakban.
Példák
[szerkesztés]Példa 2×2-es, 3×3-as és 4×4-es permutáló mátrixra:
Az A sor-főindexei f(1) = 2, f(2) = 1. A B sor-főindexei f(1) = 2, f(2) = 1, f(3) = 3. Az A,B mátrixok véletlenül szimmetrikusak a főátlóra, ezért az oszlopindexek ugyanazok, mint a sorindexek: g(1) = 2, g(2) = 1; illetve g(1) = 2, g(2) = 1, g(3) = 3. A C sor-főindexei rendre 2,3,1,4; míg oszlop-főindexei rendre 3,1,2,4.
A permutáló mátrix átrendezi az elemeket
[szerkesztés]Hogyan megy ez a gyakorlatban?
[szerkesztés]Vektorok átrendezése
[szerkesztés]A permutáló mátrixokkal való szorzás felcseréli a vektorok elemeit, azok sorrendjét megváltoztatja. Jelöljük a továbbiakban az (1 2 3 ... n) sorvektort pn*-gal, transzponáltját pedig pn-nel! Példa arra, mit csinál a fenti A mátrix p2* = (1 2)-vel, illetve a B mátrix a p3* = (1 2 3)-mal mint sorvektorral (a vektorokat jobbról szorozva a mátrixokkal); illetve a megfelelő oszlopvektorral (ezeket balról szorozva a mátrixokkal):
illetve
Ha sorvektort szorzunk a permutáló mátrixszal jobbról, akkor eredményül szintén sorvektort kapunk. A sorvektort az oszlopokkal kombináljuk, vagyis a j-edik eredményoszlopban (a sorvektor és a permutáló mátrix j-edik oszlopának kombinációja) csak az a sorelem szerepel 1 együtthatóval, amelynek indexe megegyezik az oszlopban álló egyes sorindexével - a sor többi eleme 0-val szorzódva eltűnik. Tehát sorvektor szorzásakor, a j-edik oszlop kiszámításakor meg kell nézni, a j-edik oszlopban hányadik elem 1-es, legyen a k-adik, és ekkor a sorvektor k-adik eleme lesz az eredményvektor j-edik eleme.
A továbbiakban, tömörsége miatt, az illusztrációk során elsősorban az oszlopvektoros jelölésmódot alkalmazva beszélünk a permutáló mátrixokról.
Mátrixok átrendezése
[szerkesztés]MIndezek után talán nem is meglepő, hogy a permutáló mátrixszal való szorzás magukat a mátrixokat is átrendezi: a vele való jobbról szorzás a sorok elemeit (azaz az oszlopokat) cseréli fel egymás között, míg a velük való balról szorzás a másik szorzandó mátrix oszlopainak elemeit (azaz: a sorokat) cserélgeti.
Illusztrációul: legyen . Ekkor
Ezeket összefoglalva is érdemes kimondani:
A főindexalak és az átrendezési törvények
[szerkesztés]Definíció (főindexalak):
[szerkesztés]
Egy π(n): N(n)→N(n) kölcsönösen egyértelmű (bijektív) függvényt e halmaz (az 1,2,...,n elemek) egy permutációjának, avagy átrendezésének nevezzük. Szokás még az „n-edrendű permutáció” elnevezés használata is. Azt, hogy a permutáció melyik elemet melyik elembe viszi, így jelöljük: , még rövidebben csak így: .
Legyen A n×n-es permutáló mátrix, melyre igaz, hogy i-edik sorában az f(i)-edik elem (a főelem) 1-es, a többi nulla. Ekkor a mátrixot hasonlóan jelöljük, mintha permutációról lenne szó, csak szögletes zárójelek közé írjuk, jelezve, hogy ez nem oszlopvektor, hanem permutáló mátrix rövid alakja. A következő jelölésről van szó:
Ezt a szimbólumot az A permutáló mátrix főindexalakjának nevezzük és röviden az [A] ill. [fA(i)] szimbólumokkal is jelöljük. Ne feledjük, ez azt jelenti, hogy a p.m.-szal balról szorzás esetén az i-edik sorba kell a szorzandó mátrix f(j)-edik sorát átpakolni.
Példák
[szerkesztés](A B mátrix helyett olyat kerestünk, ami nem szimmetrikus, hogy látszódjék: a sorokban lévő egyes oszlopindexe - és nem az oszlopelem sorindexe - adja a szögletes zárójeles jelölés ugyanazon sorban lévő elemét):
Nevezetes példa permutáló mátrixra az n×n-es En egységmátrix, melynek alakja és főindexalakja:
Az átrendezési törvények
[szerkesztés]Permutáló mátrixszal való szorzás balról a szorzandó mátrix sorait egymáshoz viszonyítva átrendezi, a sor mint vektor (az elemsorrend) azonban nem változik; míg a jobbról szorzás az oszlopokat rendezi át, az oszlopok elemsorrendjének megtartásával.
- Balról való szorzásnál a permutáló mátrix i-edik sorának j-edik cellájában álló egyes a szorzandó mátrix j-edik sorát teszi az i-edik sor helyére
- Jobbról szorzásnál a permutáló mátrix j-edik oszlopának i-edik cellájában álló egyes a szorzandó mátrix i-edik oszlopát teszi a j-edik helyre.
Bizonyítás:
- A balról szorzásra (sorok átrendezésére) vonatkozó állítást bizonyítjuk.
- Legyen A tetszőleges n×n-es permutáló mátrix, melynek főindexalakja , legyen a szorzandó mátrix . Ekkor definíció szerint az AB n×n-es szorzatmátrix i-edik sorában és j-edik oszlopában álló eleme . Ez azt jelenti, a szorzatmátrix i-edik sorába (tehát ha az „i” indexet az abi,j kifejezésben rögzítettnek gondoljuk ) a szorzandó mátrix f(i)edik sorának elemei kerülnek, egyéb változtatás nélkül. Ezt akartuk belátni.
- Még precízebb bizonyítás adható a szumma-jelöléssel: , és az eredményből levont következtetést ld. a fentebbi szöveges sorokban. QED.
- A jobbról szorzásra vonatkozó állítás hasonlóan bizonyítható, csak a sor-főindexek helyett az oszlop-főindexeket kell nézni: , azaz a szorzatmátrix j-edik oszlopa a B mátrix g(j)-edik oszlopának elemeiből áll.
Dolgozzuk át a szummajeles bizonyítást a jelek elemenkénti kifejtésével úgy, mint ahogy a balról szorzás bizonyításánál szerepel!
A főindexalak a sorindexek egy permutációja
[szerkesztés]Ha az i∈Nn indexhez hozzárendeljük az A mátrix F(A) = [f(i)] főindexalakjának i-edik f(i) elemét, az így nyert f leképezés az Nn halmazt kölcsönösen egyértelműen képezi le önmagára, azaz e halmaz egy permutációja.
(Szemléletesen ez pont azt jelenti, hogy p.m. minden sorában egy és csak egy helyen áll 1-es, a többi elem nulla).
Bizonyítás:
- A bizonyításhoz megmutatjuk, hogy f injektív (két különböző indexhez különböző főindex tartozik); és szürjektív (f értékkészletének minden index az eleme).
- Legyen i,j∈Nn és i≠j; ekkor f(i)∈Nn ill. f(j)∈Nn az i-edik sor azon, az 1. definícióból következően egyértelműen létező cellájának egyértelműen létező oszlopindexe, melyre a mátrix (i,j)-edik eleme 1 (a többi nulla). Ha f(i)=f(j) lenne, ez azt jelentené, hogy az f(i)=f(j)-edik oszlopban két sor is lenne (az i-edik és j-edik is), amelyben 1-es áll. ez ellentmond a p.m. definíciójának.
- Megmutattuk, hogy az f függvény egy értéket csak egy helyen vesz fel, most megmutatjuk, hogy minden értéket fel is vesz. Valóban, a p.m. definíciója szerint a j-edik oszlopban van egy és csak egy egyes valamelyik sorban, ennek van sorindexe (mégpedig egyértelműen). Tehát ha j∈Nn tetszőleges (oszlop)index, ehhez van olyan i sorindex, hogy f(i)=j. QED.
Az n×n-es permutáló mátrixok száma
[szerkesztés]Jelöljük (egy T test feletti) összes n×n-es p.m. halmazát PT, n×n-nel! Ha (ahogy az általában lenni szokott) nem fontos, melyik T test feletti mátrixokat nézzük, vagy a valós testről vam szó, akkor a T indexet nem írjuk ki.
(P.2.) Az n×n-es permutáló mátrixok száma n!
[szerkesztés]Tétel: |Pn×n| =n!, azaz az n×n-es permutáló mátrixok száma az n faktoriálisa.
Eszerint például 2! = 1×2 = 2 db. 2×2-es permutáló mátrix van; 5! = 1×2×3×4×5 = 120 db. 5×5-ös p.m. van; 6! = 5!×6 = 720 db. 6×6-os p.m. van, és így tovább.
Bizonyítás: Egyszerű gondolatmenet adja, hogy n! = 1×2×3× ... ×(n-1)×n db. n×n-es permutáló mátrix van. Ugyanis egy ilyen mátrixban n darab egyes van (minden sorban egy darab), és a többi elem nulla, tehát a mátrixot meghatározza, hogy melyik sorban hányadik helyen áll 1-es (vagyis a főindexalakja). Az első sort n-féleképp tölthetjük ki úgy, hogy csupa nulla legyen és egy darab 1-es (egy választás minden oszlop esetében, n oszlop, n választási lehetőség). Ha az első sort már kitöltöttük, a másodikat már csak n-1-féleképp lehet (mert azt a főindexet, ami az első sorban áll, nem választhatjuk.). A harmadik sort hasonló okok miatt n(n-1)(n-2)-féleképp tölthetjük ki, és hasonlóan, ha az i-edik sort már kitöltöttük és a lehetőségek száma L(i), akkor az i+1-edik sort minden kitöltés esetén még L(i)-1-féleképp, összesen L(i)(L(i)-1)-féleképp. Teljes indukcióval adódik L(n)=n!, a részletesebb bizonyítást az Olvasóra bízzuk.
A permutáló mátrixok csoportja
[szerkesztés]A definícióból adódóan két n×n-es permutáló mátrix összege, különbsége, számszorosa (kivéve az egyszeresét), pl. ellentettje sosem permutáló mátrix. Hiszen az összeadás pl. elronthatja azt a tulajdonságot, hogy minden sorban és oszlopban egyetlen elem 1, a többi nulla; , ez nem permutáló mátrix.
Így - fájdalom - a lineáris kombinálás (leszámítva a nagyon triviális esetet, amikor az egyik együttható 1, az összes többi nulla) kivezet az n×n-es permutáló mátrixok köréből.
Két permutáló mátrix szorzata
[szerkesztés]Egyszerű belátni azonban, hogy két n×n-es permutáló mátrix szorzata is permutáló mátrix. Tetszőleges P,Q permutáló mátrixokra igaz az átrendezési törvény értelmében, hogy a P mátrixszal való balról szorzás eredménye egy n×n-es Q' mátrix, melynek sorai megegyeznek Q soraival, csak épp más a sorindexük. Ez a Q' mátrix pedig biztosan permutáló, mert a sorok önmagukban nem változnak, tehát továbbra is minden sorban egy darab 1-es és n-1 db. 0 áll, ahogy Q soraiban; az oszlopok elemeit meg átrendeztük ugyan, de az elemek csak egymás között csereberélődtek, nem változtattuk meg, így az oszlopokban is egyetlen 1 értékű cella kivételével minden cella 0 értékű.
(Ha P i-edik főindexe f(i), akkor az oszlop f(i)-edik eleme egyszerűen átkerült az i-edik sorba, de ugyanabban az oszlopban maradt. Ha a különböző indexű nullákat „nem különböztetjük meg”, akkor végül is csak annyi történt, hogy ha Q j-edik oszlop-főindexe g(j), azaz a g(j)-edik sor cellája 1 a j-edik oszlopban, a többi 0, akkor ennek 1-ese helyére az f(g(j)) indexű sor 0-ja kerül, míg az 1-es az f-1(g(j)) indexű sorba kerül, az ottani, nullát meg nyugodtan áttehetjük az f(g(j)) indexű sorba, ahonnan a nullát az 1 helyére tettük. A "mélyben" nem feltétlenül ez történik, hiszen a nulla cellák egymás közt bonyolultabban csereberélődhetnek, de mivel mindegyikük értéke 0, a mélyebb csereszerkezetnek a jelen szempontból nincs jelentősége.
A szorzási tétel
[szerkesztés]Tétel: n×n-es permutáló mátrixok szorzata is n×n-es permutáló mátrix.
Bizonyítás:
- „Szemléletesen” mondva, a következő: A BA i-edik sora úgy áll elő, hogy a B i-edik sorának elemeit kombináljuk az A oszlopaival. Az i-edik sor minden eleme nulla, kivéve egyet, ez legyen a k-adik. Ha az A j-edik oszlopa olyan, hogy abban nem a k-adik elem az 1, akkor a sor-oszlop kombináció értéke 0 lesz. De van egy és csak egy oszlop, mondjuk a h-adik, amelyben a k-adik elem nulla, és ekkor a kombináció értéke 1 lesz, vagyis a szorzatmátrix i-edik sorában pontosan a h-adik elem lesz 1, a többi nulla. Hogy ilyen oszlop pontosan egy van az A mátrixban, azt a következőképp láthatjuk be: i) ha nem lenne, akkor az A oszlopainak k-adik elemei, aza a k-adik sor elemei mind nullák lennének, de hisz ez ellentmond a permutáló mátrix definíciójának, miszerint a k-adik sorban van egy 1-es. Mégpedig pontosan egy darab 1-es van, azaz 1 olyan oszlop van, mely k-adik eleme 1-es, hisz különben a k-adik sorban két elem is 1 lenne, ellentmondva a permutáló mátrix definíciójának. Arra jutottunk tehát, hogy a BA mátrix minden sora csupa nulla, egyetlen 1 elemet kivéve. Hasonlóan bizonyítható, hogy minden oszlop is csupa nulla, egyetlen 1 elemet leszámítva.
- Precíz bizonyítás adható a szumma-jelöléssel:
- Legyenek A,B tetszőleges n×n-es permutáló mátrixok, melyeknek főindexalakja és .
- Ekkor
. - Ez pontosan azt jelenti, hogy adott i (sorindex)re, a szorzatmátrix e sorának minden (j-edik) eleme a b-nek az fA(i)-edik sorából való (a j-edik oszlopból), tehát (amit eddig is tudtunk) a szorzás a B fA(i)-edik sorát helyezi a szorzatmátrix i-edik sorába; ami az átrendezési törvényhez képest újdonság, hogy most a B mátrixról is tudjuk, hogy permutáló, azaz az fA(i)-edik sorában (a szorzatmátrix i-edik sora) pontosan egy eleme 1 (az fB(fA(i))-edik oszlopban), a többi elem 0. Ergo AB minden sora mindenhol nulla, kivéve egyetlen 1 értéket.
- Igaz ez az AB oszlopaira is, ugyanis a fentiek szerint az AB j-edik oszlopa a oszlopvektor, és mivel az fA(i): Nn→Nn függvény a fentiek szerint egy-egyértelmű, azaz permutációja (átrendezése) a B egyik oszlopának, így a j-edik oszlopban is csak 1 darab egyes van, a többi nulla. Még egyszerűbben interpretálva a fenti formális bizonyítást a következőről van szó: ha az AB szorzatot úgy tekintjük, hogy az A p.m.-szal való jobbról szorzás a B oszlopait mint vektorokat helybenhagyja, csupán egymáshoz képest mozgatja el, tehát az AB oszlopai "tulajdonképp" a B oszlopai. Ezért az oszlopok minden eleme nulla, egyetlen 1 elem kivételével, így AB az oszlopait tekintve is teljesíti a p.m. voltához szükséges feltételt. QED.
Megjegyzés: A két p.m. szerepe teljesen szimmetrikus, így külön a jobbról szorzásra való tételt természetesen szükségtelen bizonyítani.
Permutáló mátrix inverze
[szerkesztés]Permutáló mátrix inverzének megszerkesztése
[szerkesztés]Megjegyzés: Ha a szemléletre hagyatkozunk, konkrét esetben szinte mindig felismerhetjük, vagy legalábbis bonyolult lineáris egyenletrendszerek megoldása nélkül is megszerkeszthetjük egy permutáló mátrix inverzét.
Legyen pl. , ez ugye "azt csinálja", hogy előre az oszlopvektorok második elemét teszi (mivel az első sorban a második helyen áll 1-es, az oszlopvektorból a második elem fog nem-eltűnni), hasonlóan, másodjára a negyedik elemet, harmadjára az első elemet, és az utolsó helyre a harmadikat. Vagyis: a permutációról van szó.
Mit tegyünk, ha a hatását vissza akarjuk csinálni? Ne feledjük, egy olyan B mátrixot akarunk készíteni, amelynek n-edik sora megszabja, az eredményvektor n-edik eleme mi lesz. Az első elem a harmadik helyre került, tehát most a harmadik elemet az első helyre kell "visszatennünk", így az első sor (0 0 1 0). Hasonlóan, a második elem az első helyre került, így az eredményvektor második cellájának kiszámolásakor az első elemet kell meghagyni, a B sorának első cellájába 1-et írva, így a mostani első elem, az eredeti második, újból a második helyre fog kerülni. A B második sora (1 0 0 0). Hasonlóan, a harmadik sorban oda kell 1-et írni, ahányadik helyre a hármas került: (0 0 0 1). Végül az utolsó sor (0 1 0 0). Tehát: A balinverze
Látható-sejthető, hogy a főátlójára történő tükrözésével kapjuk egy permutáló mátrix inverzét, másképp mondva egy permutáló mátrix inverze a transzponáltja, harmadik módon mondva, a permutáló mátrixok önmagukra ortogonálisak.
És valóban,
Végezzük el a fenti szorzást számolás nélkül, az "átrendezési törvények" felhasználásával!
Még rövidebb szemléletes bizonyítás: a D mátrixot a balinverzével szorozva, a (bal)inverz definíciója szerint, az eredmánymátrix az n×n-es egységmátrix kell legyen. Ennek i-edik sorának pontosan az i-edik eleme 1 (a többi nulla); és ez az elem a balinverz i-edik sorának és a D i-edik oszlopának skaláris szorzata. E skaláris szorzat értéke pontosan akkor lesz 1, hogy ha a D mátrix i-edik oszlopának a k-adik eleme az 1 (gD(i) = k), akkor a balinverz i-edik sorában is a k-adik oszlopban álló elem értéke kell hogy egy legyen, különben a skaláris szorzatban nem az 1-esek szorzódnak össze, hanem minden tagban mint kéttényezős szorzatban az egyik tényező 0, így a skaláris szorzat értéke is nulla. Ergo, a balinverz i-edik sorának k-adik eleme 1, a többi sorelem 0, míg a D-ben az i-edik oszlop k-adik eleme 1, a többi oszlopelem 0. ez pont azt jelenti, hogy a két mátrix (D és a balinverze) egymás transzponáltja. Hasonló igaz D-re és annak jobbinverzére, pl. ekkor D a jobbinverzének balinverze, tehát D transzponáltja a jobbinverzének.
P.m. inverze is p.m.
[szerkesztés]Permutáló mátrixnak van inverze, és az is permutáló mátrix; mégpedig az inverz a mátrix transzponáltja (főátlóra való tükörképe).
Bizonyítás:
- Ld. fent.
- Formálisan:
- Permutáló mátrixnak van jobbinverze, és az is p.m. Legyen , és keressük azt az X n×n-es mátrixot, amelyre teljesül PX = En. Ha van ilyen mátrix, akkor az átrendezési tételt alkalmazva, érvényes, hogy . A(z jobb)inverz definíciója szerint ennek az n×n-es egységmátrixnak kell lennie, azaz . Ennélfogva, felhasználva, hogy az f leképezés permutációja az értelmezési tartományának, írható , ami azt jelenti, az X mátrix minden sora az egységmátrix egy adott sora, és minden oszlopa az egyságmátrix valamely oszlopa, vagyis X minden sorában és minden oszlopában is pontosan 1-1 elem egyenlő 1-gyel, a többi elem nulla; s így X p.m. (látható, hogy a sor-oszlop kettős indexek használatán kívül, e „formális” bizonyítás nem jelent sok újdonságot a „szemléletes”-hez képest).
- Permutáló mátrixnak van balinverze, és az is p.m.
- A balinverz ugyanaz, mint a jobbinverz.
- Tehát van inverz, mégpedig a p.m. főátlóra való tükörképe.
- Determináns segítségével: Ha alkalmazzuk azt a tételt, hogy egy n×n-es mátrixnak épp akkor van akár balinverze, akár jobbinverze, ha reguláris, azaz determinánsa nem nulla, és ekkor a balinverz egyezik a jobbinverzzel; akkor elegendő csak azt belátnunk, hogy bármely permutáló mátrix reguláris.
A p.m.-ok a mátrixszorzással egységelems csoportot alkotnak
[szerkesztés]Ugyanis:
- Az egységmátrix p.m., tehát a szorzásra nézve egységelem,
- Két p.m. szorzata is p.m. (fentebb)
- P.m. inverze is p.m.