This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Algebra Liniowa. Informatyka/Ekonometria, SGGW 2014Zalecana literatura
Teresa Jurlewicz, Zbigniew Skoczylas, Algebra liniowa 1, Definicje twierdzenia , wzoryOficyna Wydawnicza GiS, Wrocław 2003.Teresa Jurlewicz, Zbigniew Skoczylas, Algebra liniowa 1,przykłady i zadania
Chcemy pokazać, że z założenia wynika teza Z ⇒ T . Możemy to uczynić na kilka sposobów.
1. Bezpośrednio
Przykład 1.1 Pokazać, że jeśli liczby całkowite a i b są parzyste to także ich iloczyn jestparzysty.
Dowód. Liczby całkowite a, b mają postać a = 2a′ , b = 2b′ gdzie a′, b′ są liczbami całkowi-tymi. A wówczas ich iloczyn ab = 2a′ · 2 · b′ też jest liczbą parzystą.
2. Przez kontrapozycję (zaprzeczenie):
(Z ⇒ T )⇔ (∼ T ⇒∼ Z)
Przykład 1.2 Pokazać, że jeśli suma dwu liczb naturalnych jest 99 to co najmniej jedna znich jest większa od 50.
Dowód. Zakładamy, że obie liczby a, b są mniejsze od 50.Pokażemy, że ich suma jest mniejsza od 99.Ponieważ a < 50 , b < 50 oraz obie liczby są całkowite więc a ¬ 49 oraz b ¬ 49. A stąd
a+ b ¬ 49 + 49 = 98 < 99.
3.Sprowadzenie do sprzeczności (absurdu)
3
Przykład 1.3 EuklidesIstnieje nieskończenie wiele liczb pierwszych.
Dowód. Zakładamy, że ilość liczb pierwszych jest skończona: p1, ..., pn. Rozważmy liczbęN = p1 · p2 · · · pn + 1. Liczba ta nie jest liczbą pierwszą a więc dzieli się przez liczbę pierwszą.Ale zauważmy że, dla dowolnej liczby pierwszej p resztą z dzielenia N : p jest 1.
Przykład 1.4 Pokazać, że√2 nie jest liczbą wymierną.
Dowód. Nie wprost. Zakładamy, że√2 jest liczbą wymierną i dojdziemy do sprzeczności.
Zakładamy że istnieją liczby całkowite p, q tż.(pq
)2= 2. Ułamek p
qmożna sprowadzić do
postaci nieskracalnej. Z założenia wynika, że p2 = 2q2. A zatem liczba p musi być parzysta:p = 2p′. A stąd (2p′)2 = 2q2 daje 2(p′)2 = q2. A to oznacza, że q jest parzysta. A to przeczynieskracalności ułamka p/q. Sprzeczność.
4. Poprzez rozpatrywanie przypadków
[(Z1 ∨ Z2)⇒ T ]⇔ [(Z1 ⇒ T ) ∧ (Z2 ⇒ T )]
Przykład 1.5 Pokazać, że dla dowolnej liczby całkowitej n liczba n+ n3 jest parzysta.
Twierdzenie 1.12 Ilość wszystkich możliwych podzbiorów zbioru n-elementowego wynosi 2n.
Dowód.
2n = (1 + 1)n =(n
0
)+(n
1
)+(n
2
)+ · · ·+
(n
n
)
1.11 Kombinatoryka
• Ilość permutacji zbioru n-elementowego wynosi n!,
• Ilość wariacji k-elementowych , z powtórzeniami, zbioru n-elementowego wynosi nk,
• Ilość wariacji k-elementowych , bez powtórzeń, zbioru n-elementowego wynosi n(n−1)(n−2) · · · (n− k + 1),
• ilość podzbiorów k -elementowych zbiory n-elementowego wynosi(nk
).
• Trzech studentów dostaje trzy rózne bilety. Na ile sposobów można je rozdzielić jeśli każdystudent dostaje co najwyżej jeden bilet.
• Pięciu studentów dostaje trzy rózne bilety. Na ile sposobów można je rozdzielić bez żad-nych ograniczeń (jeden może dostać wszystkie).
• Jak wyżej ale jeden student może dostać co najwyżej jeden bilet.
• Jak wyżej ale bilety są jednakowe.
8
2 Liczby Zespolone
x2 = −1
Rozpatrujemy pary a+bi gdzie a, b ∈ R. Pary takie z = a+bi nazywamy liczbami zepolonymia ich zbiór oznaczamy C. Określamy działania:
(a+ bi) + (c+ di) = (a+ c) + (b+ d)i
(a+ bi) · (c+ di) = (ac− bd) + (bc+ ad)i
Własności działań:
• z + z′ = z′ + z przemienność
• (z + z′) + z′′ = z + (z′ + z′′) łącznośc
• Liczba 0 = 0 + 0i jest elementem neutralnym względem dodawania: z + 0 = z
• Liczba z′ = −a− bi jest elementem odwrotnym do z = a+ bi : z + z′ = 0
Powyższe własności charakteryzyją grupę przemienną
• (zz′)z′′ = z(z′z′′) łączność mnożenia
• zz′ = z′z przemienność mnożenia
• z(z + z′) = zz′ + zz′′ rozdzielność
• liczba 1 = 1 + 0i jest elementem neutralnym względm dodawania : 1z = z
• dla każdej liczby zespolonej z = 0 istnieje liczba element odwrotny z′ tzn. zz′ = 1
Jeśli spełnione są powyższe warunki to mamy ciało liczboweDowodzimy ostatnią własnośćCzy element z = a+ bi posiada odwrotny? (a+ bi)(x+ yi) = 1. Daje to układ równań:
ax− by = 1; bx+ ay = 0
Układ ten ma dokładnie jedono rozwiązanie: x =a
a2 + b2, y =
−ba2 + b2
. A zatem każda liczba
zespolona z = a+ bi = 0 posiada dokładnie jeden element odwrotny.
9
2.1 Płaszczyzna Gaussa
Dla liczby zespolonej z + xiy określamy rez = x Część rzeczywistą i imz = y część urojoną.Dodawanie po współrzędnych (jak wektory)z = r(cosϕ+ i sinϕ), r =
√x2 + y2 moduł,
ϕ = argϕ -argument : cosϕ =x√
x2 + y2, sinϕ =
y√x2 + y2
Niech z = r(cosϕ+ i sinϕ) , z′ = r′(cosϕ′ + i sinϕ′). Wówczas
Czyli przy mnożeniu moduły się mnożą a argumenty się dodają: |z · z′| = |z||z′|, arg(z · z′) =arg(z) + arg(z′).
Uwaga 2.1 Argument rozumiemy z dokładnością do 2π:
ϕ+ 2kπ , k ∈ Z
Liczbę z = a− bi nazywamy sprzężoną do z. Wówczas:
z · z′ = x2 − (iy)2 = x2 + y2 = |z|2
2.2 Wzór de Moivre’a
[r(cosϕ+ i sinϕ)]n = rn(cos(nϕ) + sin(nϕ))
• (1 + i√3)9 =?.
z = (1 + i√3) = 2(
12+
√32i) = 2(cos(
π
3) + sin(
π
3)). A więc
z9 = [2(cos(π
3) + sin(
π
3)]9 = 29(cos(3π) + i sin(3π)) = −29
2.3 Pierwiastkowanie liczb zespolonych
Definicja 2.2 Liczbę ω ∈ C nazywamy pierwiastkiem stopnia n z liczby z ∈ C ⇐⇒ ωn = z 2
Niech z = 0. Oznaczmy z = r0(cosϕ0 + i sinϕ0) i przypuśćmy, że ω = r(cosϕ + i sinϕ) jestpierwiastkiem stopnia n. Wówczas r0 = rn oraz nϕ = ϕ0 + 2kπ gdzie k ∈ Z. A zatem r = n
√r0
oraz ϕk = ϕ0n +2kπn. Ale jeśli k− k′ dzieli się przez n to argumenty ϕk , ϕk′ wyznaczają ten sam
kąt. a stąd.
Twierdzenie 2.3 Liczba zespolona
z0 = r0(cosϕ0 + i sinϕ0) = 0
ma dokładnie n różnych pierwiastków stopnia n: ωk = n√r0(cos(
ϕ0 + 2kπn
)+ i sin(ϕ0 + 2kπ
n) dla
k = 0, ..., n− 1.
Przykład 2.4 Gdy z = 1. Wówczas r0 = 1 , ϕ0 = 0 a więc ωk = cos(2kπn) + i sin(
z + 2 = 2i lub z + 2 = −2i a stąd dwa rozwiązania: z1 = −2− 2i , z2 = −2 + 2i.Zauważmy, że są to liczby sprzężone. Ogólnie każde równanie kwadratowe o współczynnikach
rzeczywistych i ujemnej delcie posiada dokladnie dwa pierwiastki zespolone i te pierwiastki sąsprzężone.
Twierdzenie 2.5 (Gauss) Każdy wielomian stopnia n o współczynnikach zespolonych posiadadokładnie n pierwiastków zespolonych (licząc krotności).A zatem wielomian ten można przedstawić w postaci:
f(z) = a(z − z1)(z − z2)...(z − zn)
gdzie a, z1, ..., zn ∈ C.
11
3 Układy równań liniowych. Metoda redukcji Gaussa.{2x −y = −1x +2y = 7Operacje nie zmieniejące zbioru rozwiązań (operacje elementarne)
• Zamiana miejscami dwu równań,
• pomnożenie równania przez liczbę = 0.
• dodanie do jednego równania wielokrotności innego.
Twierdzenie 3.1 Dla dowolnego układu równań liniowych zachodzi dokładnie jedna z możli-wości
• posiada dokładnie jedno rozwiązanie,
• posiada nieskonczenie wiele rozwiązań zleżnych od kilku parametrów,
• jest sprzeczny
12
4 Macierze
Macierzą m× n nazywamy tablicę prostokątną o m wierszach i n kolumnach.a11 a12 . . . a1na21 a22 . . . a2n... ... . . . ...am1 am2 . . . amn
Przykład 4.1(2 13 4
) (1 2 10 2 3
) 124
(1 0 5
)
Oznaczamy również: A = [aij]m×n = [aij].
• gdy m = n to macierz nazywamy kwadratową,
• gdy wszystkie aij ≡ 0 to macierz nazywamy zerową
• Macierz [−aij] nazywamy macierzą przeciwną do macierzy A = [aij]. Oznaczamy ją −A.
Obecnie omawiamy macierze kwadratowe
• gdy aij = 0 dla j = j (tzn. poza przekątną stoją zera) to macierz nazywamy diagonalną 3 0 00 5 00 0 1
• Jeśli aij = 0 dla i > j (tzn. pod przekątną są same zera) to macierz nazywamy trójkątnągórną,jeśli zaś aij = 0 dla i < j (tzn. nad przekątną są same zera) to macierz nazywamy trójkątnądolną
1 2 30 4 50 0 6
1 0 02 3 04 5 6
• Macierz n × n która ma na przekątnej jedynki z poza nią zera nazywamy macierzą jed-nostkową i oznaczamy In.
I3 =
1 0 00 1 00 0 1
4.1 Działania na macierzach
Definicja 4.2 Jeśli A = [aij] , B = [bij] są macierzami tych samych rozmiarów to ich sumąjest macierz
A+B = [aij + bij]
13
(1 2 10 2 3
)+(3 2 13 −1 0
)=(4 4 23 1 3
)Uwaga: Jeśli macierze nie mają takich samych rozmiarów to ich suma nie jest określona.
Definicja 4.3 Iloczynem liczby rzeczywistej λ ∈ R oraz macierzy A = [aij] nazywamy macierz
λ ·A = [λaij]
5 ·(1 −12 3
)=(5 −510 15
)Property 4.4 Jeśli macierze A,B,C są takich samych rozmiarów to
• A+B = B+A przemienność
• (A+B) +C = A+ (B+C) łączność
• A+O = A element neutralny względem dodawania
• A+ (−A) = O element przeciwny
Definicja 4.5 Niech A , B będą macierzami odpowiednio rozmiarów m×k , k×n. Określamyiloczyn macierzy AB jako macierz C rozmiarów m× n gdzie
cij = ai1bij + ai2b2j + ....+ aikbkj
mnożymy wiersze przez kolumny!
Obliczyć iloczyny: (1 −1 22 1 3
) 2 11 32 1
1 1 22 −1 34 −1 2
−121
(1 2 3
) −121
Property 4.6 Własności iloczynu macierzy
• A(B+C) = AB+AC rozdzielność
• (A+B)C = AC+BC rozdzielność
• (AB)C = A(BC) łączność
(o ile powyższe działania są wykonalne!)
Uwaga: Mnożenie macierzy jest na ogół nieprzemienne. tzn jeśli A,B są macierzami kwa-dratowymi n× n to określone są iloczyny AB oraz BA ale na ogół AB = BA
14
4.2 Macierz odwrotna
Rozpatrujemy macirze kwadratowe n × n. Dla kazdej takiej macierzy i macierzy jednostkowejIn zachodzą równości
AIn = InA = A
tzn. macierz jednostkowa jestelementem neutralnym względem mnożenia.
Definicja 4.7 Macierzą odwrotną do macierzy A nazywamy macierz B spełniającą równości
AB = BA = In
Oznaczamy A−1.
Czy każda macierz posiada macierz odwrotną? Jeśli tak to czy tylko jedną?
Znaleźć macierz odwrotna do macierzy A =(1 23 4
)
Oznaczamy B =(a bc d
). Wówczas AB = In oznacza(1 23 4
)(a bc d
)=(1 00 1
)(a+ 2c b+ 2d3c+ 4c 3b+ 4d
)=(1 00 1
)a to oznacza układy równań{
a +2c = 13a +4c = 0
{b +2d = 03b +4d = 1
Po rozwiązaniu: A−1 =(−2 13/2 −1/2
).
Sprawdzamy (1 23 4
)(−2 13/2 −1/2
)=(−2 + 3 1− 1−6 + 6 3− 2
)) =
(1 00 1
)
Algorytm obliczanie macierzy odwrotnej.Dana jest macierz kwadratowaA rozmiarów n×n . Tworzymy nową macierz poprzez dopisa-
nie macierzy jednostkowej [A|In]. Wykonujemy operacje elementarne na wierszach tej macierztak aby po lewj stronie uzyskać macierz jednostkową [In|B]. Wówczas macierz B jest macierząodwrotną.
15
5 Geometria przestrzeni Euklidesowej Rn
Przestrzenie R prosta, R2 płaszczyzna, R3 przestrzeń.Przestrzeń Rn = {(x1, x2, ..., xn);xi ∈ R}.Jest to grupa przemienna względem dodawania.Określamy długość wektora : ∥(x1, ..., xn)∥
def=√x21 + ...+ x2n.
Dla n = 2 ∥a∥ =√x21 + x22 co jest zgodne z twierdzeniem Pitagorasa.
5.1 Iloczyn skalarny
Definicja 5.1 Iloczynem skalarnym wektorów a = (x1, ..., xn), b = (y1, ..., yn) ∈ Rn nazywamyliczbę
< a, b >= x1y1 + ...+ xnyn
Przykład 5.2 < (2, 3, 1), (2, 1, 4) >= 2 · 2 + 3 · 1 + 1 · 4 = 11Własności iloczynu skalarnego:(dla dowolnych a, b ∈ Rn)1. < a, b >=< b, a > (przemienność)
2. < a+ b, c >=< a, c > + < b, c > (addytywność)
3. < λa, b >= λ < a, b > (jednorodność)
4. < a, a > 0 a ponadto < a, a >= 0 ⇐⇒ a = 0.
Dzięki ostatniej własności < a, a >= ∥a∥2.A zatem ∥a∥ =
√x21 + ...+ x2n.
Twierdzenie 5.3 Nierówność SchwartzaDla dowolnych wektorów a, b ∈ Rn zachodzi
| < a, b > | ¬ ∥x∥∥y∥2
A zatem −1 ¬ < a, b >
∥a∥∥b∥¬ +1 dla dowolnych niezerowych wektorów a, b. A zatem określamy
kąt między wektorami a i b jako jedyną liczbę ϕ ∈ [0, π] spełniającą: cos(ϕ) = < a, b >
∥x∥∥y∥. Innymi
słowy definiujemy kąt miedzy wektorami jako arc cos< a, b >
∥x∥∥y∥.
Przykład 5.4 .Obliczyć kąt między wektorami (1, 2), (3, 1) ∈ R2.
< (1, 2), (3, 1) >∥(1, 2)∥∥(3, 1)∥
=5√5√10=1√2. A zatem
ϕ = arc cos1√2=π
42
Wektory a, b nazywamy prostopadłymi (ortogonalnymi) ⇐⇒ ich iloczyn skalarny < a, b >=0. Oznaczamy to a ⊥ b.Zgodnie z tą definicją wektor zerowy jest prostopadły do każdego wektora.
16
5.2 Geometria analityczna przestrzeni R3
Rozpatrujemy przestrzeń R3 z iloczynem skalarnym.
Twierdzenie 5.5 Ustalmy punkt a ∈ R3 oraz niezerowy wektor v = 0 ∈ R3. Wówczas płaszczy-zna przechodząca przez punkt a i prostopadła do wektora v zadaje się równaniem < x−a, v >= 0.2
A zatem jeśli a = (a1, a2, a3), v = (v1, v2, v3), x = (x1, x2, x3) to
0 =< (x1 − a1, x2 − a2, x3 − a3), (v1, v2, v3) >
= (x1 − a1)v1 + (x2 − a2)v2 + (x3 − a3)v3A zatem v1x1 + v2x2 + v3x3 = v1a1 + v2a2 + v3a3 co daje v1x1 + v2x+ 2 + v3x3 = A. Ponieważv1, v2, v3 są dowolnymi liczbami nierównymi jednocześnie zeru węc
Wniosek 5.6 Równanie płaszczyzny ma postać ax + by + cz = d gdzie a, b, c, d są dowolnymiliczbami spełniajacymi a2 + b2 + c2 = 0.
Przykład 5.7 Znaleźć równanie płaszcyzny przechodzącej przez punkt (1, 2, 1) i prostopadłejdo wektora (−2, 1, 3).
< (x−1, y−2, z−1), (−2, 1, 3) >= 0 oznacza −2(x−1)+(y−2)+3(z−1) = 0 −2x+y+3z = 3Moźna też zauważyć, że w równaniu płaszczyzny ax+ by + cz = d współczynniki (a, b, c) =
(−2, 1, 3) skąd równanie −2x+y+3z = d. Wartość d obliczamy wstawiając współrzędne punktu(1, 2, 1) : −2 · 1 + 1 · 2 + 3 · 1 = d skąd d = 3.
Przykład 5.8 Znaleźć równanie płaszczyzny przechodzącej przez punkty P1 = (0,−2, 1) , P2 =(1, 0, 2) , P3 = (1, 3, 0).
Oznaczmy P = (x, y, z). Wówczas wektory P1, P2, P3, P są współplaszczyznowe ⇐⇒ iloczynmieszany P2P1 · P3P1 · PP1 = 0. Obliczamy P2P1 = (1, 2, 1) , P3P1 = (1, 5,−1) , PP1 =(x, y + 2, z − 1). A więc∣∣∣∣∣∣∣
1 2 11 5 −1x y + 2 z − 1
∣∣∣∣∣∣∣ = 5(z − 1) + y + 2− 2x− 2(z − 1)− 5x+ y + 2 = 0co daje −7x+ 2y + 3z +−1.
5.3 Prosta w przestrzeni R3
Prosta w przestrzeni R3 jest wyznaczona przez punkt a iwektor kierunkowy v. Jej równanieparametryczne
R ∋ t→ a+ tv ∈ R3
Przykład 5.9 Prosta przechodząca przez a + (1, 0,−1) o kierunku (2, 1, 3) dana jest poprzezt→ (1 + 2t, t,−1 + 3t). A zatem x = 1 + 2t , y = t , z = −1 + 3t skąd t = x−12 =
y1 =
z+13 . A
zatem równanie parametryczne jest równoważne układowi równań x−12 =y1 =
z+13 .
17
Ogólnie równanie prostej przechodzącej przez (x0, y0, z0) o wektorze kierunkowym (a, b, c) mapostać
x− x0)a=y − y0b=z − z0c
Dwie płaszczyzny nierównoległe w R3 przecinają się wzdłuż prostej. A zatem układ równańax+ by + cz = da′x+ b′y + c′z = d′.
gdzie wektory (a, b, c) , (a′, b′, c′) nie są współliniowe opisuje prostą. Wektorem kierunkowymtej prostej jest iloczyn wektorowy (a, b, c)× (a′, b′, c′)
Definicja 5.10 Iloczynem wektorowym elementów a, b ∈ R3 nazywamy wektor a × b ∈ R3zdefiniowany następująco: ((
a2, a3b2, b3
),
(a3, a1b3, b1
),
(a1, a2b1, b2
))
Jeśli a i b są współliniowe to a× b = 0.W przeciwnym razie a× b jest jedynym wektorem spełniającym warunki:
1. a× b jest protopadły to obu wektorów a oraz b.
2. Długość jego = |a||b| sin(ϕ) (=pole rownoległoboku rozpiętego na na wektorach a i b).
3. Trójka wektorów a , b , a× b wyznacza dodatnią orientację przestrzeni R3.
Własności iloczynu wektorowego
1. a× b = b× a
2. (a+ b)× c = a× c+ b× c
3. (λa)× b = λ(a× b)
4. a× b = 0 ⇐⇒ a ⊥ b 2
Jak obliczać iloczyn wektorowy?Oznaczamy wektory bazy kanonicznej:
→i= (1, 0, 0),
→j= (0, 1, 0),
→k= (0, 0, 1).
Jeśli a = (a1, a2, a3), b = (b1, b2, b3) to wówczas
a× b = det
→i
→j
→k
a1 a2 a3b1 b2 b3
.Przykład 5.11 Obliczyć iloczyn wektorowy wektorów a = (0, 1, 3) , b = (2, 5,−2).
a× b = det
→i→j
→k
0 1 32 5 −2
= −13i+ 6j + 2k = (−13, 6, 2)
18
Przykład 5.12 Obliczyć pole trójkąta wierzchołkach: (1, 2, 3), (4, 2, 1), (0,−1, 2).Obliczamy v = (3, 0,−2) , w = (−1,−3,−1) oraz
v × w = det
→i
→j
→k
3 0 −2−1 −3 −1
= −9k + 2j − 6i+ 3j = −6i+ 5j − 9k = (−6, 5,−9)A zatem pole trójkąta = 12 pole równoległoboku =
12 |v×w| =
12 |(−6, 5,−9)| =
12
√36 + 25 + 49 =
12
√110
5.4 Iloczyn mieszany
Definicja 5.13 Iloczynem mieszanym trójki wektorów a, b, c ∈ R3 nazywamy liczbę < a, b×c >
Twierdzenie 5.14 Niech a = (a1, a2, a3), b = (b1, b2, b3), c = (c1, c2, c3) ∈ R3. Wówczas
< a, b× c >=< a× b, c >=
∣∣∣∣∣∣∣a1 a2 a3b1 b2 b3c1 c2 c3
∣∣∣∣∣∣∣Dowód. b× c =
∣∣∣∣∣∣∣i j kb1 b2 b3c1 c2 c3
∣∣∣∣∣∣∣ =∣∣∣∣∣ b2 b3c2 c3
∣∣∣∣∣ · i−∣∣∣∣∣ b1 b3c1 c3
∣∣∣∣∣ · j +∣∣∣∣∣ b1 b2c1 c2
∣∣∣∣∣ · k. A zatem
< a, b× c >= a1∣∣∣∣∣ b2 b3c2 c3
∣∣∣∣∣− a2∣∣∣∣∣ b1 b3c1 c3
∣∣∣∣∣+ a3∣∣∣∣∣ b1 b2c1 c2
∣∣∣∣∣ =∣∣∣∣∣∣∣a1 a2 a3b1 b2 b3c1 c2 c3
∣∣∣∣∣∣∣2
Iloczyn trójki wektorów oznaczamy a · b · c.
Twierdzenie 5.15 Wartość bezwzględna iloczynu wektorowego a · b · c jest równa objętościrównoległościanu rozpiętego na tych wektorach.W szczególności a ·b ·c = 0 ⇐⇒ wektory te leżą na jednej płaszcyźnie ⇐⇒ są liniowo zależne.Jeśli a · b · c = 0 to tworzą one bazę przestrzeni R3.Jeśli a · b · c > 0 to jest to baza prawoskrętna a jeśli a · b · c < 0 to jest to baza lewoskrętna.
Każde odwzorowanie wzajemnie jednoznaczne zbioru w siebie nazywamy permutacją.Rozpatrujemy zbiory skończone: {1, 2, ..., n}.• Dla n = 2 są dwie permutacje: (1, 2), (2, 1).• Dla n = 3 jest sześć permutacji: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1).• Dla n = 4 mamy 6 · 4 = 24 permutacje: cyfrę 4 możemy postawić na 4 miejscach zaś
pzostałe trzy mozemy permutować na 6 sposobów (jak wyżej).• Ogólnie można pokazać, że ilość permutacji zbioru n elementowego wynosi n!.Zwróćmy uwagę, że przykładowo, permutacja (3, 1, 2, 4) oznacza funkcję σ : {1, 2, 3, 4} →
Definicja 6.1 Niech σ ∈ Sn będzie permutacją. Parę liczb (i, j) takich, że 1 ¬ i < j ¬ n orazσ(i) > σ(j) nazywamy inwersją. Permutację nazwiemy parzystą jesli ilość inwersji jest parzystaa nieparzystą gdy ilość inwersji jest nieparzysta.
Na przykład: (1, 2, 3, 4) - parzysta, (1, 3, 2, 4) - nieparzysta, (4, 3, 2, 1) - parzysta.Mówimy, że znak permutacji (ozn. sgn(σ)) jest równy +1 gdy jest one parzysta, zaś −1 gdy
jest nieparzysta.
6.2 Wyznaczniki
Macierzą m× n nazywamy tablicę prostokątną o m wierszach i n kolumnach.a11 a12 . . . a1na21 a22 . . . a2n... ... . . . ...am1 am2 . . . amn
Gdy m = n to macierz nazywamy kwadratową.
Definicja 6.2 Wyznacznikiem z macierzy kwadratowej A = [aij]n×n nazywamy liczbę∑σ∈Snsgn(σ)a1σ(1)...anσ(n)
∣∣∣∣∣∣∣ = 1 · 5 · 9+4 · 8 · 3+7 · 2 · 6− 3 · 5 · 7− 6 · 8 · 1− 9 · 2 · 4 = ... = 0.Ogólnie ustawiamy (na szachownicy o wymiarach n× n) n wież tak aby żadne dwie się nie
szachowały.
20
Definicja 6.3 Dana jest macierz [aij]n×n. Dopełnieniem algebraicznym elementu akl nazywamywyznacznik macierzy powstały przez wykreślenie k-tego wiersza i l-tej kolumny pomnożony przez(−1)k+l.
Twierdzenie 6.5 Jeśli w macierzy kwadratowej:1) zamienimy miejscami dwa wiersze ( dwie kolumny) to wartość wyznacznika zmieni się
na przeciwną.2) dwa wiersze (dwie kolumny) są identyczne to wyznacznik = 0.3) do jednego wiersza (kolumny) dodamy inny wiersz (kolumnę) pomnożony przez liczbę to
wyznacznik nie ulegnie zmianie.4) każdy element pewnego wiesza (kolumny) pomnożymy przez liczbę to i cały wyznacznik
Definicja 6.6 Układ równań nazywamy cramerowskim ⇐⇒ detA = 0.
Twierdzenie 6.7 Układ cramerowski ma dokładnie jedno rozwiązanie. Dane jest ono wzorem
x1 =detA1detA
, .... , xn =detAndetA
Ex.{x + 2y = 13x + 4y = −1
detA =
∣∣∣∣∣ 1 23 4∣∣∣∣∣ = 4− 6 = −2 = 0.
detA1 =
∣∣∣∣∣ 1 2−1 4
∣∣∣∣∣ = 4 + 2 = 6,detA =
∣∣∣∣∣ 1 13 −1∣∣∣∣∣ = −1− 3 = −4.
A zatem x = 6−2 = −3, y =
−4−2 = 2.
22
7 Przestrzenie liniowe
Definicja 7.1 Przestrzenią liniową (nad ciałem liczb rzeczywistych R) nazywamy niepustyzbiór V z działaniamidodawania v + w ∈ V dla v, w ∈ V orazmnożenia przez liczbę λ · v ∈ V dla v ∈ V, λ ∈ Rktóre spełniają następujące warunki
1. (u+ v) + w = u+ (v + w) łączność dodawania
2. u+ v = v + u przemienność dodawania
3. istnieje element 0 ∈ V taki, że dla każdego elementu v ∈ V zachodzi v + 0 = v (elementten nazywamy wektorem zerowym lub elementem neutralnym względem dodawania).
4. dla każdego elementu v ∈ V istnieje dokładnie jeden element u ∈ V taki,że v + u = 0(element przeciwny.)
6. (λ+ λ′)v = λv + λ′v(rozdzielność mnożenia względem dodawania)
7. (λλ′)v = λ(λ′v)
8. 1v = v
• Rn = {(x1, ..., xn); xi ∈ R} z działaniami dodawania wektorów(x1, ..., xn) + (y1, ..., yn) = (x1 + y1, ..., xn + yn)i mnożenia przez skalarλ · (x1, ..., xn) = (λx1, ..., λxn)Wowczas wektorem zerowym jest (0, 0, ..., 0) zaś elementem przeciwnym do (x1, ..., xn) jest
(−x1, ...,−xn).Geometrycznie są to wektory zaczepione w punkcie (0, ..., 0), dodawanie według reguły rów-
noległoboku.• MacierzeMm×n.Dodawanie [aij] + [bij] = [aij + bij]Mnożenie przez skalar λ[aij] = [λaij]Elementem zerowym jest macierz złożona z samych zer.Elementem przeciwnym do [aij] jest [−aij]• Funkcje ciągłe na odcinku [a, b].Dodawanie (f + g)(x) = f(x) + g(x)Mnożenie przez skalar (λf)(x) = λf(x)Elementem zerowym jest funkcja stale równa 0.Niech V bedzie ustaloną przestrzenią liniową.
Definicja 7.2 Niepusty podzbiór V ′ ⊂ V nazywamy podprzestrzenią liniową ⇐⇒ działanianie wyprowadzają poza podzbiór V ′ tzn. jeśli v, w ∈ V ′ to także v + w ∈ V ′ oraz λv ∈ V ′.
• Podzbiór {x, y, z) ∈ R3;x + y + z = 0} jest podprzestrzenią R3. Podzbiór {x, y, z) ∈R3;x+ y + z = 1} nie jest podprzestrzenią R3.
23
7.1 Linowa niezależność wektorów
Niech V będzie ustaloną przestrzenią liniową.
Definicja 7.3 Kombinacją liniową wektorów v1, ..., vk ∈ V o współczynnikach λ1, ..., λk ∈ Rnazywamy sumę
λ1v1 + ...+ λkvk.
• 2(1, 3)− 3(2, 1) = (−4, 3)Kombinację liniową λ1v1 + ... + λkvk w której wszystkie współczynniki λi = 0 nazywamy
trywialną. Jeśli zaś choć jeden współczynnik λi = 0 to nazywamy ją nietrywialną.
Definicja 7.4 Wektory v1, ..., vk ∈ V nazywamy liniowo zależnymi ⇐⇒ istnieje nietrywialnakombinacja tych wektorów dająca w sumie wektor zerowy.
Innymi słowy wektory v1, ..., vk ∈ V są liniowo zależne ⇐⇒ istnieją współczynnikiλ1, ..., λk ∈ R nie wszystkie równe zeru i takie że
λ1v1 + ...+ λkvk = 0.
W przeciwnym razie wektory nazywamy niezależnymi. Tzn. wektory v1, ..., vk ∈ V są liniowoniezależne ⇐⇒ z tego, że kombinacja liniowa tych wektorów daje wektor zerowy wynika, żeona trywialna. Innymi słowy jeśli λ1v1 + ...+ λkvk = 0 to λ1 = ... = λk = 0• Wektory (1,−1), (−2, 2) ∈ R2 są liniowo zależne bo
2(1,−1) + 1(−2, 2) = (0, 0).
Pokażemy, że wektory (1, 1), (−1, 1) są liniowo niezależne. Przypuśćmy, że a(1, 1)+b(−1, 1) =(0, 0). Pokażemy , że jest to kombinacja trywialna. Otóż powyższa równość daje (a+ b, a− b) =(0, 0) czyli układ równań: a+ b = 0, a− b = 0. Po rozwiązaniu uzyskujemy a = b = 0.
Uwaga 7.5 Wektory v1, ..., vk ∈ V są liniowo zależne ⇐⇒
∀λ1,...,λk∈R (λ1v1 + ...+ λkvk = 0)⇒ (∀iλi = 0)
Wektory v1, ..., vk ∈ V są liniowo niezależne ⇐⇒
∃λ1,...,λk∈R (λ1v1 + ...+ λkvk = 0) ∧ (∃iλi = 0)
Twierdzenie 7.6 Wektory v1, ..., vk są liniowo niezależne ⇐⇒ jeden z nich jest kombinacjąliniową pozostałych.
• Wektory (1, 2, 3), (4, 5, 6), (7, 8, 9) ∈ R3 są liniowo zależne bo 1(1, 2, 3) − 2(4, 5, 6) +1(7, 8, 9) = (0, 0, 0). Z równości tej mozna obliczyć, że np. (7, 8, 9) = −(1, 2, 3) + 2(4, 5, 6).
24
7.2 Baza i wymiar
Rozpatrujemy wektory v1, ..., vk przestrzeni liniowej V .
Definicja 7.7 Wektory v1, ..., vk generują przestrzeń liniową V ⇐⇒ każdy wektor tej prze-streni jest ich kombinacją liniową.
Definicja 7.8 Układ wektorów v1, ..., vk nazywamy bazą przestrzeni liniowej V ⇐⇒ jest onliniowo niezależny i generuje całą przestrzeń V .
• Wektory e1, ...en tworzą bazę przestrzeni Rn. Nazywamy ją bazą kanoniczną. 2
Nie jest to jedyna baza. Pokażemy, że (na przykład) wektory (1, 1), (1,−1) ∈ R2 też tworząbazę. Otóż spróbujmy przedstawić dowolny wektor (a, b) ∈ R2 jako ich kombinację liniową:
(a, b) = x(1, 1) + y(1,−1)
Daje to uklad równań:x+ y = a, x− y = b
Jest to układ Cramera (niezależnie od a, b ∈ R) a zatem posiada on dokładnie jedno rozwiazanie.A zatem wektor (a, b) jest kombinacją liniową wektorów (1, 1), (1,−1).
Twierdzenie 7.9 Wektory a1, ..., ak tworzą bazę przestrzeni V ⇐⇒ każdy element przestrzeniw ∈ V daje się przedstawić jednoznacznie jako kombinacja liniowa tych wektorów (tzn. istniejedokładnie jeden ciąg skalarów α1, ..., αk , że w = α1a1 + ...+ αkak
Dowód. ⇒ Niech w ∈ V . Zdefinicji bazy wynika, że istnieje rozkład
w = α1a1 + ...+ αkak
Jest jedyny rozkład bo gdyby istniał inny
w = β1a1 + ...+ βkak
to odejmując stronami uzyskalibyśmy
0 = (α1 − β1)a1 + ...+ (αk − βk)ak
A zatem wobes liniowej niezależności wektorów: α1 − β1 = α2 − β2 = ... = αk − βk = 0 a więcα1 = β1 , α2 = β2 , ... αk = βk.⇐ Wystarczy pokazać że wektory a1, ..., ak są liniowo niezależne. Niech
α1a1 + ...+ αkak = 0
Ponieważ także0a1 + ...+ 0ak = 0
więc z jednoznaczności rozkładu α1 = ... = αk = 0. 2
Dowód. Weźmy dowolny element w = (b1, ..., bn) ∈ Rn. Pokażmy, że istnieje dokładniejeden ciąg skalarów x1, ..., xn ∈ R , że w = x1v1 + ...+ xnvn. Innymi słowy
Zauważmy , że jeśli L(v1, ..vk−1) = L(v1, ..., vk) to wektor vk jest kombinacją linową wektorówv1, ..., vk−1, A zatem odrzucamy te k dla których Vk−1 = Vk. Pozostałe wektory, oznaczmy jeznów v1, ..., vk spełniają:
•L(v1) ⊂ L(v1, v2) ⊂ ... ⊂ L(v1, ..., vn) = V
przy czym każda inkluzja jest ostra
• żadne vi nie jest konbinacją liniową poprzednich v1, ..., vi−1.
Pokażemy , że wektory te tworzą bazę.Wiemy, że L(v1, ..., vn) = V czyli wektory generują całe V . Pozostaje pokazać, że są liniowo
niezależne. Przypuśćmy, żeα1v1 + ...+ αkvk = 0
Przypuśćmy , że jest to kombinacja nietrywialna. Niech j oznacza największy wskaźnik dlaktórego αj = 0. Wówczas
α1v1 + ...+ αjvj = 0
26
skądvj = −
α1αjv1 − ...−
αj−1αj
vj−1
co daje vj ∈ L(v1, ..., vj−1) wbrew założeniu. 2
Wniosek 7.12 Każda przestrzeń liniowa skończenie generowana posiada bazę. 2
Uwaga 7.13 Jest to także prawdziwe dla dowolnej przestrzeńi , niekoniecznie skończenie ge-nerowanej. 2
Twierdzenie 7.14 Każde dwie bazy tej same przestrzeni mają tę samą ilość elementów. 2
Definicja 7.15 Wymiarem przestrzeni liniowej nazywamy ilość elementów (dowolnej) bazy tejprzestrzeni. Oznaczamy dimV .
• dimRn = n. (Baza kanoniczna e1, ..., en.)
•Wymiar przestrzeni V = {(x, y, z); x+y+z = 0} wynosi 2. (Bazą jest np. (1, 0,−1), (0, 1,−1).)
•Wymiar przestrzeni wielomianów stopnia¬ n jest n+1. (Bazą są jednomiany 1, x, x2, ..., xn.)
• Rozpatrując C jako przestrzeń liniową nad sobą mamy dimC C = 1. Natomiast dimR C = 2
Niech będą dane trzy bazy przestrzeni V : e1, ..., en ; e′1, ..., e′n ; e
′′1, ..., e
′′n. Niech P będzie
bazą przejścia od bazy {ei} do {e′j} zaś Q macierzą przejścia do {e′j} do {e′′k}. Co jest macierząprzejścia od {ei} do {e′′k} ?
Twierdzenie 8.2 Przy powyższych oznaczeniach macierzą przejścia od bazy {ei} do {e′′k} jestiloczyn macierzy PQ.
Dowód: Przypomnijmy,że dla dowolnego wektora x ∈ V xB1 = PxB2 oraz xB2 = QxB3 . Azatem xB1 = PxB2 = PQxB3
Wniosek 8.3 Jeśli P jest macierzą przejścia od bazy B1 do B2 to macierzą przejścia od B2 doB1 jest P−1.
Dowód. Jeśli P jest macierzą przejścia od bazy B1 do B2 zaś Q jest macierzą przejścia odB2 do B1 to PQ jest macierzą przejścia od B1 do B1 a więc PQ = I. Podobnie QP = I a więcQ = P−1. 2
29
9 Przekształcenia liniowe
Dane są przestrzenie liniowe V,W .
Definicja 9.1 Odwzorowanie f : V → W nazywamy liniowym ⇐⇒
• f(v + v′) = f(v) + f(v′) dla dowolnych v, v′ ∈ V
• f(λv) = λf(v) dla dowolnych v ∈ V , λ ∈ R
2
• Odwzorowanie zerowe
• Identyczność: id : V → V (tzn. I(x) = x)
• Odwzorowanie stałe f : V → W f(V ) = v0 jest liniowe ⇐⇒ v0 jest wektorem zerowym.
• f : R2 → R2 dane wzorem f(x, y) = (x− 2y, 3x− y)
Uwaga 9.2 Jeśli f jest odwzorowaniem liniowym to f(0) = 0.
Wniosek 9.4 Gdy f jest odwzorowaniem liniowym to dla dowolnych ai ∈ R , vi ∈ V zachodzi:
f(a1v1 + ...+ akvk) = a1f(v1) + ...+ akf(vk)
co można również zapisać jako
f(k∑i=1
αivi) =k∑i=1
αif(vi)
Twierdzenie 9.5 Odwzorowanie liniowe jest wyznaczone przez swoje wartości na bazie. Tzn.jeśli f, g : V → W są liniowe , v1, ..., vk jest bazą oraz f(vi) = g(vi) dla każdego i = 1, ..., k tof(v) = g(v) dla każdego wektora v ∈ V .
Dowód. Niech v ∈ V i niech v1, ..., vk będzie bazą przestrzeni V . Pokażemy, że f(v) = g(v).Wektor v jest kombinacją liniową elementów bazy: v = α1v1 + ...+ αkvk. A więc
Niech B1 = (v1, ...vm) , B2 = (w1, ..., wn) będą bazami odpowiednio przestrzeni liniowych Voraz W . Niech f : V → W będzie odwzorowaniem liniowym. Wówczas
Nazywamy macierzą odwzorowania liniowego f w bazach B1 , B2.• Dane jest odwzorowanie liniowe f : R2 → R2 wzorem f(x, y) = (x+2y; 3x+4y). Macierzą
bazach kanonicznych jest
A =(1 23 4
)
Zauważmy, że wówczas f(x, y) =(1 23 4
)(xy
)= A
(xy
)I tak jest ogólnie:
Twierdzenie 9.6 Jeśli odwzorowanie f : Rn → Rm jest odwzorowaniem liniowym zaś A ∈Mm×n(R) jest jego macierzą w bazach kanonicznych to
f(x1, x2, ...xm) = A
x1x2..xm
2
Uwaga 9.7 . Wobec powyższego mamy odpowiedniość wzajemnie jednoznaczną między zbioremwszystkich odwzorowań liniowych f : Rn → Rm a zbiorem macierzyMm×n(R).
Jeszcze ogólniej:
Twierdzenie 9.8 Dane jest odwzorowanie liniowe f : V → W oraz bazy B1 = (v,..., vn) ,B2 = (w,..., wm) tych przestrzeni. Wówczas A ∈ Mm×n jest macierzą odwzorowania f w tychbazach ⇐⇒ (y = f(x) ⇐⇒ yB2 = AxB1). 2
31
9.1 Jądro i obraz odwzorowania liniowego
Definicja 9.9 Niech f : V → W będzie odwzorowaniem liniowym. Wówczas
ker(f) = f−1(0) = {v ∈ V ; f(v) = 0}
nazywamy jądrem zaś
im(f) = f(V ) = {w ∈ W ;w = f(v) dla pewnego v ∈ V }
nazywamy obrazem odwzorowania f .
Uwaga 9.10 Jądro i obraz odwzorowania liniowego są podprzestrzeniami.
• Niech f : R2 → R2 będzie dane wzorem f(x, y) = (4x − 2y, 2x − y). Wówczas ker(f) ={(t, 2t); t ∈ R} , im(f) = {(2t,−t) ; t ∈ R}.
Definicja 9.11 Odwzorowanie liniowe f : V →W nazywamy
• monomorfizmem gdy jest różnowartościowe
• epimorfizmem gdy jest ”na” tzn. (im(f) = W ).
• izomorfizmem gdy jest mono i epi (tzn. jest wzajemnie jednoznaczne).
Uwaga 9.12 Odwzorowanie liniowe f jest monomorfizmem ⇐⇒ jest ker(f) = {0}.
Dowód. ⇒ Jeśli v ∈ ker(f) to f(v) = 0 = f(0) a więc z róznowartościowości v = 0. Azatem tylko 0 ∈ ker(f).⇐ Przypuśćmy , że f(v) = f(v′). Pokazujemy, że v = v′. Otóż f(v − v′) = f(v)− f(v′) = 0
skąd v − v′ ∈ ker(f) = {0}. A zatem v − v′ = 0 daje v = v′. 2
• Niech f : R2 → R2 będzie dane wzorem f(x, y) = (x + y, x − y) (inaczej f(x, y) =(1 11 −1
)(xy
)). Pokazujemy, że jest to epimorfizm. Ustalmy (a, b) ∈ R2. Czy istnieje
(x, y) ∈ R2 takie, że f(x, y) = (a, b)?(x+ y, x− y) = (a, b) daje Układ równań x+ y = a , x− y = b. Jest to układ Cramera. A
zatem posiada dokładnie jedno rozwiązanie x = a+b2 , y =a−b2 .
Z tego że istnieje rozwiązanie (przy dowolnie zadanych a, b) wynika, że f jest epimorfozmem,zaś z jednoznacznści wynika ,że f jest monomorfizmem. A zatem jest to izomorfizm. Skądodwzorowanie odwrotne
g(a, b) =(a+ b2
,a− b2
)ktore też okazuje się byc odwzorowaniem liniowym. Jest tak w ogólności.
32
Twierdzenie 9.13 Jeśli f : V → W jest izomorfizmem to istnieje odwzorowanie odwrotneg : W → V które też jest odwzorowaniem liniowym. Ponadto jeśli (w ustalonych bazach) macierzA reprezentuje f to macierz odwrotna A−1 reprezentuje macierz g.
Lemat 9.14 Jeśli wektory v1, .., vn są liniowo niezależne w V oraz f : V → W jest mono towektory f(v1), ..., f(vn) są także liniowo niezależne .
Dowód. Przypuśćmy, że a1f(v1) + ...+ anf(vn) = 0 ∈ W . Wówczas f(a1v1 + ...+ anvn) =0 ∈ W a ponieważ f jest monomorfizmem więc a1v1 + ... + anvn = 0 ∈ V . Ponieważ vektoryv1, ..., vn są z założenia liniowo niezależne więc a1 = ... = an = 0. 2
Lemat 9.15 Jeśli v1, ..., vn generują całą przestrzeń V zaś f : V → W jest epimorfizmem towektory f(v1), ..., f(vn) generują całą przestrzeń W .
Dowód. Niech w ∈ W . Przedstawimy w jako kombinację liniową wektorów f(v1), ..., f(vn).Otóż w = f(v) dla pewnego v ∈ V . Poniewż v1, ..., vn generują V więc v jest ich kombinacjąliniową : v = a1v1+ ...+anvn. Wówczas w = f(v) = f(a1v1+ ...+anvn) = a1f(v1)+ ...+anf(vn).2
Wniosek 9.16 Jeśli wektory v1, ..., vn tworzą bazę przestrzeni V zaś f : V → W jest izomor-fizmem to wektory f(v1), ..., f(vn) tworzą bazę przestrzeni W .
Twierdzenie 9.17 Złożenie dwu odwzorowań liniowych jest odwzorowaniem, liniowym.
Dowód; Niech f : V → V ′ , g : V ′ → V ′′ będą liniowe. Wówczas gf(av + bw) = g(f(av +bw)) = g(af(v) + bg(w)) = a(gf(v)) + b(gf(w)) 2
Ponadto niech będą daneA macierz odwzorowania liniowego f w bazach B(V ) , B(W )B macierz odzorowania liniowego g w bazach B(W ) , B(U)
Wówczas macierzą złożenia gf : V → U w bazach B(V ) , B(U) jest iloczyn BA.
Dowód. Niech C = BA ∈ Mp×n(R). Mamy pokazać, że (gf(vj)) =p∑k=1
ckjuk gdzie ckj =
n∑i=1
bkiaij
Otóż (gf)(vj) = g(f(vj)) = g(n∑i=1
aijwi) =n∑i=1
aijg(wi) =n∑i=1
aij(p∑k=1
bkiuk) =p∑k=1
(n∑i=1
(aijbkiuk) =
p∑k=1
(n∑i=1
bkiaijuk) =p∑k=1
ckjuk
33
9.2 Macierze odwzorowania liniowego w różnych bazach
Niech B1(V ) = (v1, ..., vn) , B2(V ) = (v′1, ..., v′n) będą bazami przestrzeni V zaśB1(W ) = (w1, ..., wn) , B2(W ) = (w′1, ..., w′n) będą bazami przestrzeni W .Niech P ∈Mn×n(R) będzie macierzą przejścia od B1(V ) do B2(V ) zaś
Q ∈Mm×m(R) będzie macierzą przejścia od B1(W ) do B2(W ).
Twierdzenie 9.19 Przy powyższych oznaczeniach:Jeśli:A ∈Mm×n(R) jest macierzą odwzorowania liniowego f w bazach B1(V ) , B1(W )to macierzą w bazach B2(V ) , B2(W ) jest Q−1AP .
Dowód. Wobec poprzedniego twierdzenia dla dowolnych wektorów mamy
y = f(x) ⇐⇒ yB1(W ) = AxB1(V )
A drugiej strony z własności macierzy przejścia mamy:
xB1(V ) = PxB2(V ) oraz yB1(W ) = QyB2(W )
(to ostatnie daje Q−1(yB1(W )) = yB2(W )). A stąd
yB2(W ) = Q−1(yB1(W )) = Q
−1AxB1(V ) = Q−1APxB2(V )
A zatem macierzą odwzorowania liniowego w nowych bazach jest macierz Q−1AP . 2
Wniosek 9.20 Gdy f : V → V , macierzą odwzorowania w bazie B jest A zaś P jest macierząprzejścia od B do B′ jest macierz P to macierz A′ odwzorowania f w bazie B′ jest
A′ = P−1AP
• Niech f : R2 → R2 będzie dane wzorem f(x, y) = (x + 2y, 2x + y). Niech ponadto będądane bazy: B ; (e1 = (1, 0); e2 = (0, 1)) oraz B′ ; ((e′1 = (1, 1); e′2 = (−1,+1))
9.3 Suma prosta podprzestrzeni
Definicja 9.21 Dana jest przestrzeń liniowa W i jej podprzestrzenie V1, V2 ⊂ W . Mówimy,że W jest sumą prostą podprzestrzeni V1, V2 ⇐⇒ każdy wektor w ∈ W daje się zapisaćjednoznacznie jako suma w = v1 + v2 dla pewnych v1 ∈ V1 , v2 ∈ V2. Piszemy W = V1 ⊕ V2.
• R3 = V1 ⊕ V2 gdzie
V1 = {(x, 0, 0);x ∈ R} , V2 = {(0, y, z); y, z ∈ R}
• R2 = V1 ⊕ V2 gdzie
V1 = {(x, y);x+ y = 0} , V1 = {(x, y); x− y = 0}
34
Twierdzenie 9.22 Jeśli W = V ⊕ V ′ orazv1, ..., vk jest bazą V zaś v′1, ..., v
′l jest bazą V
′
to v1, ..., vk; v′1, ...v′l jest bazą W .
Dowód. Czy wektory v1, ..., vk; v′1, ...v′l są liniowo niezależne? Niech
(α1v1 + ...+ αkvk) + (β1v′1 + ...+ βlv′l) = 0
Ponieważ 0 = 0+0 jest również przedstawieniem wektora 0 jako sumy wektorów 0 ∈ V , 0 ∈ V ′więc z jednoznaczności przedstawienia wynika ,że α1v1 + ... + αkvk = 0 , β1v′1 + ... + βlv
′l = 0.
Ponieważ układy wektorów v1, ..., vk oraz v′1, ...v′l są liniowo niezależne jako bazy więc α1 = ... =
αk = 0 oraz β1 = ... = βl = 0.
Czy wektory v1, ..., vk; v′1, ...v′l generują całe W?
Niech w ∈ W , Z założenia w = v + v′ dla pewnych v ∈ V v′ ∈ V ′. Z kolei wektory te dająsie zapisać w odpowiednich bazach:
v = α1v1 + ...+ αkvk v′ = β1v′1 + ...+ βlv′l
a więcw = v + v′ = α1v1 + ...+ αkvk + β1v′1 + ...+ βlv
′l
2
Twierdzenie 9.23 Przestrzeń jest sumą prostą swych podprzestrzeni W = V1 ⊕ V2 ⇐⇒
• W = L(V1 ∪ V2) (tzn. każdy wektor w ∈ W jest postaci W = v1 + v2 dla pewnych v1 ∈ V1, v2 ∈ V2)
• V1 ∩ V2 = {0}
Definicja 9.24 Rzędem odwzorowania liniowego f : V →W nazywamy wymiar obrazu rz(f) =dimf(V ).
• Niech f : R2 → R2 bedzie dane wzorem f(x, y) = (−x + y, x − y), Wówczas im(f) ={(t,−t); t ∈ R}. A zatem rz(f) = dimf(R2) = 1.
Twierdzenie 9.25 Jeśli f : V → W jest odwzorowaniem liniowym to dim(ker(f))+dim(im(f)) =dimV .
Dowód. Rozpatrujemy podprzestrzeń ker(f) ⊂ V . Ustalamy jej bazę v1, ..., vk. Uzupełnia-my ją do bazy przestrzeni V : v1, ..., vk;w1, ..., wl. Przy tych oznaczeniach dim(ker(f)) = k ,dim(W )) = k + l. Twierdzenie będzie udowodnione gdy zostanie pokazane że dim(im(f)) = l.Pozostaje zatem pokazać ,że wektory f(w1), ..., f(wl) tworzą bazę przestrzeni im(f).Pokazujemy ,że wektory te są liniowo niezależne. Niech a1f(w1)+ ...+alf(wl) = 0. Wówczas
f(a1w1 + ... + alwl) = 0 a więc a1w1 + ... + alwl ∈ ker(f). A więc suma ta jest kombinacjąliniową: a1w1+ ...+alwl = b1v1+ ...bkvk co daje b1v1+ ...bkvk−a1w1− ...−alwl = 0 a ponieważwektory te są bazą V więc a1 = ... = ak = b1 = ... = bl = 0.Czy wektory f(w1), ..., f(wl) generują im(f). Niech v ∈ V . Wówczas v = b1v1 + ...bkvk +
a1w1 + ...+ alwl. A zatem f(v) = f(b1v1 + ...bkvk + a1w1 + ...+ alwl) = f(a1w1 + ...+ alwl) =a1f(w1) + ...+ alf(wl) ponieważ f(vi) = 0. 2
35
10 Rząd macierzy. Twierdzenia Kroneckera-Cappelliego
Można go przepisać jakoa11 a12 a13 ... a1na21 a22 a23 ... a2n. . . ... .
am1 am2 am3 ... amn
x1x2..xn
=b1b2..bm
Czyli AX = B gdzie A = [aij]n×n macierz (główna) układu, B =
b1..bm
, X = x1..xn
.Możemy również oznaczyć: A = (A1, ..., An) , gdzie Ai oznaczają kojejne kolumny macierzy A.Oznaczamy poprzez A = (A1, ..., An;B) macierz uzupełnioną układu. A zatem rozwiązujemyrównanie macierzowe AX = B.Twierdzenie. Układ równań Ax = B posiada rozwiązanie ⇐⇒ L(A1, ..., An;B) =
L(A1, ..., An) (tzn gdy rząd macierzy głównej A jest równy rzędowi macierzy uzupełnionej.Dowód.Wektory x1, ..., xn są rozwiązaniem układu Ax = b ⇐⇒ x1A1+x2A2+...+xnAn =
B ⇐⇒ B ∈ L(A1, ..., An) ⇐⇒ L(A1, ..., An;B) = L(A1, ..., An;B).
Uwaga 10.1 . Dla dowolnej macierzy A ∈Mm×n(R) trzy następujące liczby są równe:
1. wymiar przestrzeni kolumn,
2. wymiar przestrzeni wierszy,
3. maksymalny rozmiar podmacierzy kwadratowej o niezerowym wyznaczniku.
Wszystkie te liczby są równe rzędowi macierzy.
•
1 2 34 5 67 8 9
(1, 2, 3)− 2(4, 5, 6) + (7, 8, 9) = (0, 0, 0)
(1, 4, 7)− 2(2, 5, 8) + (3, 6, 9) = (0, 0, 0).
• Rozwiązać układ równań:x + 2y + z = 52x + y − z = 4x − y − 2z = −1
Po obliczeniach det A = 0. A zatem rzA < 3. A zatem rząd =2 gdyż istnieje podmacierz2× 2 o niezerowym wyznaczniku.
36
rz
1 2 1 52 1 −1 41 −1 −2 −1
= rz 1 2 1 52 1 −1 42 1 −1 4
= rz [ 1 2 1 52 1 −1 4
]= 2
Ostatnie równanie odrzucamy.{x + 2y + z = 52x + y − z = 4
{x + 2y = 5 − z2x + y = 4 + z
Podstawiamy parametr z = λ{x + 2y = 5 − λ2x + y = 4 + λA to jest układ równań Cramera (dla każdego λ). Dla ustalonego λ uzyskujemy dokładnie
jedno rozwiązanie x = λ+ 1, y = −λ+ 2, z = λ. 2
Od ilu parametrów zależy rozwiązanie układu równań liniowych (o ile istnieje!)?
Lemat 10.2 Dany jest układ równań AX = B (niejednorodny) i pewne jego rozwiązanieszczególne X1 = (x1, ..., xn)T . Wówczas każde inne rozwiązanie układu AX = B jest posta-ci X = X1 +X0 gdzie X0 jest pewnym rozwiązaniem układu jednorodnego AX = 0.
Dowód. Jeśli X jest rozwiązaniem układu jednorodnego to X0 = X −X1 spełnia równaniejednorodne gdyż
AX0 = A(X −X1) = AX − AX1 = B −B = 0A zatem X = X1 + (X −X1) = X1 +X0. 2
Pozostaje obliczyc wymiar rozwiązań układu jednorodnego a to jest równe ker(fA) gdziefA : Rn → Rm jest odwzorowaniem liniowym danym poprzez macierz A. A to ostatnie wynosidim(ker(fA) = m− dim(f(Rn)) = n− rz(A)
Wniosek 10.3 Jeśli układ równań jest niesprzeczny to rozwiązania jego zależą od n − rz(A)parametrów.
10.1 Ślad macierzy
Śladem macierzy kwadratowej A ∈Mn×n, nazywamy liczbę trA = a11 + a22 + ...+ ann
Twierdzenie 10.4 Jeśli A ∈ Mm×n , B ∈ Mn×m wówczas istnieją iloczyny AB , BA oraztr(AB) = tr(BA).
Dowód. Oznaczmy C = AB ∈Mm×m , D = BA ∈Mn×n. Wówczas
cij = ai1b1j + ai2b2j + ...+ ainbnj =n∑p=1
aipbpj
dij = bi1a1j + bi2a2j + ...+ bimamj =m∑q=1
biqaqj
Wówczas
tr(AB) =m∑q=1
cqq =m∑q=1
n∑p=1
aqpbpq
= m∑q=1
n∑p=1
aqpbpq
37
tr(BA) =n∑p=1
cpp =n∑p=1
m∑q=1
bpqaqp
= n∑p=1
m∑q=1
bpqaqp
2
Wniosek 10.5 Jeśli macierze A,B ∈Mn×n są podobne (tzn. B = P−1AP dla pewnej macie-rzy P ) to trA = trB.
Dowód. tr(B) = tr(P−1AP ) = tr(P−1APP−1) = trA 2
Dla odwzorowania liniowego f : V → V określamy ślad jako tr(f) = trA gdzie A jestmacierzą reprezentującą odwzorowanie f w pewnej bazie.Definicja ta jest poprawna bo jeśli B jest macierzą odwzorowania f w innej bazie to B =
P−1AP i wówczas trB = trA.
38
11 Wektory i wartości własne
Rozpatrujemy odwzorowanie liniowe f : R2 → R2 dane wzorem ( w bazie kanonicznej) f(x, y) =
(x+2y, 2x+y). A zatem macierzą tego odwzorowania (w bazie kanonicznej) jest A =(1 22 1
A zatem macierzą odwzorowania f w (nowej) bazie (1, 1) , (1,−1) jest macierz diagonalna
A′ =(3 00 −1
).
Czy każde odwzorowanie liniowe ma postać diagonalną w pewnej bazie?
Definicja 11.1 Niech V przestrzeń liniowa nad R , f : V → V odwzorowanie liniowe. Nieze-rowy wektor 0 = v ∈ V spałniający f(v) = λv dla pewnego λ ∈ R nazywamy wektorem własnymodwzorowania f . Ponadto liczbę λ nazywamy wartością własną.
Jak znajdywać wektory własne? Czy zawsze taki wektor istnieje? Zauważmy, że jesłi Av =λv oraz v = 0 to (λI − A)v = 0 a stąd det(λI − A) = 0. A stąd definicja
Definicja 11.2 Niech A ∈Mk×k(K) będzie macierzą kwadratową. Wówczas wielomian wA(λ) =det(λI − A) nazywamy wielomianem charakterystycznym macierzy A.
• Niech A =(1 1−2 4
). Wówczas wA(λ) = det(λI − A) = det
(λ− 1 −12 λ− 4
)=
(λ−1)(λ−4)+2 = λ2−5λ+6 Przyrównując ten wielomian do zera uzyskujemy dwa pierwiastki(pojedyńcze) λ1 = 2 , λ2 = 3.
Dla λ1 = 2 uzyskujemy(2− 1 −12 2− 4
)=(1 −12 −2
)A zatem
(1 −12 −2
)(xy
)=(
00
)co daje układ równań x− y = 0 2x− 2y = 0 którego rozwiązaniem jest {(x, x)} a więc
przykładowo v = (1, 1). Podobnie dla λ2 = 3 mamy(3− 1 −12 3− 4
)(xy
)=(2 −12 −1
)(xy
)=(
2x− y2x− y
)a atąd y = 2x i przykładowo v2 = (1, 2).
A zatem w bazie (1, 1), (1, 2) odwzorowanie jest dane poprzez macierz A′ =(2 00 3
)=(
λ1 00 λ2
)
Uwaga 11.3 Jeśli macierze są podobne to ich wielomiany charakterystyczne są równe.
Definicja 11.4 Określamy wielomian charakterystyczny i wartości własne odwzorowania li-niowego f jako takowe dla macierzy tego odwzorowania w jakiejś bazie. Wobec powyższej uwagidefinicja ta jest poprawna.
Brak pierwiastków rzeczywistych. Sa za to pierwiastki zespolone: (λ− 1)2 = −1 skąd λ1 =1 + i , λ2 = 1− i
Uwaga 11.5 • Każda macierz rzeczywista posiada wartość własną zespoloną. Wynika to zzasadniczego twierdzenia algebry.
• Jeśli wymiar macierzy jest nieparzysty to posiada ona przynajmniej jedną rzeczywistąwartość własną.
• W szczególności dla każdego odwzorowania liniowego f : R3 → R3 istnieje prosta L prze-chodząca przez punkt (0, 0, 0) taka że f(L) ⊂ L.
• Niech f(x, y) = (x, x+ y). Wówczas
wf (λ) = det((
λ 00 λ
)−(1 01 1
))
=(λ− 1 0−1 λ− 1
)= (λ− 1)2
A stąd jeden pierwiastek podwójny λ1,2 = 1. Jakie są wektory własne f(x, y) = (x, y), (x, x + y) = (x, y) czyli y = 0 , x dowolne. A zatem jest tylko jeden wektor własny (zdokładnością do stałej!) : v = (1, 0).
40
Będziemy mówili , że wartość własna ma krotność algebraiczną 2 (bo 1 jest pierwiastkiempodwójnym wielomianu charakterystycznego) zaś geometryczną 1 (bo tylko jeden wektor własnyjej odpowiadający) .
Twierdzenie 11.6 Niech f : V → V będzie odwzorowaniem liniowym. Jeśli λ1, ..., λk są wek-torami własnymi odpowiadającymi różnym wartościom własnym to wektory te są liniowo nie-zależne.
Dowód. Dowód indukcyjny względem k ∈ N.Dla k = 1 to jest oczywiste bo wektor własny jest z definicji = 0.Przypuśćmy, że twierdzenie jest prawdziwe dla k. Niech odwzorowanie liniowe f posiada
rózne wartości wlasne λ1, ..., λk+1 i wektory im odpowiadające v1, ..., vk+1. Pokazujemy , że tewektory są liniowo niezależne. Niech a1v1 + ... + ak+1vk+1 = 0. Wówczas 0 = f(a1v1 + ... +ak+1vk+1) = a1f(v1) + ...+ ak+1f(vk+1) = a1λ1v1 + ...+ akλkvk+1 + ak+1λk+1vk+1 = (∗)Z drugiej strony
Z założenia indukcyjnego wektory v1, ..., vk są liniowo niezależne a więc a1(λ1 − λk+1) = ... =ak(λk−λk+1) = 0. Ponieważ wobec założenia wszystkie wartości własne są rózne więc λi−λk+1daje a1 = ... = ak = 0 a więc także ak+1 = 0. 2
Lemat 11.7 Jeśli dla odwzorowania liniowego f : V → V istnieją wektory własne v1, ...vmtworzące bazę V to w bazie tej f jest reprezentowane poprzez macierz diagonalną A gdzie naprzekątnej stoją wartści własne λ1, ..., λm odpowiadające tym wektorom. Wówczas dla dowolnegok ∈ N wektory v1, ..., vk są wektorami własnymi odwzorowania fk zaś wartościami własnymi imodpowiadającymi są odpowiednio λk1, ..., λ
km.
Dowód. 1 sposób. Ponieważ f(vi) = λivi więc f 2(vi) = f(f(vi)) = f(λivi) = λif(vi) =λ2i (vi) i podobnie można pokazać dla k = 3 i ogólnie (indukcja) dla dowolnej liczby naturalnej.2 sposób. W bazie wektorów własnych odwzorowanie f dane jest poprzez macierz
A =
λ1
..
λm
Wystarczy zauważyć, że wówczas Ak =λk1
..
λkm
2
Producenci X,Y walczą o klienta. Cyklicznie co pewien okres czasu odbywają się promocje
po których następuje przepływ klientów który jest opisany macierzą A =(13
12
23
12
)tzn
A =(13
12
23
12
)(xy
)=(
x3 +
y2
2x3 +
y2
)
41
• Dla jakich wartości x, y jest równowaga?
• Co będzie po wielu promocjach?
AX = X , X − AX = 0 , (I − A)X = 0. Czy 1 jest wartością własną?
wf (λ) = det(λI−A) = det(λ− 13 −12−23 λ− 12
)= (λ− 13)(λ−
12)−
13 = λ
2−(13+12)λ+
16−
13 =
λ2 − 56 −16 = 0
λ1 = −16 , λ2 = 1Wektory własne v1 = (1,−1) , v2 = (3, 4).A zatem równowaga będzie dla (x, y) = (3t, 4t) czyli gdy klienci będą w proporcji 3 : 4.
Co będzie po wielu promocjach ?W bazie wektorów własnych (1,−1) , (3, 4) odwzorowanie jest dane poprzez macierz diago-
nalną A′ =(−13 00 1
).
Obliczamy macierz przejścia od bazy standardowej (1, 0), (0, 1) do (1,−1), (3, 4), Jest nią
P =(1 3−1 4
). Macierzą odwrotną jest P−1 ==
(47 −
37
17
17
).
Ponieważ A′ = P−1AP więc A = PA′P−1 skąd
Ak = (PA′P−1)k =
(PA′P−1)(PA′P−1)...(PA′P−1) = PA′kP−1
Ale
(A′)k =((−16)
k 00 1k
)−→
(0 00 1
)= A
′∞
A∞ = PA′∞P−1 =
(1 3−1 4
)(0 00 1
)(47 −
37
17
17
)
=(0 30 4
)(47 −
37
17
17
)=(37x+
37y
47x+
47y
)A zatem po wielu promocjach proporcja klientów będzie się stabilizować na 3 : 4 niezależnie
od danych początkowych.
42
12 Formy kwadratowe
Definicja 12.1 Odwzorowanie ϕ : V → R nazywamy formą kwadratową ⇐⇒ istnieje odzo-rowanie dwuliniowe symetryczne f : V × V → R takie, że ϕ(x) = f(x, x). 2
A zatem w ustalonej bazie
ϕ(x1, ..., xn) =∑
aijxixj = a11x21 + ...+ annx2n +
∑1=i<j=n
2aijxixj
Przykłady form kwadratowych:
ϕ(x, y, z) = x2 + 2y2 − 3z2 , ψ(x, y, z) = xy − yz + 4xz
Uwaga 12.2 Każde odwzorowanie dwuliniowe symetryczne wyznacza formę kwadratową i naodwrót.
• Wyznaczyć macierz formy kwadratowej f(x, y, z) = x2 − 2y2 + 3z2 − xy + 4xz + 3xz.
A =
1 −0.5 2−0.5 −2 1.52 1.5 3
Definicja 12.3 Dwie formy kwadratowe o macierzach A,B nazywamy równoważnymi ⇐⇒B = P TAP dla pewnej macierzy odwracalnej P .
Wniosek 12.4 Każda forma kwadratowa jest równoważna formie w postaci kanonicznej tzn.ϕ(x1, ..., xn) = d1x21 + d2x
22 + ...+ dnx
2n , (di ∈ R).
Definicja 12.5 Sygnaturą formy kanonicznej nazywamy parę liczb (p, q) gdzie p = ilość di > 0zaś q = ilość di < 0.
Okazuje się , że sprowadzając formę kwadratową do postaci kanonicznej , co można uczynićna wiele sposobów, zawsze uzyskujemy formę o tej samej sygnaturze. A zatem można określićsygnaturę dowolnej formy kwadratowej jako sygnaturę formy kanonicznej jej odpowiadającej.
Twierdzenie 12.6 Twierdzenie o bezwładności form kwadratowych, Sylvester, Jacobi.Dwie formy kanoniczne są równoważne ⇐⇒ mają jednakową sygnaturę. 2
Jedną z podstawowych własności ze względu na zastosowania jest znak jaki przyjmuje formakwadratowa.
Definicja 12.7 Formę kwadratową f : Rn → R nazywamy :
1. dodatnio określoną ⇐⇒ f(x) > 0 dla każdego x = 0.
2. ujemnie określoną ⇐⇒ f(x) < 0 dla każdego x = 0.
3. nieokreśloną ⇐⇒ istnieją wektory x, y dla których f(x) > 0 , f(y) < 0.
Niech f : R3 → R
1. f(x, y, z) = x2 + y2 + z2 dodatnio określona
43
2. f(x, y, z) = −x2 − y2 − z2 ujemnie określona
3. f(x, y, z) = x2 + y2 − z2 nieokreślona
Uwaga 12.8 Tę samą definicje można podać dla macierzy symetrycznych. Macierz symetrycz-na jest tak samo określona jak forma kwadratowa jej odpowiadająca.
Trudniej jest orzec czy forma w postaci niekanonicznej jest określona. Jednym ze sposobówjest sprowadenie jej do postaci kanonicznej. Prostszym sposobem jest poniższe kryterium.Niech A ∈Mn×n będzie macierzą kwadratową. Oznaczamy
A1 =[a11
], A2 =
[a11 a12a21 a22
],..., An =
a11 ... a1n.. ... ..
an1 ... ann
i niech d1, ..., dn oznaczają wyznaczniki tych macierzy: minory główne.
Twierdzenie 12.9 1. Jeśli di > 0, dla wszystkich i = 1, ..., n, to forma kwadratowa jestdodatnio określona.
2. Jeśli (−1)idi > 0, dla wszystkich i = 1, ..., n, to forma kwadratowa jest ujemnie określona.
3. Jeśli
• di < 0 dla pewnego parzystego i, lub
• di > 0 oraz dj < 0 dla pewnych nieparzystych i, j
to forma kwadratowa jest nieokreślona.
Zbadać określoność formy kwadratowej ϕ : R3 → R ϕ(x, y, z) = 2xy + 2xz + yz.
Wypisujemy macierz:
0 1 11 0 11 1 0
. Wówczas d1 = 0, d2 = −1 , d3 = 2 a a ponieważ np.(−1)2d2 = −1 < 0 oraz (−1)3d3 = −2 < 0 więc forma jest nieokreślona. Potwierdzają to np.nierówności ϕ(1, 1, 0) = 2 > 0 , ϕ(−1, 1, 0) = −1 < 0.