logo

Singular Value Decomposition (SVD)

Singular Value Decomposition (SVD) av en matrise er en faktorisering av den matrisen i tre matriser. Den har noen interessante algebraiske egenskaper og formidler viktig geometrisk og teoretisk innsikt om lineære transformasjoner. Den har også noen viktige applikasjoner innen datavitenskap. I denne artikkelen vil jeg prøve å forklare den matematiske intuisjonen bak SVD og dens geometriske betydning.

Matematikk bak SVD:

SVD av mxn matrise A er gitt av formelen A = USigma V^T



hvor:

  • I: mxm matrise av ortonormale egenvektorer til AA^{T}.
  • IT: transponere av en nxn matrise som inneholder de ortonormale egenvektorene til A^TA.
  • Sigma: diagonal matrise med r elementer lik roten av de positive egenverdiene til AAᵀ eller Aᵀ A (begge matrisene har uansett de samme positive egenverdiene).

Eksempler

  • Finn SVD for matrisen A = egin{bmatrix} 3&2 & 2  2& 3& -2 end{bmatrix}
  • For å beregne SVD, Først må vi beregne singularverdiene ved å finne egenverdier til AA^{T}.

A cdot A^{T} =egin{bmatrix} 3& 2 & 2  2& 3& -2 end{bmatrix} cdot egin{bmatrix} 3 & 2  2 & 3  2 & -2 end{bmatrix} = egin{bmatrix} 17 & 8 8 & 17 end{bmatrix}

  • Den karakteristiske ligningen for matrisen ovenfor er:

W - lambda I =0  A A^{T} - lambda I =0

lambda^{2} - 34 lambda + 225 =0

= (lambda-25)(lambda -9)

tostring java

så våre entallsverdier er: sigma_1 = 5 , ; sigma_2 = 3

  • Nå finner vi de riktige entallsvektorene, dvs. ortonormalt sett med egenvektorer til ATA. Egenverdiene til ATA er 25, 9 og 0, og siden ATA er symmetrisk vi vet at egenvektorene vil være ortogonale.

Til lambda =25,

A^{T}A - 25 cdot I = egin{bmatrix} -12 & 12& 2 12 & -12 & -2 2& -2 & -17 end{bmatrix}

som kan radreduseres til:

egin{bmatrix} 1& -1& 0  0& 0& 1 0& 0& 0 end{bmatrix}

En enhetsvektor i retning av den er:

v_1 = egin{bmatrix} frac{1}{sqrt{2}} frac{1}{sqrt{2}} 0 end{bmatrix}

Tilsvarende, for lambda = 9, er egenvektoren:

v_2 =egin{bmatrix} frac{1}{sqrt{18}} frac{-1}{sqrt{18}} frac{4}{sqrt{18}} end{bmatrix}

For den tredje egenvektoren kan vi bruke egenskapen at den er vinkelrett på v1 og v2 slik at:

v_1^{T} v_3 =0  v_2^{T} v_3 =0

få matriselengde i c

Løser ligningen ovenfor for å generere den tredje egenvektoren

v_3 = egin{bmatrix} a b c end{bmatrix} = egin{bmatrix} a -a  -a/2 end{bmatrix} = egin{bmatrix} frac{ 2}{3} frac{-2}{3} frac{-1}{3} end{bmatrise}

hva er f5 på tastaturet

Nå beregner vi U ved å bruke formelen u_i = frac{1}{sigma} A v_i og dette gir U = egin{bmatrix} frac{1}{sqrt{2}} &frac{1}{sqrt{2}}  frac{1}{sqrt{2}}& frac{-1 }{sqrt{2}} end{bmatrix}. Derfor blir vår endelige SVD-ligning:

A = egin{bmatrise} frac{1}{sqrt{2}} &frac{1}{sqrt{2}}  frac{1}{sqrt{2}}& frac{ -1}{sqrt{2}} end{bmatrix} egin{bmatrix} 5 & 0& 0  0 & 3& 0 end{bmatrix} egin{bmatrix} frac{1}{sqrt{2 }}& frac{1}{sqrt{2}} &0  frac{1}{sqrt{18}}& frac{-1}{sqrt{18}} & frac{4} {sqrt{18}} frac{2}{3}&frac{-2}{3} &frac{1}{3} end{bmatrix}

applikasjoner

  • Beregning av Pseudo-invers: Pseudo-invers eller Moore-Penrose-invers er generaliseringen av matriseinversen som kanskje ikke er inverterbar (for eksempel lavrangerte matriser). Hvis matrisen er inverterbar, vil dens invers være lik Pseudo-invers, men pseudo-invers eksisterer for matrisen som ikke er inverterbar. Det er betegnet med A+.
Suppose, we need to calculate the pseudo-inverse of a matrix M: Then, the SVD of M can be given as: Multiply both sides by M^{-1}.Multiply both side by V:Multiply by W^{-1}Since the W is the singular matrix, the inverse of W  is Multiply by>

Ovennevnte ligning gir pseudo-inversen.

Løse et sett med homogen lineær ligning (Mx =b): hvis b=0, beregn SVD og ta en hvilken som helst kolonne av VTassosiert med en entallsverdi (i I ) lik 0.

If , Multiply by>

Fra Pseudo-inversen vet vi det M^{-1} = V W^{-1} U^{T}

Derfor,

x = V W^{-1} U^{T} b

  • Rangering, Range og Null space:
    • Rangeringen av matrisen M kan beregnes fra SVD ved antall entallsverdier som ikke er null.
    • Området til matrisen M er de venstre singularvektorene til U som tilsvarer singularverdiene som ikke er null.
    • Nullrommet til matrisen M er de høyre singularvektorene til V som tilsvarer de nullstilte singularverdiene.

M = U W V^{T}

  • Problem med kurvetilpasning: Enkeltverdidekomponering kan brukes for å minimere minste kvadratfeil. Den bruker pseudo-inversen for å tilnærme den.
  • I tillegg til applikasjonen ovenfor, kan singular verdidekomponering og pseudo-invers også brukes i digital signalbehandling og bildebehandling

Gjennomføring:

I denne koden vil vi prøve å beregne Singular-verdidekomponeringen ved å bruke Numpy og Scipy. Vi skal beregne SVD, og ​​også utføre pseudo-invers. Til slutt kan vi bruke SVD for å komprimere bildet

Python3

# Imports> from> skimage.color>import> rgb2gray> from> skimage>import> data> import> matplotlib.pyplot as plt> import> numpy as np> from> scipy.linalg>import> svd> '''> Singular Value Decomposition> '''> # define a matrix> X>=> np.array([[>3>,>3>,>2>], [>2>,>3>,>->2>]])> print>(X)> # perform SVD> U, singular, V_transpose>=> svd(X)> # print different components> print>(>'U: '>, U)> print>(>'Singular array'>, singular)> print>(>'V^{T}'>, V_transpose)> '''> Calculate Pseudo inverse> '''> # inverse of singular matrix is just the reciprocal of each element> singular_inv>=> 1.0> /> singular> # create m x n matrix of zeroes and put singular values in it> s_inv>=> np.zeros(X.shape)> s_inv[>0>][>0>]>=> singular_inv[>0>]> s_inv[>1>][>1>]>=> singular_inv[>1>]> # calculate pseudoinverse> M>=> np.dot(np.dot(V_transpose.T, s_inv.T), U.T)> print>(M)> '''> SVD on image compression> '''> cat>=> data.chelsea()> plt.imshow(cat)> # convert to grayscale> gray_cat>=> rgb2gray(cat)> # calculate the SVD and plot the image> U, S, V_T>=> svd(gray_cat, full_matrices>=>False>)> S>=> np.diag(S)> fig, ax>=> plt.subplots(>5>,>2>, figsize>=>(>8>,>20>))> curr_fig>=> 0> for> r>in> [>5>,>10>,>70>,>100>,>200>]:> >cat_approx>=> U[:, :r] @ S[>0>:r, :r] @ V_T[:r, :]> >ax[curr_fig][>0>].imshow(cat_approx, cmap>=>'gray'>)> >ax[curr_fig][>0>].set_title(>'k = '>+>str>(r))> >ax[curr_fig,>0>].axis(>'off'>)> >ax[curr_fig][>1>].set_title(>'Original Image'>)> >ax[curr_fig][>1>].imshow(gray_cat, cmap>=>'gray'>)> >ax[curr_fig,>1>].axis(>'off'>)> >curr_fig>+>=> 1> plt.show()>
>
>

Produksjon:

[[ 3 3 2]  [ 2 3 -2]] --------------------------- U: [[-0.7815437 -0.6238505]  [-0.6238505 0.7815437]] --------------------------- Singular array [5.54801894 2.86696457] --------------------------- V^{T} [[-0.64749817 -0.7599438 -0.05684667]  [-0.10759258 0.16501062 -0.9804057 ]  [-0.75443354 0.62869461 0.18860838]] -------------------------- # Inverse  array([[ 0.11462451, 0.04347826],  [ 0.07114625, 0.13043478],  [ 0.22134387, -0.26086957]]) --------------------------->

Original vs SVD k-bilde