Combinaciones convexas de matrices de densidad

Selecciones probabilísticas de matrices de densidad

Un aspecto esencial de las matrices de densidad es que las selecciones probabilísticas de estados cuánticos se representan mediante combinaciones convexas de sus matrices de densidad asociadas.

Si, por ejemplo, tenemos dos matrices de densidad, $\rho$ y $\sigma,$ que representan estados cuánticos de un sistema $\mathsf{X},$ y preparamos el sistema con probabilidad $p$ en el estado $\rho$ y con probabilidad $1 - p$ en el estado $\sigma,$ entonces el estado cuántico resultante se representa mediante la matriz de densidad

p \rho + (1 - p) \sigma.

Más generalmente, si tenemos $m$ estados cuánticos representados por matrices de densidad $\rho_0,\ldots,\rho_{m-1},$ y un sistema se prepara en el estado $\rho_k$ con probabilidad $p_k$ para un vector de probabilidad $(p_0,\ldots,p_{m-1}),$ el estado resultante se representa mediante la matriz de densidad

\sum_{k = 0}^{m-1} p_k \rho_k.

Esto es una combinación convexa de las matrices de densidad $\rho_0,\ldots,\rho_{m-1}.$

De esto se deduce que, si tenemos $m$ vectores de estado cuántico $\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle$ y preparamos un sistema en el estado $\vert\psi_k\rangle$ con probabilidad $p_k$ para cada $k\in\{0,\ldots,m-1\},$ el estado obtenido se representa mediante la matriz de densidad

\sum_{k = 0}^{m-1} p_k \vert\psi_k\rangle\langle\psi_k\vert.

Si, por ejemplo, un qubit se prepara en el estado $\vert 0\rangle$ con probabilidad $1/2$ y en el estado $\vert + \rangle$ con probabilidad $1/2,$ la representación como matriz de densidad del estado obtenido es

\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}.

En la formulación simplificada de la información cuántica, promediar vectores de estado cuántico no funciona. Por ejemplo, el vector

\frac{1}{2} \vert 0\rangle + \frac{1}{2} \vert + \rangle = \frac{1}{2} \begin{pmatrix}1\\[1mm] 0\end{pmatrix} + \frac{1}{2} \begin{pmatrix}\frac{1}{\sqrt{2}}\\[2mm]\frac{1}{\sqrt{2}}\end{pmatrix} = \begin{pmatrix}\frac{2 + \sqrt{2}}{4}\\[2mm]\frac{\sqrt{2}}{4}\end{pmatrix}

no es un vector de estado cuántico válido, ya que su norma euclidiana no es igual a $1.$ Un ejemplo más extremo que muestra que esto no funciona para vectores de estado cuántico: tomamos un vector de estado cuántico arbitrario $\vert\psi\rangle$ y consideramos nuestro estado como $\vert\psi\rangle$ con probabilidad $1/2$ y $-\vert\psi\rangle$ con probabilidad $1/2.$ Estos estados difieren en una fase global, por lo que en realidad son el mismo estado — pero promediarlos da el vector cero, que no es un vector de estado cuántico válido.

El estado completamente mezclado

Supongamos que establecemos el estado de un qubit aleatoriamente como $\vert 0\rangle$ o $\vert 1\rangle,$ cada uno con probabilidad $1/2.$ La matriz de densidad que representa el estado resultante es la siguiente.

\frac{1}{2} \vert 0\rangle\langle 0\vert + \frac{1}{2} \vert 1\rangle\langle 1\vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 0 & 0\\[1mm] 0 & 1 \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[1mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

(En esta ecuación, el símbolo $\mathbb{I}$ denota la matriz identidad $2\times 2.$ ) Este es un estado especial conocido como el estado completamente mezclado. Representa incertidumbre total sobre el estado de un qubit, de forma similar a un bit aleatorio uniformemente distribuido en el contexto probabilístico.

Supongamos ahora que cambiamos el procedimiento: en lugar de los estados $\vert 0\rangle$ y $\vert 1\rangle,$ usamos los estados $\vert + \rangle$ y $\vert - \rangle.$ Podemos calcular la matriz de densidad que describe el estado resultante de manera similar.

\frac{1}{2} \vert +\rangle\langle +\vert + \frac{1}{2} \vert -\rangle\langle -\vert = \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & -\frac{1}{2}\\[2mm] -\frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[2mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

Es la misma matriz de densidad que antes, aunque hemos cambiado los estados. De hecho, obtendríamos el mismo resultado — el estado completamente mezclado — sustituyendo cualesquiera dos vectores de estado cuántico de qubit ortogonales en lugar de $\vert 0\rangle$ y $\vert 1\rangle.$

Esto es una característica, no un error. Efectivamente obtenemos el mismo estado de ambas formas. Es decir, no hay forma de distinguir los dos procedimientos mediante mediciones sobre el qubit producido, ni siquiera estadísticamente. Nuestros dos procedimientos diferentes son simplemente formas distintas de preparar este estado.

Podemos verificar que esto tiene sentido pensando en lo que podríamos esperar aprender si seleccionamos aleatoriamente un estado de uno de los dos conjuntos posibles de estados $\{\vert 0\rangle,\vert 1\rangle\}$ y $\{\vert +\rangle,\vert -\rangle\}.$ Por simplicidad, supongamos que realizamos una operación unitaria $U$ sobre nuestro qubit y luego medimos en la base estándar.

En el primer escenario, el estado del qubit se elige uniformemente del conjunto $\{\vert 0\rangle,\vert 1\rangle\}.$ Si el estado es $\vert 0\rangle,$ obtenemos los resultados $0$ y $1$ con probabilidades

\vert \langle 0 \vert U \vert 0 \rangle \vert^2 \quad\text{y}\quad \vert \langle 1 \vert U \vert 0 \rangle \vert^2

respectivamente. Si el estado es $\vert 1\rangle,$ obtenemos los resultados $0$ y $1$ con probabilidades

\vert \langle 0 \vert U \vert 1 \rangle \vert^2 \quad\text{y}\quad \vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Como las dos posibilidades ocurren cada una con probabilidad $1/2,$ obtenemos el resultado $0$ con probabilidad

\frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2

y el resultado $1$ con probabilidad

\frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Ambas expresiones son iguales a $1/2.$ Una forma de argumentar esto es usar un hecho del álgebra lineal que puede considerarse como una generalización del teorema de Pitágoras.

Teorema

Sea $\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\}$ una base ortonormal de un espacio vectorial (real o complejo) $\mathcal{V}.$ Para cualquier vector $\vert \phi\rangle \in \mathcal{V}$ se cumple $\vert \langle \psi_1\vert\phi\rangle\vert^2 + \cdots + \vert \langle \psi_n \vert \phi \rangle\vert^2 = \| \vert\phi\rangle \|^2.$

Podemos aplicar este teorema para determinar las probabilidades de la siguiente manera. La probabilidad de obtener $0$ es

\begin{aligned} \frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \vert \langle 0 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 0 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 \end{aligned}

y la probabilidad de obtener $1$ es

\begin{aligned} \frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 1 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 1 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2. \end{aligned}

Como $U$ es unitaria, sabemos que $U^{\dagger}$ también es unitaria, lo que implica que tanto $U^{\dagger} \vert 0 \rangle$ como $U^{\dagger} \vert 1 \rangle$ son vectores unitarios. Por tanto, ambas probabilidades son iguales a $1/2.$ Esto significa que, independientemente de cómo elijamos $U,$ solo obtenemos un bit aleatorio uniformemente distribuido de la medición.

Podemos realizar una verificación similar para cualquier otro par de estados ortonormales en lugar de $\vert 0\rangle$ y $\vert 1\rangle.$ Como $\{\vert + \rangle, \vert - \rangle\}$ es una base ortonormal, la probabilidad de obtener el resultado de medición $0$ en el segundo procedimiento es, por ejemplo,

\frac{1}{2}\vert \langle 0 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 = \frac{1}{2}

y la probabilidad de obtener $1$ es

\frac{1}{2}\vert \langle 1 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2 = \frac{1}{2}.

En particular, obtenemos exactamente las mismas estadísticas de salida que para los estados $\vert 0\rangle$ y $\vert 1\rangle.$

Estados probabilísticos

Los estados clásicos pueden representarse mediante matrices de densidad. Para cada estado clásico $a$ de un sistema $\mathsf{X},$ la matriz de densidad

\rho = \vert a\rangle \langle a \vert

representa al sistema $\mathsf{X}$ definitivamente en el estado clásico $a.$ Para qubits,

\vert 0\rangle \langle 0 \vert = \begin{pmatrix}1 & 0 \\ 0 & 0\end{pmatrix} \quad\text{y}\quad \vert 1\rangle \langle 1 \vert = \begin{pmatrix}0 & 0 \\ 0 & 1\end{pmatrix},

y en general hay exactamente un $1$ en la diagonal en la posición correspondiente al estado clásico considerado, con todas las demás entradas iguales a cero.

Podemos entonces formar combinaciones convexas de estas matrices de densidad para representar estados probabilísticos. Suponiendo para simplificar que nuestro conjunto de estados clásicos es $\{0,\ldots,n-1\}$ : si $\mathsf{X}$ se encuentra en el estado $a$ con probabilidad $p_a$ para cada $a\in\{0,\ldots,n-1\},$ entonces la matriz de densidad obtenida es

\rho = \sum_{a = 0}^{n-1} p_a \vert a\rangle \langle a \vert = \begin{pmatrix} p_0 & 0 & \cdots & 0\\ 0 & p_1 & \ddots & \vdots\\ \vdots & \ddots & \ddots & 0\\ 0 & \cdots & 0 & p_{n-1} \end{pmatrix}.

En la dirección opuesta, cualquier matriz de densidad diagonal puede identificarse de forma natural con el estado probabilístico que se obtiene simplemente leyendo el vector de probabilidad de la diagonal.

Para ser claros: si una matriz de densidad es diagonal, esto no significa necesariamente que estemos hablando de un sistema clásico o que el sistema haya sido preparado mediante selección aleatoria de un estado clásico, sino más bien que el estado podría haberse obtenido mediante selección aleatoria de un estado clásico.

El hecho de que los estados probabilísticos se representen mediante matrices de densidad diagonales es consistente con la intuición sugerida al comienzo de la lección de que las entradas fuera de la diagonal describen el grado en que los dos estados clásicos correspondientes a la fila y columna de esa entrada se encuentran en superposición cuántica. Aquí todas las entradas fuera de la diagonal son cero, por lo que solo tenemos aleatoriedad clásica y nada se encuentra en superposición cuántica.

Matrices de densidad y el teorema espectral

Hemos visto que cuando formamos una combinación convexa de estados puros, obtenemos una matriz de densidad,

\rho = \sum_{k = 0}^{m-1} p_k \vert \psi_k\rangle \langle \psi_k \vert.

De hecho, toda matriz de densidad $\rho$ puede expresarse como una combinación convexa de estados puros de esta forma. Es decir, siempre existirá una colección de vectores unitarios $\{\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle\}$ y un vector de probabilidad $(p_0,\ldots,p_{m-1})$ para los cuales se cumple la ecuación anterior.

Además, el número $m$ siempre puede elegirse igual al número de estados clásicos del sistema considerado, y podemos elegir los vectores de estado cuántico ortogonales. El teorema espectral, que encontramos en el curso "Fundamentos de los algoritmos cuánticos", nos permite concluir esto. Aquí presentamos una reformulación del teorema espectral como recordatorio.

Teorema

Teorema espectral: Sea $M$ una matriz compleja $n\times n$ normal. Existe una base ortonormal de vectores complejos $n$ -dimensionales $\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle \}$ junto con números complejos $\lambda_0,\ldots,\lambda_{n-1}$ , tales que

M = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert.

(Como recordatorio: una matriz $M$ es normal si satisface $M^{\dagger} M = M M^{\dagger}.$ Las matrices normales son, por tanto, matrices que conmutan con su propia traspuesta conjugada.)

Podemos aplicar el teorema espectral a cualquier matriz de densidad $\rho$ dada, porque las matrices de densidad son siempre herméticas y, por tanto, normales. Esto nos permite escribir

\rho = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert

para una base ortonormal $\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle\}.$ Queda por verificar que $(\lambda_0,\ldots,\lambda_{n-1})$ es un vector de probabilidad, que luego podemos renombrar como $(p_0,\ldots,p_{n-1})$ si lo deseamos.

Los números $\lambda_0,\ldots,\lambda_{n-1}$ son los valores propios de $\rho,$ y como $\rho$ es positiva semidefinida, estos números deben ser números reales no negativos. Podemos concluir que $\lambda_0 + \cdots + \lambda_{n-1} = 1$ a partir del hecho de que $\rho$ tiene traza $1.$ Al desarrollar los detalles, surge la oportunidad de señalar la siguiente propiedad importante y muy útil de la traza.

Teorema

Propiedad ciclica de la traza: Para cualesquiera dos matrices $A$ y $B$ que al multiplicarse producen una matriz cuadrada $AB$ , se cumple la igualdad $\operatorname{Tr}(AB) = \operatorname{Tr}(BA).$

Obsérvese que este teorema también funciona cuando $A$ y $B$ no son ellas mismas matrices cuadradas. Es decir, $A$ puede ser $n\times m$ y $B$ puede ser $m\times n$ para una elección de enteros positivos $n$ y $m,$ de modo que $AB$ es una matriz cuadrada $n\times n$ y $BA$ es una matriz cuadrada $m\times m.$

En particular, si tomamos $A$ como un vector columna $\vert\phi\rangle$ y $B$ como un vector fila $\langle \phi\vert,$ vemos que

\operatorname{Tr}\bigl(\vert\phi\rangle\langle\phi\vert\bigr) = \operatorname{Tr}\bigl(\langle\phi\vert\phi\rangle\bigr) = \langle\phi\vert\phi\rangle.

La segunda igualdad se deduce del hecho de que $\langle\phi\vert\phi\rangle$ es un escalar, que también podemos considerar como una matriz $1\times 1$ cuya traza es su única entrada. Con este hecho y la linealidad de la función traza, podemos concluir que $\lambda_0 + \cdots + \lambda_{n-1} = 1.$

\begin{gathered} 1 = \operatorname{Tr}(\rho) = \operatorname{Tr}\bigl(\lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr)\\[2mm] = \lambda_0 \operatorname{Tr}\bigl(\vert \psi_0\rangle\langle \psi_0\vert\bigr) + \cdots + \lambda_{n-1} \operatorname{Tr}\bigl(\vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr) = \lambda_0 + \cdots + \lambda_{n-1} \end{gathered}

Alternativamente, podemos llegar a la misma conclusión utilizando el hecho de que la traza de una matriz cuadrada (incluso una no normal) es igual a la suma de sus valores propios.

Hemos demostrado así que toda matriz de densidad $\rho$ dada puede expresarse como una combinación convexa de estados puros. También vemos que además podemos elegir los estados puros ortogonales. Esto significa, en particular, que nunca necesitamos elegir el número $m$ mayor que el tamaño del conjunto de estados clásicos de $\mathsf{X}.$

En general, debe entenderse que habrá diferentes formas de escribir una matriz de densidad como combinación convexa de estados puros, no solo las que proporciona el teorema espectral. Un ejemplo anterior lo ilustra.

\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}

Esta no es una descomposición espectral de esta matriz, porque $\vert 0\rangle$ y $\vert + \rangle$ no son ortogonales. Aquí hay una descomposición espectral:

\begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix} = \cos^2(\pi/8) \vert \psi_{\pi/8} \rangle \langle \psi_{\pi/8}\vert + \sin^2(\pi/8) \vert \psi_{5\pi/8} \rangle \langle \psi_{5\pi/8}\vert,

donde $\vert \psi_{\theta} \rangle = \cos(\theta)\vert 0\rangle + \sin(\theta)\vert 1\rangle.$ Los valores propios son números que deberían resultar familiares:

\cos^2(\pi/8) = \frac{2+\sqrt{2}}{4} \approx 0{,}85 \quad\text{y}\quad \sin^2(\pi/8) = \frac{2-\sqrt{2}}{4} \approx 0{,}15.

Los vectores propios pueden escribirse explícitamente de la siguiente manera.

\begin{aligned} \vert\psi_{\pi/8}\rangle & = \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 - \sqrt{2}}}{2}\vert 1\rangle \\[3mm] \vert\psi_{5\pi/8}\rangle & = -\frac{\sqrt{2 - \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 1\rangle \end{aligned}

Como otro ejemplo más general: supongamos que $\vert \phi_0\rangle,\ldots,\vert \phi_{99} \rangle$ son vectores de estado cuántico que representan estados de un solo qubit, elegidos arbitrariamente — por lo que no asumimos relaciones particulares entre estos vectores. Podríamos entonces considerar el estado que obtenemos al seleccionar uniformemente al azar uno de estos $100$ estados:

\rho = \frac{1}{100} \sum_{k = 0}^{99} \vert \phi_k\rangle\langle \phi_k \vert.

Como estamos hablando de un qubit, la matriz de densidad $\rho$ es una matriz $2\times 2,$ por lo que alternativamente podríamos escribirla por el teorema espectral como

\rho = p \vert\psi_0\rangle\langle\psi_0\vert + (1 - p) \vert\psi_1\rangle\langle\psi_1\vert

para un número real $p\in[0,1]$ y una base ortonormal $\{\vert\psi_0\rangle,\vert\psi_1\rangle\}$ — pero la existencia de esta expresión no nos impide, por supuesto, escribir $\rho$ como promedio de 100 estados puros si así lo deseamos.

Selecciones probabilísticas de matrices de densidad​

El estado completamente mezclado​

Estados probabilísticos​

Matrices de densidad y el teorema espectral​

Selecciones probabilísticas de matrices de densidad

El estado completamente mezclado

Estados probabilísticos

Matrices de densidad y el teorema espectral