Saltar al contenido principal

Operaciones de Pauli y observables

Las matrices de Pauli desempeñan un papel central en el formalismo de estabilizadores. Comenzamos la lección con una discusión de las matrices de Pauli, incluyendo algunas de sus propiedades algebraicas fundamentales, y también discutiremos cómo las matrices de Pauli (y los productos tensoriales de matrices de Pauli) pueden describir mediciones.

Fundamentos de las operaciones de Pauli

Aquí están las matrices de Pauli, incluyendo la matriz identidad 2×22\times 2 y las tres matrices de Pauli no identidad.

I=(1001)X=(0110)Y=(0ii0)Z=(1001)\mathbb{I} = \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} \qquad X = \begin{pmatrix} 0 & 1\\ 1 & 0 \end{pmatrix} \qquad Y = \begin{pmatrix} 0 & -i\\ i & 0 \end{pmatrix} \qquad Z = \begin{pmatrix} 1 & 0\\ 0 & -1 \end{pmatrix}

Propiedades de las matrices de Pauli

Las cuatro matrices de Pauli son tanto unitarias como hermitianas. Anteriormente en la serie se utilizaron los nombres σx,\sigma_x, σy,\sigma_y, y σz\sigma_z para las matrices de Pauli no identidad, pero es convencional usar las letras mayúsculas X,X, Y,Y, y ZZ en el contexto de la corrección de errores. Esta convención se introdujo en la lección anterior y la mantendremos para las lecciones restantes.

Matrices de Pauli no identidad distintas anticonmutan entre sí.

XY=YXXZ=ZXYZ=ZYXY = -YX \qquad XZ = -ZX \qquad YZ = -ZY

Estas relaciones de anticonmutación son simples y se pueden verificar fácilmente realizando las multiplicaciones, pero son de importancia crucial — en el formalismo de estabilizadores y en otros contextos. Como veremos, los signos menos que surgen al invertir el orden de dos matrices de Pauli no identidad distintas en un producto matricial corresponden exactamente a la detección de errores en el formalismo de estabilizadores.

También tenemos las reglas de multiplicación listadas aquí.

XX=YY=ZZ=IXY=iZYZ=iXZX=iYXX = YY = ZZ = \mathbb{I} \qquad XY = iZ \qquad YZ = iX \qquad ZX = iY

Es decir: cada matriz de Pauli es su propia inversa (lo cual es válido para cualquier matriz que sea tanto unitaria como hermitiana), y multiplicar dos matrices de Pauli no identidad distintas siempre da ±i\pm i veces la matriz de Pauli no identidad restante. En particular, YY es equivalente a XZX Z salvo un factor de fase, lo que explica nuestro enfoque en los errores XX y ZZ y la aparente omisión de los errores YY en la corrección de errores cuánticos; XX representa un cambio de bit, ZZ representa un cambio de fase, y por tanto YY representa (salvo un factor de fase global) ambos errores ocurriendo simultáneamente en el mismo qubit.

Operaciones de Pauli sobre múltiples qubits

Las cuatro matrices de Pauli representan todas las operaciones (que podrían ser errores) sobre un solo qubit — y al tomar sus productos tensoriales obtenemos operaciones sobre múltiples qubits. Como nota terminológica: cuando hablamos de una operación de Pauli de n qubits, nos referimos a un producto tensorial de cualesquiera nn matrices de Pauli, como los ejemplos mostrados aquí para n=9n=9.

IIIIIIIIIXXIIIIIIIXYZIIIXYZ\begin{gathered} \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \\[1mm] X \otimes X \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \\[1mm] X \otimes Y \otimes Z \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes X \otimes Y \otimes Z \end{gathered}

A menudo, el término operación de Pauli se refiere a un producto tensorial de matrices de Pauli junto con un factor de fase, o a veces solo ciertos factores de fase como ±1\pm 1 y ±i\pm i. Hay buenas razones matemáticas para permitir tales factores de fase, pero para mantener las cosas lo más simples posible, usamos el término operación de Pauli en este curso para referirnos a un producto tensorial de matrices de Pauli sin la posibilidad de un factor de fase distinto de 1.

El peso de una operación de Pauli de nn qubits es el número de matrices de Pauli no identidad en el producto tensorial. El primer ejemplo anterior tiene, por ejemplo, peso 00, el segundo tiene peso 22 y el tercero tiene peso 66. Intuitivamente, el peso de una operación de Pauli de nn qubits es el número de qubits sobre los que actúa de manera no trivial. Típicamente, los códigos correctores de errores cuánticos se diseñan para poder detectar y corregir errores representados por operaciones de Pauli, siempre que su peso no sea demasiado alto.

Operaciones de Pauli como generadores

A veces es útil considerar colecciones de operaciones de Pauli como generadores de conjuntos (más precisamente, grupos) de operaciones en el sentido algebraico que quizás conozcas si estás familiarizado con la teoría de grupos. Si no estás familiarizado con la teoría de grupos, está bien — no es estrictamente necesaria para la lección. Sin embargo, un conocimiento básico de la teoría de grupos es muy recomendable para quienes deseen explorar la corrección de errores cuánticos con mayor profundidad.

Sean P1,,PrP_1, \ldots, P_r operaciones de Pauli de nn qubits. Cuando hablamos del conjunto generado por P1,,PrP_1, \ldots, P_r, nos referimos al conjunto de todas las matrices que se pueden obtener multiplicando estas matrices, en cualquier combinación y orden, tomando cada una tantas veces como se desee. La notación para este conjunto es P1,,Pr.\langle P_1, \ldots, P_r \rangle.

Por ejemplo, el conjunto generado por las tres matrices de Pauli no identidad es el siguiente.

X,Y,Z={αP:α{1,i,1,i},  P{I,X,Y,Z}}\langle X, Y, Z \rangle = \bigl\{\alpha P\,:\,\alpha\in\{1,i,-1,-i\},\; P\in\{\mathbb{I},X,Y,Z\} \bigr\}

Esto se puede justificar mediante las reglas de multiplicación listadas anteriormente. Hay 16 matrices distintas en este conjunto, que comúnmente se denomina el grupo de Pauli.

Como segundo ejemplo, si eliminamos YY, obtenemos la mitad del grupo de Pauli.

X,Z={I,X,Z,iY,I,X,Z,iY}\langle X, Z\rangle = \{ \mathbb{I}, X, Z, -iY, -\mathbb{I}, -X, -Z, iY \}

Aquí hay un último ejemplo (por ahora), esta vez con n=2n=2.

XX,ZZ={II,XX,ZZ,YY}\langle X \otimes X, Z \otimes Z\rangle = \{ \mathbb{I}\otimes\mathbb{I}, X\otimes X, Z\otimes Z, -Y\otimes Y \}

En este caso solo obtenemos cuatro elementos, ya que XXX\otimes X y ZZZ\otimes Z conmutan:

(XX)(ZZ)=(XZ)(XZ)=(ZX)(ZX)=(ZX)(ZX)=(ZZ)(XX).\begin{aligned} (X\otimes X)(Z\otimes Z) & = (XZ) \otimes (XZ)\\ & = (-ZX)\otimes (-ZX)\\ & = (ZX)\otimes (ZX)\\ & = (Z\otimes Z)(X\otimes X). \end{aligned}

Observables de Pauli

Las matrices de Pauli y las operaciones de Pauli de nn qubits en general son unitarias y, por tanto, describen operaciones unitarias sobre qubits. Pero también son matrices hermitianas, y por esta razón también describen mediciones, como se explica a continuación.

Matrices hermitianas como observables

Consideremos primero una matriz hermitiana arbitraria AA. Cuando nos referimos a AA como un observable, asociamos con ella una medición proyectiva específica y únicamente definida. Los posibles resultados son los distintos valores propios de AA, y las proyecciones que definen la medición son aquellas que proyectan sobre los espacios generados por los correspondientes vectores propios de AA. Los resultados de dicha medición son, por tanto, números reales, pero dado que las matrices solo tienen un número finito de valores propios, para una elección dada de AA solo hay un número finito de resultados de medición distintos.

Más precisamente: por el teorema espectral, es posible escribir

A=k=1mλkΠkA = \sum_{k = 1}^m \lambda_k \Pi_k

para valores propios distintos reales λ1,,λm\lambda_1,\ldots,\lambda_m y proyecciones Π1,,Πm\Pi_1,\ldots,\Pi_m con

Π1++Πm=I.\Pi_1 + \cdots + \Pi_m = \mathbb{I}.

Tal expresión de una matriz es única salvo el orden de los valores propios. Alternativamente: si insistimos en que los valores propios estén ordenados en orden decreciente λ1>λ2>>λm\lambda_1 > \lambda_2 > \cdots > \lambda_m, solo hay una forma de escribir AA en la forma anterior.

Sobre la base de esta expresión, la medición que asociamos con el observable AA es la medición proyectiva descrita por las proyecciones Π1,,Πm\Pi_1,\ldots,\Pi_m, donde los valores propios λ1,,λm\lambda_1,\ldots,\lambda_m se entienden como los resultados de medición correspondientes a estas proyecciones.

Mediciones a partir de operaciones de Pauli

Veamos cómo lucen las mediciones del tipo descrito para las operaciones de Pauli — comenzando con las tres matrices de Pauli no identidad. Estas matrices tienen descomposiciones espectrales como sigue.

X=++Y=+i+iiiZ=0011\begin{gathered} X = \vert {+} \rangle\langle {+} \vert - \vert {-} \rangle\langle {-} \vert\\ Y = \vert {+i} \rangle\langle {+i} \vert - \vert {-i} \rangle\langle {-i} \vert\\ Z = \vert {0} \rangle\langle {0} \vert - \vert {1} \rangle\langle {1} \vert \end{gathered}

Las mediciones definidas por X,X, YY y ZZ como observables son, por tanto, las mediciones proyectivas definidas por los siguientes conjuntos de proyecciones.

{++,}{+i+i,ii}{00,11}\begin{gathered} \bigl\{\vert {+} \rangle\langle {+} \vert, \vert {-} \rangle\langle {-} \vert \bigr\} \\ \bigl\{\vert {+i} \rangle\langle {+i} \vert, \vert {-i} \rangle\langle {-i} \vert\bigr\} \\ \bigl\{\vert {0} \rangle\langle {0} \vert, \vert {1} \rangle\langle {1} \vert\bigr\} \end{gathered}

En los tres casos, los dos posibles resultados de medición son los valores propios +1+1 y 1-1. Tales mediciones se denominan comúnmente mediciones XX, mediciones YY y mediciones ZZ. Nos hemos encontrado con estas mediciones en la lección "Mediciones generales" del curso "Formulación general de la información cuántica", donde aparecieron en el contexto de la tomografía de estados cuánticos.

Naturalmente, una medición ZZ es esencialmente solo una medición en la base estándar y una medición XX es una medición respecto a la base más/menos de un qubit, pero como se describen estas mediciones aquí, tomamos los valores propios +1+1 y 1-1 como los resultados reales de la medición.

El mismo procedimiento se puede aplicar a operaciones de Pauli sobre n2n\geq 2 qubits, aunque debe enfatizarse que incluso entonces solo hay dos posibles resultados para las mediciones descritas de esta manera: +1+1 y 1-1, los únicos valores propios posibles de las operaciones de Pauli. Las dos proyecciones correspondientes tienen en este caso un rango mayor que uno. Más precisamente: para cualquier operación de Pauli de nn qubits no identidad, el espacio de estados de dimensión 2n2^n siempre se divide en dos subespacios de vectores propios de igual dimensión, de modo que las dos proyecciones que definen la medición correspondiente tienen ambas rango 2n12^{n-1}.

La medición descrita por una operación de Pauli de nn qubits como observable no es, por tanto, lo mismo que una medición respecto a una base ortonormal de vectores propios de esa operación, ni es lo mismo que medir independientemente cada una de las matrices de Pauli correspondientes como observables sobre nn qubits. Ambas alternativas requerirían 2n2^n posibles resultados de medición, pero aquí solo tenemos los dos posibles resultados +1+1 y 1-1.

Consideremos, por ejemplo, la operación de Pauli de 2 qubits ZZZ\otimes Z como observable. Podemos tomar efectivamente el producto tensorial de las descomposiciones espectrales para obtener una del producto tensorial.

ZZ=(0011)(0011)=(0000+1111)(0101+1010)\begin{aligned} Z\otimes Z & = (\vert 0\rangle\langle 0\vert - \vert 1\rangle\langle 1\vert) \otimes (\vert 0\rangle\langle 0\vert - \vert 1\rangle\langle 1\vert)\\ & = \bigl( \vert 00\rangle\langle 00\vert + \vert 11\rangle\langle 11\vert \bigr) - \bigl( \vert 01\rangle\langle 01\vert + \vert 10\rangle\langle 10\vert \bigr) \end{aligned}

Es decir, tenemos ZZ=Π0Π1Z\otimes Z = \Pi_0 - \Pi_1 para

Π0=0000+1111yΠ1=0101+1010,\Pi_0 = \vert 00\rangle\langle 00\vert + \vert 11\rangle\langle 11\vert \quad\text{y}\quad \Pi_1 = \vert 01\rangle\langle 01\vert + \vert 10\rangle\langle 10\vert,

y estas son las dos proyecciones que definen la medición. Si, por ejemplo, midiéramos de forma no destructiva un estado de Bell ϕ+\vert\phi^+\rangle con esta medición, estaríamos seguros de obtener el resultado +1+1, y el estado no se vería alterado por la medición. En particular, el estado no colapsaría a 00\vert 00\rangle o 11\vert 11\rangle.

Implementación no destructiva mediante estimación de fase

Para cualquier operación de Pauli de nn qubits, podemos realizar la medición asociada con ese observable de forma no destructiva utilizando la estimación de fase.

Aquí hay un circuito basado en estimación de fase que funciona para cualquier matriz de Pauli PP, donde la medición se realiza en el qubit superior. Los resultados 00 y 11 de la medición en la base estándar del circuito corresponden a los valores propios +1+1 y 1-1, exactamente como normalmente tenemos con la estimación de fase con un qubit de control. (Nótese que el qubit de control está abajo en este diagrama, mientras que en la lección "Estimación de fase y factorización" del curso "Fundamentos de algoritmos cuánticos" los qubits de control se dibujaron arriba.)

Circuito para medir un observable de Pauli mediante estimación de fase

Un método similar funciona para operaciones de Pauli sobre múltiples qubits. El siguiente diagrama de circuito muestra, por ejemplo, una medición no destructiva del observable de Pauli de 33 qubits P2P1P0P_2\otimes P_1\otimes P_0 para cualquier elección de P0,P1,P2{X,Y,Z}P_0,P_1,P_2 \in \{X,Y,Z\}.

Circuito para medir un observable de Pauli de 3 qubits mediante estimación de fase

Este enfoque se generaliza naturalmente a observables de Pauli de nn qubits para cualquier nn. Naturalmente, al implementar tales mediciones con este enfoque, solo es necesario incluir puertas unitarias controladas para los factores tensoriales no identidad de los observables de Pauli; las puertas de identidad controladas son simplemente puertas de identidad y, por tanto, pueden omitirse. Esto significa que los observables de Pauli con menor peso requieren circuitos más pequeños para su implementación mediante este enfoque.

Nótese que estos circuitos de estimación de fase tienen solo un único qubit de control independientemente de nn, lo cual es consistente con el hecho de que solo hay dos posibles resultados de medición para estas mediciones. Usar más qubits de control no proporcionaría información adicional, ya que estas mediciones son perfectas con un solo qubit de control. (Una forma de ver esto se deriva directamente del procedimiento general de estimación de fase: la suposición U2=IU^2 = \mathbb{I} hace que cualquier qubit de control adicional más allá del primero sea inútil.)

Aquí hay un ejemplo específico de una implementación no destructiva de una medición ZZZ\otimes Z, que es relevante para la descripción del código de repetición de 3 bits como código de estabilizador, que veremos a continuación.

Circuito para medir un observable ZZ mediante estimación de fase

En este caso, y para productos tensoriales de más de dos observables ZZ en general, el circuito se puede simplificar.

Circuito simplificado para medir un observable ZZ

Esta medición corresponde, por tanto, a medir de forma no destructiva la paridad (o XOR) de los estados de la base estándar de dos qubits.