Saltar al contenido principal

Planificador de reparto equitativo

Cuando envías una carga de trabajo a una unidad de procesamiento cuántico (QPU), esta entra al planificador de esa QPU específica y se une al grupo de cargas de trabajo (de todos los usuarios) que esperan ser ejecutadas en esa QPU. El orden en que se ejecutan estas cargas de trabajo está determinado, de forma predeterminada, por una fórmula de reparto equitativo. Como se explica a continuación, esta fórmula intenta equilibrar la carga de trabajo entre distintas instancias según la cantidad de acceso a la QPU asignada durante un período de tiempo determinado. En la práctica, esto significa que las cargas de trabajo de varias instancias se intercalan de tal forma que el orden en que finalizan no es necesariamente el orden en que fueron enviadas. Dado que el orden se calcula de forma dinámica a medida que llegan nuevas cargas de trabajo, en general es imposible garantizar cuándo se ejecutará una carga de trabajo desde el planificador de reparto equitativo.

Términos del reparto equitativo

  • Cuenta: Las personas y organizaciones usan una cuenta de IBM Cloud® para acceder a IBM Quantum® Platform y Qiskit Runtime.

  • Instancia: La construcción base a la que se le asigna tiempo desde la cuenta general para un conjunto de QPUs, y a la que se asignan directamente los usuarios. Las instancias están vinculadas a una región específica y a un plan. Consulta la guía de Instancias para obtener más información.

  • Ventana deslizante de 28 días: El planificador de reparto equitativo tiene en cuenta el uso durante una ventana de tiempo deslizante. Solo el tiempo de ejecución acumulado dentro de esa ventana se considera a efectos de equidad. La duración de esa ventana es actualmente de 28 días. Cuando se invoca el planificador de reparto equitativo, toma en cuenta el uso a partir de hace 28 días. (Nota: La ventana de tiempo deslizante no aplica al Plan Flex. La proporción de reparto equitativo para el Plan Flex es el uso total frente a la asignación.)

  • Tiempo utilizado: Para cada instancia, durante la ventana deslizante de 28 días, se contabiliza todo el uso en todas las QPUs. Esto incluye todas las cargas de trabajo exitosas, así como las cargas de trabajo que devuelven códigos de error conocidos seleccionados. (Nota: La ventana de tiempo deslizante no aplica al Plan Flex. La proporción de reparto equitativo para el Plan Flex es el uso total frente a la asignación.)

Asignación y administración

IBM® asigna una cuota de capacidad de computación cuántica a la cuenta de IBM Cloud de cada organización, según la capacidad contratada en su plan. Los administradores de la cuenta deciden entonces qué porción de esta asignación destinar a cada instancia. El planificador de reparto equitativo utiliza la asignación y el uso actual de las instancias para programar las cargas de trabajo de manera que los recursos se distribuyan equitativamente entre cada instancia.

Por ejemplo, supón que solo dos instancias mantienen cargas de trabajo en la cola de un computador cuántico. En igualdad de condiciones, una instancia con el doble de minutos puede ejecutar el doble de cargas de trabajo.

Si la cuenta de la organización es una cuenta empresarial, los administradores de la cuenta primero deberán distribuir sus asignaciones a las cuentas secundarias de la cuenta, y el administrador de la cuenta secundaria distribuirá su parte de la asignación a las instancias de la cuenta secundaria.

Cómo funciona el planificador de reparto equitativo

El planificador de reparto equitativo selecciona las cargas de trabajo para ejecutar en una QPU en un orden dinámico, de modo que ninguna instancia pueda monopolizar la QPU. Cuando una QPU está lista para trabajo adicional, solicita la siguiente carga de trabajo al planificador de reparto equitativo. El comportamiento predeterminado del planificador es seleccionar la siguiente carga de trabajo identificando primero la instancia que ha utilizado la menor proporción de su asignación dentro de la ventana de programación actual. Si la instancia seleccionada ha enviado más de una carga de trabajo, el planificador seleccionará primero la más antigua. Así, dentro de una instancia, el planificador trabaja según el principio de primero en entrar, primero en salir (FIFO).

Próximos pasos

Recomendaciones