Qiskit Code Assistant

Qiskit Code Assistant tiene como objetivo hacer la computación cuántica más accesible para los nuevos usuarios de Qiskit y mejorar la experiencia de programación para los usuarios actuales. Es un asistente de código de IA generativa impulsado por watsonx. Ha sido entrenado con millones de tokens de texto del SDK de Qiskit, años de ejemplos de código Qiskit y características de IBM Quantum®. Qiskit Code Assistant puede ayudar en tu flujo de trabajo de desarrollo cuántico ofreciendo sugerencias generadas por LLM basadas en modelos IBM Granite, que incorporan las últimas características y funcionalidades de IBM®.

Notas

Esta es una función experimental disponible para los usuarios del Plan Premium de IBM Quantum registrados en la nueva IBM Quantum Platform.
Qiskit Code Assistant está en estado de versión preliminar y está sujeto a cambios.
Si tienes comentarios o deseas contactar con el equipo de desarrollo, usa el canal de Qiskit en Slack Workspace o los repositorios públicos de GitHub relacionados.

Características

Las siguientes características están incluidas en las extensiones para Visual Studio Code (VS Code) y editores compatibles, así como para JupyterLab:

Acelera la generación de código Qiskit aprovechando la IA generativa basada en modelos especializados en generar código Qiskit.
Permite prompts abstractos y específicos para generar recomendaciones.
Presenta sugerencias que puedes revisar, aceptar o rechazar.
Compatible con archivos de código Python y cuadernos Jupyter.
Incluye mecanismos de protección para evitar responder preguntas que representen un riesgo potencial para los usuarios, como el discurso de odio.

Para obtener instrucciones sobre cómo integrar Qiskit Code Assistant directamente en tu entorno de desarrollo, sigue las instrucciones en el tema correspondiente:

El modelo de lenguaje grande (LLM) detrás de Qiskit Code Assistant

Para proporcionar sugerencias de código, Qiskit Code Assistant utiliza un modelo de lenguaje grande (LLM). En este caso, Qiskit Code Assistant actualmente se apoya en el modelo mistral-small-3.2-24b-qiskit, construido sobre el modelo Mistral-Small-3.2-24B-Qiskit. El modelo mistral-small-3.2-24b-qiskit mejora las capacidades de generación de código para Qiskit del modelo Mistral-Small-3.2-24B-Instruct-2506 mediante preentrenamiento extendido y ajuste fino con datos de Qiskit de alta calidad, así como confirmaciones de Python y chat. Para más información sobre la familia de modelos Mistral AI, consulta la documentación de Mistral AI. Para más detalles sobre los modelos .*-qiskit, consulta Qiskit Code Assistant: Training LLMs for generating Quantum Computing Code.

Nuestros LLMs especializados para Qiskit también están disponibles como modelos de código abierto. Consulta todos los modelos disponibles en https://huggingface.co/Qiskit.

Los benchmarks Qiskit HumanEval y Qiskit HumanEval Hard

Para probar mistral-small-3.2-24b-qiskit y otros modelos, colaboramos con Qiskit Advocates y expertos para crear los benchmarks basados en ejecución llamados Qiskit HumanEval (QHE) y Qiskit HumanEval Hard (QHE Hard), y los ejecutamos sobre los modelos. Estos benchmarks son similares a HumanEval, e incluyen múltiples problemas de código desafiantes a resolver, todos basados en las bibliotecas oficiales de Qiskit.

Los benchmarks están compuestos por aproximadamente 150 pruebas, cada una elaborada a partir de una definición de función seguida de un docstring que detalla la tarea que el modelo debe resolver. Cada ejemplo también incluye una solución canónica de referencia, así como pruebas unitarias para evaluar la corrección de las soluciones generadas. Hay tres niveles de dificultad para las pruebas: básico, intermedio y difícil. El benchmark Qiskit HumanEval Hard es una variación del Qiskit HumanEval, pero elimina la información relacionada con las importaciones de código, por lo que el LLM debe determinar las importaciones correctas de métodos o clases. Este cambio hace que el dataset sea mucho más desafiante para los LLMs, según nuestras pruebas y resultados iniciales.

Los datasets de Qiskit HumanEval y Qiskit HumanEval Hard están disponibles en estos sitios web: Qiskit HumanEval y Qiskit HumanEval. Puedes contribuir al desarrollo de estos benchmarks en el repositorio de GitHub.

Más información y citas

Para obtener más información sobre Qiskit Code Assistant, los benchmarks Qiskit HumanEval o Qiskit HumanEval Hard, y citarlos en tus publicaciones científicas, revisa estas citas recomendadas:

@misc{2405.19495,
Author = {Nicolas Dupuis and Luca Buratti and Sanjay Vishwakarma and Aitana Viudes Forrat and David Kremer and Ismael Faro and Ruchir Puri and Juan Cruz-Benito},
Title = {Qiskit Code Assistant: Training LLMs for generating Quantum Computing Code},
Year = {2024},
Eprint = {arXiv:2405.19495},
}

@misc{2406.14712,
Author = {Sanjay Vishwakarma and Francis Harkins and Siddharth Golecha and Vishal Sharathchandra Bajpe and Nicolas Dupuis and Luca Buratti and David Kremer and Ismael Faro and Ruchir Puri and Juan Cruz-Benito},
Title = {Qiskit HumanEval: An Evaluation Benchmark For Quantum Code Generative Models},
Year = {2024},
Eprint = {arXiv:2406.14712},
}

@misc{2508.20907,
Author = {Nicolas Dupuis and Adarsh Tiwari and Youssef Mroueh and David Kremer and Ismael Faro and Juan Cruz-Benito},
Title = {Quantum Verifiable Rewards for Post-Training Qiskit Code Assistant},
Year = {2025},
Eprint = {arXiv:2508.20907},
}

Usar Qiskit Code Assistant en modo local

Aprende cómo instalar, configurar y usar cualquiera de los modelos de Qiskit Code Assistant en tu máquina local.

Notas

Qiskit Code Assistant está en estado de versión preliminar y está sujeto a cambios.
Si tienes comentarios o deseas contactar con el equipo de desarrollo, usa el canal de Qiskit en Slack Workspace o los repositorios públicos de GitHub relacionados.

Inicio rápido (recomendado)

La forma más sencilla de comenzar con Qiskit Code Assistant en modo local es usar los scripts de configuración automática para la extensión de VS Code o JupyterLab. Estos scripts instalarán automáticamente Ollama para ejecutar los LLMs, descargarán el modelo recomendado y configurarán la extensión por ti.

Configuración de la extensión de VS Code

Ejecuta el siguiente comando en tu terminal:

bash <(curl -fsSL https://raw.githubusercontent.com/Qiskit/qiskit-code-assistant-vscode/main/setup_local.sh)

Este script realiza los siguientes pasos:

Instalar Ollama (si no está ya instalado)
Descargar y configurar el modelo de Qiskit Code Assistant recomendado
Configurar la extensión de VS Code para trabajar con tu despliegue local

Configuración de la extensión de JupyterLab

Ejecuta el siguiente comando en tu terminal:

bash <(curl -fsSL https://raw.githubusercontent.com/Qiskit/qiskit-code-assistant-jupyterlab/main/setup_local.sh)

Este script realizará lo siguiente:

Instalar Ollama (si no está ya instalado)
Descargar y configurar el modelo de Qiskit Code Assistant recomendado
Configurar la extensión de JupyterLab para trabajar con tu despliegue local

Modelos disponibles

Modelos actuales

Estos son los modelos más recientes recomendados para usar con Qiskit Code Assistant:

Qiskit/mistral-small-3.2-24b-qiskit - Released October 2025
qiskit/qwen2.5-coder-14b-qiskit - Released June 2025
qiskit/granite-3.3-8b-qiskit - Released June 2025
qiskit/granite-3.2-8b-qiskit - Released June 2025

Modelos GGUF (recomendados para entornos personales/portátiles)

Los modelos en formato GGUF están optimizados para uso local y requieren menos recursos computacionales:

mistral-small-3.2-24b-qiskit-GGUF – Publicado en octubre de 2025
Entrenado con datos de Qiskit hasta la versión 2.1
qiskit/qwen2.5-coder-14b-qiskit-GGUF – Publicado en junio de 2025
Entrenado con datos de Qiskit hasta la versión 2.0
qiskit/granite-3.3-8b-qiskit-GGUF – Publicado en junio de 2025
Entrenado con datos de Qiskit hasta la versión 2.0
qiskit/granite-3.2-8b-qiskit-GGUF – Publicado en junio de 2025
Entrenado con datos de Qiskit hasta la versión 2.0

Los modelos de código abierto de Qiskit Code Assistant están disponibles en safetensors o formato de archivo GGUF y pueden descargarse desde Hugging Face como se explica a continuación.

Versiones de Qiskit usadas para el entrenamiento

Modelo						Métricas del benchmark					Fecha de lanzamiento	Entrenado con la versión de Qiskit
	QiskitHumanEval-Hard	QiskitHumanEval	HumanEval	ASDiv	MathQA	SciQ	MBPP	IFEval	CrowsPairs (English)	TruthfulQA (MC1 acc)
mistral-small-3.2-24b-qiskit	32.45	47.02	77.49	3.77	49.68	97.50	64.00	48.44	67.08	39.41	January 2026	2.2
qwen2.5-coder-14b-qiskit	25.17	49.01	91.46	4.21	53.90	97.00	77.60	49.64	65.18	37.82	June 2025	2.0
granite-3.3-8b-qiskit	14.57	27.15	62.80	0.48	38.66	93.30	52.40	59.71	59.75	39.05	June 2025	2.0
granite-3.2-8b-qiskit	9.93	24.50	57.32	0.09	41.41	96.30	51.80	60.79	66.79	40.51	June 2025	2.0
granite-8b-qiskit-rc-0.10	15.89	38.41	59.76	—	—	—	—	—	—	—	February 2025	1.3
granite-8b-qiskit	17.88	44.37	53.66	—	—	—	—	—	—	—	November 2024	1.2

Nota: Todos los modelos listados en la tabla de benchmarks fueron evaluados usando su prompt de sistema respectivo, definido en su modelo de Hugging Face.

Modelos obsoletos

Estos modelos ya no reciben mantenimiento activo pero siguen estando disponibles:

qiskit/granite-8b-qiskit-rc-0.10 - Released February 2025 (deprecated)
qiskit/granite-8b-qiskit - Released November 2024 (deprecated)

Configuración avanzada

Si prefieres configurar tu entorno local manualmente o necesitas más control sobre el proceso de instalación, expande las secciones a continuación.

Descargar desde el sitio web de Hugging Face

Sigue estos pasos para descargar cualquier modelo relacionado con Qiskit Code Assistant desde el sitio web de Hugging Face:

Navega a la página del modelo de Qiskit deseado en Hugging Face.
Ve a la pestaña Files and Versions y descarga los archivos del modelo en formato safetensors o GGUF.

Descargar usando la CLI de Hugging Face

Para descargar cualquiera de los modelos disponibles de Qiskit Code Assistant usando la CLI de Hugging Face, sigue estos pasos:

Instala la CLI de Hugging Face
Inicia sesión en tu cuenta de Hugging Face
```
huggingface-cli login
```

Descarga el modelo que prefieras de la lista anterior

huggingface-cli download <HF REPO NAME> <MODEL PATH> --local-dir <LOCAL PATH>

Desplegar manualmente los modelos de Qiskit Code Assistant en local mediante Ollama

Hay múltiples formas de desplegar e interactuar con el modelo de Qiskit Code Assistant descargado. Esta guía muestra cómo hacerlo con Ollama: bien con la aplicación Ollama usando la integración con Hugging Face Hub o un modelo local, o bien con el paquete llama-cpp-python.

Usar la aplicación Ollama

La aplicación Ollama ofrece una solución sencilla para ejecutar los LLMs localmente. Es fácil de usar, con una CLI que simplifica todo el proceso de configuración, gestión de modelos e interacción. Es ideal para experimentación rápida y para usuarios que quieren manejar menos detalles técnicos.

Instalar Ollama

Descarga la aplicación Ollama
Instala el archivo descargado
Lanza la aplicación Ollama instalada

información
La aplicación funciona correctamente cuando el icono de Ollama aparece en la barra de menú del escritorio. También puedes verificar que el servicio está en ejecución accediendo a http://localhost:11434/.
Prueba Ollama en tu terminal y comienza a ejecutar modelos. Por ejemplo:
```
ollama run hf.co/Qiskit/Qwen2.5-Coder-14B-Qiskit
```

Configurar Ollama usando la integración con Hugging Face Hub

La integración Ollama/Hugging Face Hub proporciona una forma de interactuar con modelos alojados en Hugging Face Hub sin necesidad de crear un nuevo modelfile ni descargar manualmente los archivos GGUF o safetensors. Los archivos template y params predeterminados ya están incluidos para el modelo en Hugging Face Hub.

Asegúrate de que la aplicación Ollama esté en ejecución.
Ve a la página del modelo deseado y copia la URL. Por ejemplo, https://huggingface.co/Qiskit/Qwen2.5-Coder-14B-Qiskit-GGUF.

Desde tu terminal, ejecuta el comando:

ollama run hf.co/Qiskit/Qwen2.5-Coder-14B-Qiskit

Puedes usar el modelo hf.co/Qiskit/Qwen2.5-Coder-14B-Qiskit o cualquiera de los otros modelos GGUF oficiales actualmente recomendados: hf.co/Qiskit/mistral-small-3.2-24b-qiskit-GGUF o hf.co/Qiskit/granite-3.3-8b-qiskit-GGUF.

Configurar Ollama con un modelo GGUF de Qiskit Code Assistant descargado manualmente

Si has descargado manualmente un modelo GGUF como https://huggingface.co/Qiskit/Qwen2.5-Coder-14B-Qiskit-GGUF y quieres experimentar con diferentes plantillas y parámetros, puedes seguir estos pasos para cargarlo en tu aplicación Ollama local.

Crea un Modelfile con el siguiente contenido y asegúrate de actualizar <PATH-TO-GGUF-FILE> con la ruta real de tu modelo descargado.

FROM <PATH-TO-GGUF-FILE>
TEMPLATE """{{ if .System }}
System:
{{ .System }}

{{ end }}{{ if .Prompt }}Question:
{{ .Prompt }}

{{ end }}Answer:
```python{{ .Response }}
"""

PARAMETER stop "Question:"
PARAMETER stop "Answer:"
PARAMETER stop "System:"
PARAMETER stop "```"

PARAMETER temperature 0
PARAMETER top_k 1

Run the following command to create a custom model instance based on the Modelfile.
```
ollama create Qwen2.5-Coder-14B-Qiskit -f ./path-to-model-file
```
nota
This process may take some time for Ollama to read the model file, initialize the model instance, and configure it according to the specifications provided.

Run the Qiskit Code Assistant model manually downloaded in Ollama

After the Qwen2.5-Coder-14B-Qiskit model has been set up in Ollama, run the following command to launch the model and interact with it in the terminal (in chat mode).

ollama run Qwen2.5-Coder-14B-Qiskit

Some useful commands:

ollama list - List models on your computer
ollama rm Qwen2.5-Coder-14B-Qiskit - Delete the model
ollama show Qwen2.5-Coder-14B-Qiskit - Show model information
ollama stop Qwen2.5-Coder-14B-Qiskit - Stop a model that is currently running
ollama ps - List which models are currently loaded

Manually deploy the Qiskit Code Assistant models in local through the llama-cpp-python package

An alternative to the Ollama application is the llama-cpp-python package, which is a Python binding for llama.cpp. It gives you more control and flexibility to run the GGUF model locally, and is ideal for users who wish to integrate the local model in their workflows and Python applications.

Install llama-cpp-python
Interact with the model from within your application using llama_cpp. For example:

from llama_cpp import Llama

model_path = <PATH-TO-GGUF-FILE>

model = Llama(
        model_path,
        seed=17,
        n_ctx=10000,
        n_gpu_layers=37, # to offload in gpu, but put 0 if all in cpu
    )

input = 'Generate a quantum circuit with 2 qubits'
raw_pred = model(input)["choices"][0]["text"]

You can also add text generation parameters to the model to customize the inference:

generation_kwargs = {
        "max_tokens": 512,
        "echo": False, # Echo the prompt in the output
        "top_k": 1
    }

raw_pred = model(input, **generation_kwargs)["choices"][0]["text"]

Manually deploy the Qiskit Code Assistant models in local through llama.cpp

Use the `llama.cpp` library

Another alternative is to use llama.cpp, an open-source library for performing LLM inference on a CPU with minimal setup. It provides low-level control over the model execution and is typically run from the command line, pointing to a local GGUF model file.

There are several ways to install llama.cpp on your machine:

Install llama.cpp using brew, nix, or winget
Run with Docker: See out the Docker documentation by llama.cpp team
Download pre-built binaries from the releases page
Build from source by cloning this repository

Once installed, you can use llama.cpp to interact with GGUF models in conversation mode as follows:

# Use a local model file
llama-cli -m my_model.gguf -cnv

# Or download and run a model directly from Hugging Face
llama-cli -hf Qiskit/Qwen2.5-Coder-14B-Qiskit-GGUF -cnv

You can also launch an OpenAI-compatible API server for the model in the following way:

llama-server -hf Qiskit/Qwen2.5-Coder-14B-Qiskit-GGUF

Advanced parameters

With the llama-cli program, you can control the model generation using command-line options. For example, you can provide an initial “system” prompt using the -p/--prompt flag. In conversation mode (-cnv), this initial prompt acts as the system message. Otherwise, you can simply prepend any desired instruction to your prompt text. You can also adjust sampling parameters - for instance: temperature (--temp), top-k (--top-k), top-p (--top-p), repetition penalty (--repeat-penalty), and the seed to use (--seed). The following is an example invocation using these options:

llama-cli -hf Qiskit/Qwen2.5-Coder-14B-Qiskit-GGUF \
  -p "You are a friendly assistant." -cnv \
  --temp 0.7 \
  --top-k 50 \
  --top-p 0.95 \
  --repeat-penalty 1.1 \
  --seed 42

Para garantizar el funcionamiento correcto de nuestros modelos Qiskit, recomendamos usar el prompt de sistema proporcionado en nuestros repositorios GGUF de HF: prompt de sistema para mistral-small-3.2-24b-qiskit-GGUF, Qwen2.5-Coder-14B-Qiskit-GGUF, granite-3.3-8b-qiskit-GGUF y granite-3.2-8b-qiskit-GGUF.

Conectar manualmente las extensiones al despliegue local

Usa la extensión de VS Code y la extensión de JupyterLab para Qiskit Code Assistant para interactuar con el modelo de Qiskit Code Assistant desplegado localmente. Una vez que tengas la aplicación Ollama configurada con el modelo, puedes configurar las extensiones para conectarse al servicio local.

Conectar con la extensión de VS Code de Qiskit Code Assistant

Con la extensión de VS Code de Qiskit Code Assistant, puedes interactuar con el modelo y realizar completado de código mientras escribes tu código. Esto puede funcionar bien para usuarios que buscan asistencia al escribir código Qiskit para sus aplicaciones Python.

Instala la extensión de VS Code de Qiskit Code Assistant.
En VS Code, ve a Configuración de usuario y establece Qiskit Code Assistant: Url en la URL de tu despliegue local de Ollama (por ejemplo, http://localhost:11434).
Recarga VS Code yendo a Ver > Paleta de comandos... y seleccionando Desarrollador: Recargar ventana.

El modelo de Qiskit Code Assistant configurado en Ollama debería aparecer en la barra de estado y estar listo para usar.

Conectar con la extensión de JupyterLab de Qiskit Code Assistant

Con la extensión de JupyterLab de Qiskit Code Assistant, puedes interactuar con el modelo y realizar completado de código directamente en tu Jupyter Notebook. Los usuarios que trabajan principalmente con Jupyter Notebooks pueden aprovechar esta extensión para mejorar aún más su experiencia al escribir código Qiskit.

Instala la extensión de JupyterLab de Qiskit Code Assistant.
En JupyterLab, ve al Editor de configuración y establece Qiskit Code Assistant Service API en la URL de tu despliegue local de Ollama (por ejemplo, http://localhost:11434).

El modelo de Qiskit Code Assistant configurado en Ollama debería aparecer en la barra de estado y estar listo para usar.

Próximos pasos

Recomendaciones

Instala y usa las extensiones oficiales de JupyterLab o VS Code.
Consulta ejemplos para usar Qiskit Code Assistant con circuitos, configuración de supresión de errores y transpilación con pass managers.

Características​

El modelo de lenguaje grande (LLM) detrás de Qiskit Code Assistant​

Los benchmarks Qiskit HumanEval y Qiskit HumanEval Hard​

Más información y citas​

Usar Qiskit Code Assistant en modo local​

Inicio rápido (recomendado)​

Configuración de la extensión de VS Code​

Configuración de la extensión de JupyterLab​

Modelos disponibles​

Modelos actuales​

Modelos GGUF (recomendados para entornos personales/portátiles)​

Versiones de Qiskit usadas para el entrenamiento​

Modelos obsoletos​

Configuración avanzada​

Usar la aplicación Ollama​

Instalar Ollama​

Configurar Ollama usando la integración con Hugging Face Hub​

Configurar Ollama con un modelo GGUF de Qiskit Code Assistant descargado manualmente​

Run the Qiskit Code Assistant model manually downloaded in Ollama​

Use the llama.cpp library​

Advanced parameters​

Conectar con la extensión de VS Code de Qiskit Code Assistant​

Conectar con la extensión de JupyterLab de Qiskit Code Assistant​

Próximos pasos​