Ahora es la noche del 8 de febrero de 2026.
El proyecto de arbitraje de mercados de predicción, llamado PMA = Predict Market Arbitrage, ya está en línea después de un día de Vibe Coding.
Mage, Ryan y yo escribimos el código usando Opus, GPT y Gemini, todo en un gran revuelo. Sin embargo, ninguno de los tres estamos familiarizados con Rust, pero el proyecto está escrito en Rust.
Hoy usé Opus 4.6 para rehacer el resumen del blog y descubrí algunos problemas:
A veces es difícil para el Agente garantizar que el flujo de trabajo alcance de manera estable el nivel de pass^k, es decir, que pase en k usos consecutivos. Por lo tanto, es necesaria una verificación adicional mediante un script estricto, y los mensajes de error de este script deben ser lo suficientemente claros para poder reintroducirlos en la sesión del Agente.
Actualmente, esto ya está implementado en la fase de resumen de CZON.
Actualmente, parece que todos los artículos de mi blog están cerca del límite de 128k tokens.
Algunos modelos con ventanas de contexto pequeñas (como GPT-3.5-turbo-16k) ya no pueden manejar tanto contenido.
Veremos cómo resolver esto en el futuro, cuando el contenido de mi blog haya aumentado un poco más.
El contenido escrito en una sola sesión puede ser demasiado largo, lo que podría provocar que la salida se trunque. OpenCode no podrá ejecutar la llamada a la herramienta
writeque esté truncada, lo que lleva a reintentos infinitos.La solución es: primero un esquema, luego rellenar + escribir en segmentos. Esto ha permitido escribir con éxito algunos artículos de resumen muy grandes. Ya está implementado en el comando de resumen de CZON.
Por otro lado, solo puedo admirar la capacidad de resumen de Opus, que es realmente poderosa y su pensamiento es muy profundo.
Escuché que C1 se suscribió a la versión ilimitada de OpenAI GPT por 200$ al mes. La próxima vez probaré un poco de su GPT-5.3-CodeX para compararlo con Opus 4.6.
Hoy estoy un poco cansado, así que lo dejaré aquí por ahora.