OpenAI publicó un post mortem de por qué GPT-5 empezó a comportarse como un personaje de fantasía menor. El modelo desarrolló una 'personalidad goblin' — respuestas raras, dramáticas, fuera de tono — y tardaron un tiempo en entender por qué. Que lo publiquen así, con causa raíz y todo, es exactamente lo que deberían hacer más empresas de IA. El problema no es que pase. El problema es cuando no lo cuentan.OpenAI published a post mortem on why GPT-5 started behaving like a minor fantasy character. The model developed a 'goblin personality' — strange, dramatic, off-tone responses — and it took them a while to understand why. Publishing this with root cause analysis is exactly what more AI companies should do. The problem isn't that it happens. The problem is when they don't tell you.
OpenAI se burló públicamente de Anthropic cuando limitaron Mythos por razones de seguridad. Ahora están haciendo exactamente lo mismo con GPT-5.5 Cyber, restringiéndolo a 'defensores críticos de ciberseguridad'. Hay una palabra para esto, pero es demasiado obvia. Lo que sí es genuino: que dos labs top lleguen independientemente a la misma conclusión sobre sus herramientas de ciberseguridad dice algo real sobre los riesgos.OpenAI publicly mocked Anthropic when they limited Mythos for safety reasons. Now they're doing exactly the same thing with GPT-5.5 Cyber, restricting it to 'critical cyber defenders'. There's a word for this, but it's too obvious. What is genuine: two top labs independently reaching the same conclusion about their cybersecurity tools says something real about the risks.
El Instituto de Seguridad de IA del Reino Unido evaluó GPT-5.5 para encontrar vulnerabilidades de seguridad — el mismo instituto que ya evaluó Claude Mythos. Que haya un organismo gubernamental haciendo esto sistemáticamente con los modelos frontier es, sin dramatismo, una de las cosas más importantes que están pasando en IA ahora mismo. No es suficiente todavía, pero es la dirección correcta.The UK AI Security Institute evaluated GPT-5.5 for finding security vulnerabilities — the same institute that already evaluated Claude Mythos. Having a government body doing this systematically with frontier models is, without drama, one of the most important things happening in AI right now. It's not enough yet, but it's the right direction.
OpenAI lanzó protecciones adicionales para cuentas de ChatGPT: login resistente a phishing, recuperación más robusta, y una alianza con Yubico para llaves de seguridad físicas. Que esto recién llegue ahora, con la cantidad de datos sensibles que maneja la gente en ChatGPT, dice bastante sobre cuánto tardaron. Pero mejor tarde que nunca, y la integración con llaves físicas es una movida seria.OpenAI launched additional protections for ChatGPT accounts: phishing-resistant login, stronger recovery, and a partnership with Yubico for physical security keys. That this is only arriving now, given how much sensitive data people store in ChatGPT, says a lot about how long it took. But better late than never, and the physical key integration is a serious move.
Anthropic está a punto de levantar $50 mil millones a una valuación de $900 mil millones. Para ponerlo en perspectiva: eso la dejaría más cerca de Apple que de la mayoría de las startups que conocemos. Puede ser que el mercado tenga razón sobre el potencial de la IA. También puede ser la burbuja más cara de la historia. Probablemente es las dos cosas al mismo tiempo.Anthropic is about to raise $50 billion at a $900 billion valuation. To put it in perspective: that would place it closer to Apple than to most startups we know. The market might be right about AI's potential. It might also be the most expensive bubble in history. It's probably both at the same time.
Musk declaró bajo juramento que xAI usó modelos de OpenAI para entrenar Grok — lo que en la industria se llama destilación. Esto mientras Musk demanda a OpenAI por traicionar su misión original. La ironía es tan grande que no necesita análisis. Lo que sí necesita atención es que la destilación entre modelos frontier es el próximo campo de batalla legal del sector.Musk testified under oath that xAI used OpenAI models to train Grok — what the industry calls distillation. This while Musk is suing OpenAI for betraying its original mission. The irony is too large to require analysis. What does need attention: distillation between frontier models is the sector's next legal battleground.
Gemini se va a integrar en millones de autos. No es el primer asistente de voz en un auto — llevamos años con eso — pero es la primera vez que el contexto de una conversación extensa, con razonamiento real, llega al tablero. El verdadero test no es si funciona en demo. Es si funciona cuando manejás a 100 km/h y el niño llora atrás.Gemini is being integrated into millions of cars. It's not the first voice assistant in a vehicle — we've had those for years — but it's the first time extended conversational context with real reasoning comes to the dashboard. The real test isn't whether it works in a demo. It's whether it works when you're driving at 100 km/h with a crying kid in the back.
Stripe actualizó Link para que agentes de IA puedan hacer compras en nombre de usuarios, con flujos de aprobación para que el humano dé el visto bueno. Esto es infraestructura real para la economía agéntica — el momento en que los agentes dejan de solo buscar información y empiezan a gastar plata. Que sea Stripe quien lo construye primero tiene sentido: son los que más saben de pagos.Stripe updated Link so AI agents can make purchases on behalf of users, with approval flows for human sign-off. This is real infrastructure for the agentic economy — the moment when agents stop just finding information and start spending money. That Stripe is building this first makes sense: they know payments better than anyone.
Zig — un lenguaje de programación de bajo nivel con comunidad pequeña pero muy técnica — prohibió totalmente el uso de LLMs en issues, pull requests y comentarios. Su argumento: el código generado por IA comete errores distintos a los humanos, y esa diferencia los delata y degrada la calidad del proyecto. No es paranoia: es un proyecto que necesita código extremadamente preciso y no puede darse el lujo de ruido.Zig — a low-level programming language with a small but highly technical community — has completely banned LLM use in issues, pull requests, and comments. Their argument: AI-generated code makes different mistakes than humans do, and that difference exposes and degrades project quality. It's not paranoia: it's a project that needs extremely precise code and can't afford noise.
Goodfire lanzó Silico, una herramienta que permite mirar adentro de un modelo de lenguaje y ajustar sus parámetros — las configuraciones que determinan cómo se comporta. La interpretabilidad mecanicista es el campo que intenta entender qué pasa realmente dentro de estos modelos, no solo qué producen. Es investigación que importa para la seguridad de IA, y que hasta ahora era casi exclusiva de los labs grandes.Goodfire released Silico, a tool that lets you look inside a language model and adjust its parameters — the settings that determine its behavior. Mechanistic interpretability is the field trying to understand what actually happens inside these models, not just what they output. It's research that matters for AI safety, and until now it was almost exclusively the domain of large labs.
DeepMind está investigando un 'co-clínico' de IA — un asistente médico que trabaja junto al médico humano, no en lugar de él. La distinción es importante y la están haciendo explícita, lo cual es inteligente. Salud es el área donde IA tiene el potencial más alto de hacer bien real, y también el área donde una falla cuesta vidas. Cada avance aquí merece seguimiento.DeepMind is researching an AI 'co-clinician' — a medical assistant that works alongside the human doctor, not in place of them. The distinction matters and they're making it explicit, which is smart. Healthcare is the area where AI has the highest potential for real good, and also where a failure costs lives. Every advance here deserves tracking.
OpenAI escala Stargate con más capacidad de data centers para AGI. El framing de 'Era de la Inteligencia' es marketing, pero los números de infraestructura son reales. Lo que más me llama la atención de estos anuncios de compute es lo que no dicen: cuánta energía consume todo esto, y quién paga la factura eléctrica cuando el negocio todavía no es rentable.OpenAI is scaling Stargate with more data center capacity for AGI. The 'Intelligence Age' framing is marketing, but the infrastructure numbers are real. What strikes me most about these compute announcements is what they don't say: how much energy all this consumes, and who pays the electricity bill when the business still isn't profitable.
El gobierno chileno mandó a California a su canciller y ministra de Ciencia a reunirse con Nvidia, Google, Meta, OpenAI, Cisco, Salesforce y Apple. La lista es impresionante. Lo que importa ahora es qué sale de esas reuniones — si son acuerdos concretos de inversión, formación o infraestructura, o si son fotos para el comunicado de prensa. El historial de este tipo de misiones en LATAM es mixto.El gobierno chileno mandó a California a su canciller y ministra de Ciencia a reunirse con Nvidia, Google, Meta, OpenAI, Cisco, Salesforce y Apple. La lista es impresionante. Lo que importa ahora es qué sale de esas reuniones — si son acuerdos concretos de inversión, formación o infraestructura, o si son fotos para el comunicado de prensa. El historial de este tipo de misiones en LATAM es mixto.
Diario Financiero analiza los resultados de las grandes tecnológicas: el mercado se está volviendo más selectivo y la competencia más intensa. Esto no es solo tendencia global — tiene implicancias directas para Chile, donde las empresas están decidiendo en qué plataformas apostar. Elegir mal la infraestructura de IA hoy es el equivalente a haber apostado por el proveedor equivocado de ERP hace 20 años.Diario Financiero analiza los resultados de las grandes tecnológicas: el mercado se está volviendo más selectivo y la competencia más intensa. Esto no es solo tendencia global — tiene implicancias directas para Chile, donde las empresas están decidiendo en qué plataformas apostar. Elegir mal la infraestructura de IA hoy es el equivalente a haber apostado por el proveedor equivocado de ERP hace 20 años.
El programa 10Pay cerró su tercera edición analizando el ecosistema cripto en Chile — adopción baja, regulación en construcción, y actores del ecosistema tratando de encontrar casos de uso reales. El paralelo con IA es directo: mismos debates sobre regulación, misma brecha entre entusiasmo y adopción real. Chile tiene la infraestructura financiera para moverse rápido aquí, si el regulador no se adelanta con restricciones mal diseñadas.El programa 10Pay cerró su tercera edición analizando el ecosistema cripto en Chile — adopción baja, regulación en construcción, y actores del ecosistema tratando de encontrar casos de uso reales. El paralelo con IA es directo: mismos debates sobre regulación, misma brecha entre entusiasmo y adopción real. Chile tiene la infraestructura financiera para moverse rápido aquí, si el regulador no se adelanta con restricciones mal diseñadas.