- IA Secrets
- Posts
- 🤖Google LANZA Nano Banana PRO
🤖Google LANZA Nano Banana PRO
🟢 OpenAI lanza GPT‐5.1-Codex-Max: la nueva era de la programación con IA
Truco de IA para trabajar mejor
Google LANZA Nano Banana PRO
OpenAI lanza GPT‑5.1-Codex-Max: la nueva era de la programación con IA
Meta lanza SAM 3 y SAM 3D
La Casa Blanca se prepara para frenar las leyes estatales sobre inteligencia artificial
🤖Truco de IA para trabajar mejor
🤖 Truco de IA para entender y optimizar cualquier proceso solo con capturas de pantalla
Cuando trabajas con software, ERPs, portales internos, CRM, herramientas raras de la empresa, SANI, SAP, Fullstep, etc., explicar el proceso es un infierno.
Pero ChatGPT puede comprenderlo y documentarlo simplemente viendo tus capturas.
✅ Paso 1: Sube varias capturas del proceso
Por ejemplo:Sube cualquier captura de pantalla de como se hace cualquier tipo de proceso dentro de tu CRM.
No hace falta texto. Solo súbelas.
✅ Paso 2: Activa el “modo analista de procesos”
Dile:
“Analiza estas capturas.
Reconstruye el proceso completo paso a paso y explica qué hace cada pantalla.
Luego identifica errores, fricciones y oportunidades de automatización.”
ChatGPT interpreta los botones, campos, tablas, formularios, menús y flujos como si tuviera acceso al sistema real.
✅ Paso 3: Pídele que te genere entregables profesionales
Una vez entienda el flujo, pídele:
“Convierte el proceso en un manual paso a paso con capturas incluidas.”
“Haz un diagrama de flujo simplificado.”
“Genera una SOP (procedimiento operativo estándar) para que un empleado nuevo pueda seguirlo.”
“Hazme una tabla con: tiempo estimado, riesgos, dependencias y oportunidades de automatización.”
✅ Paso 4: Usa las capturas como auditoría
Pídele análisis crítico:
“Indica dónde puede haber errores humanos, dónde falta validación y qué tareas podrían automatizarse con IA o RPA.”
Obtienes un diagnóstico que normalmente requeriría un consultor de procesos.
📌 Por qué funciona
Porque ChatGPT puede:
entender pantallas complejas
detectar patrones de UX
inferir lógica operativa
comparar flujos
identificar ineficiencias
y proponer mejoras estructuradas
Y todo sin acceso al software real. Solo con imágenes.
Find your customers on Roku this Black Friday
As with any digital ad campaign, the important thing is to reach streaming audiences who will convert. To that end, Roku’s self-service Ads Manager stands ready with powerful segmentation and targeting options. After all, you know your customers, and we know our streaming audience.
Worried it’s too late to spin up new Black Friday creative? With Roku Ads Manager, you can easily import and augment existing creative assets from your social channels. We also have AI-assisted upscaling, so every ad is primed for CTV.
Once you’ve done this, then you can easily set up A/B tests to flight different creative variants and Black Friday offers. If you’re a Shopify brand, you can even run shoppable ads directly on-screen so viewers can purchase with just a click of their Roku remote.
Bonus: we’re gifting you $5K in ad credits when you spend your first $5K on Roku Ads Manager. Just sign up and use code GET5K. Terms apply.
🤖Google LANZA Nano Banana PRO

Google ha presentado Nano Banana Pro, su nuevo modelo de inteligencia artificial especializado en la generación y edición avanzada de imágenes, integrado dentro del ecosistema Gemini 3 Pro, la última evolución de su familia de modelos de lenguaje.
Este nuevo modelo, anteriormente conocido como Gemini 2.5 Flash Image, mejora de forma significativa sus capacidades gracias al razonamiento contextual, el acceso a información en tiempo real y un mejor entendimiento visual y textual. Además, ya está disponible de forma gratuita en España a través de la app de Gemini, así como en otros productos de Google como el Buscador, NotebookLM, Slides o Vids.
Principales mejoras de Nano Banana Pro
1. Generación de texto en imágenes
Nano Banana Pro permite insertar texto legible directamente en imágenes, con una variedad de tipografías, texturas y caligrafías, y con soporte multilingüe mejorado. Ahora puede traducir textos manteniendo su apariencia original, lo que lo hace ideal para maquetas, carteles o material educativo.
2. Edición creativa avanzada
Los usuarios pueden modificar cualquier parte de la imagen: ajustar ángulos de cámara, cambiar iluminación, aplicar efectos como el desenfoque (bokeh), cambiar el enfoque o incluso transformar una escena de día a noche. Admite resoluciones 2K y 4K y múltiples relaciones de aspecto.
3. Coherencia en múltiples imágenes
El modelo puede combinar hasta 14 imágenes manteniendo coherencia visual y preservando el parecido de hasta cinco personas, lo que permite crear composiciones complejas y realistas a partir de múltiples fuentes. También destaca la fusión multimodal avanzada, que permite integrar hasta seis imágenes de referencia para generar una nueva, respetando atributos como estilo artístico, pose, iluminación y objetos de fondo.
4. Creación de infografías y diagramas
Ahora también genera infografías y esquemas educativos a partir de información proporcionada o datos extraídos en tiempo real desde Google Search, ideal para presentaciones, contenidos explicativos o materiales de estudio.
Disponibilidad y cómo usarlo gratis
Nano Banana Pro está desplegándose globalmente en:
App Gemini: seleccionando el modelo “Razonamiento” y luego la herramienta "Crear imágenes" (icono de una banana).
Google Search (Modo IA) en EE. UU.
NotebookLM (para suscriptores).
Próximamente en Google Ads, Slides, Vids, Gemini API, AI Studio y el nuevo IDE “Antigravity”.
Los usuarios gratuitos tienen acceso limitado diario, mientras que los suscriptores de Google AI Plus, Pro y Ultradisfrutan de mayor capacidad de uso. En el caso de Google AI Ultra, las imágenes generadas no llevarán marca de agua visible, a diferencia de los niveles inferiores.
Además, todas las imágenes generadas incluyen metadatos C2PA y la marca digital SynthID, para garantizar la trazabilidad y autenticidad del contenido, ayudando a combatir los deepfakes y otros usos maliciosos de la IA.
74% of Companies Are Seeing ROI from AI.
Incomplete data wastes time and stalls ROI. Bright Data connects your AI to real-time public web data so you launch faster, make confident decisions, and achieve real business growth.
🟢 OpenAI lanza GPT‑5.1-Codex-Max: la nueva era de la programación con IA

OpenAI ha presentado GPT‑5.1-Codex-Max, su modelo más avanzado para tareas de programación, ya disponible en Codex. Diseñado específicamente para afrontar tareas de largo recorrido y gran complejidad, este nuevo modelo es más rápido, inteligente y eficiente que sus predecesores, y marca un importante avance hacia el desarrollo de agentes de codificación fiables y persistentes.
Capacidades de nueva generación para desarrolladores
GPT‑5.1-Codex-Max ha sido entrenado con tareas reales de ingeniería de software —desde creación de pull requests y revisión de código hasta frontend y Q&A—, lo que se traduce en un rendimiento superior en evaluaciones técnicas avanzadas. Ahora también funciona de forma nativa en entornos Windows y ha sido optimizado para trabajar con el CLI de Codex como un colaborador eficaz.
Gracias a una nueva técnica llamada compaction, el modelo puede operar de forma coherente en múltiples ventanas de contexto, superando límites anteriores de tokens. Esto le permite mantener sesiones activas durante horas o incluso días, ejecutando refactorizaciones de gran escala, depuraciones complejas y ciclos prolongados de trabajo autónomo.
Eficiencia y rendimiento
Codex-Max destaca por su eficiencia en el uso de tokens, lo que se traduce en un menor coste computacional sin perder calidad. Con el nivel de razonamiento "medio", supera a su predecesor usando un 30% menos de tokens. También se introduce un nuevo nivel de razonamiento “Extra High” (xhigh) para tareas que no requieren respuesta inmediata, logrando una precisión aún mayor.
En tareas como diseño frontend o visualización interactiva (como un simulador RL de CartPole), el modelo genera código más compacto y funcional, manteniendo la estética con menos líneas y llamadas a herramientas.
Liderazgo en tareas de largo recorrido
GPT‑5.1-Codex-Max es capaz de trabajar de manera autónoma durante más de 24 horas, completando proyectos complejos mediante compresión automática de su historial de contexto. Esto le permite continuar con tareas sin reiniciar el proceso ni perder información esencial.
Por ejemplo, puede refactorizar repositorios completos, iterar sobre soluciones fallidas, corregir errores y generar resultados exitosos en ciclos prolongados.
Seguridad y uso responsable
Aunque aún no alcanza un nivel alto de capacidad en ciberseguridad según el marco de OpenAI, Codex-Max es su modelo más competente en esta área hasta la fecha. Funciona en entornos seguros por defecto (sin acceso a internet ni escritura fuera de su espacio de trabajo) y cuenta con sistemas de monitorización específicos para detectar usos maliciosos.
La IA debe ser revisada por humanos antes de desplegarse en producción, y aunque facilita la revisión de código, no sustituye el criterio humano. OpenAI sigue desarrollando salvaguardas y herramientas defensivas como escaneo automático de vulnerabilidades.
Disponibilidad
GPT‑5.1-Codex-Max ya está disponible en Codex para usuarios con planes ChatGPT Plus, Pro, Business, Edu y Enterprise. También estará próximamente disponible vía API para desarrolladores con acceso al CLI de Codex. A partir de ahora, sustituye por defecto al modelo GPT‑5.1-Codex en las plataformas compatibles.
OpenAI recomienda usar Codex-Max exclusivamente para tareas de codificación automatizada en entornos diseñados para ello.
¿Quieres que tu empresa empiece a aprovechar la IA de forma real?
Además de esta newsletter, ayudo a empresas a ahorrar tiempo, reducir trabajo repetitivo y mejorar resultados gracias a formaciones prácticas y consultoría en inteligencia artificial.
Enseño a los equipos a usar la IA en su día a día y diseño soluciones que hacen que todo funcione más rápido, con menos errores y con más claridad a la hora de tomar decisiones.
Si te gustaría saber cómo podría ayudar a tu negocio, responde directamente a este email y hablamos sin compromiso.
🧑Meta lanza SAM 3 y SAM 3D

Meta ha dado un gran salto tecnológico con la presentación de SAM 3 y SAM 3D, las nuevas versiones de su innovador modelo Segment Anything. Estas herramientas ya están disponibles para probar en el nuevo Segment Anything Playground, y prometen revolucionar sectores como el desarrollo de videojuegos, la realidad aumentada y el comercio online.
¿Qué pueden hacer SAM 3 y SAM 3D?
SAM 3 incorpora segmentación guiada por texto, lo que permite a los usuarios dar instrucciones del tipo “aísla el reposabrazos de madera” o “segmenta el autobús escolar amarillo” directamente desde una imagen. Esta función no se limita a etiquetas predefinidas, sino que comprende el lenguaje natural, mejorando enormemente la flexibilidad y precisión respecto a versiones anteriores.
La verdadera revolución llega con SAM 3D, capaz de generar un modelo 3D completo y texturizado a partir de una única fotografía. Esto soluciona una de las tareas más complicadas en el campo de la visión artificial: convertir imágenes 2D en activos tridimensionales detallados. Según Meta, el modelo ha superado ampliamente a sus competidores en evaluaciones realizadas por humanos.
Aplicaciones prácticas inmediatas
Meta ya está integrando esta tecnología en productos reales. Por ejemplo, la función "Ver en tu habitación" de Facebook Marketplace se apoyará en SAM 3D para mostrar cómo quedaría un mueble en tu casa antes de comprarlo. En un futuro cercano, podrías sacar una foto de tus zapatillas y obtener un modelo 3D listo para ser usado en videojuegos o entornos de realidad virtual.
Conclusión
Con SAM 3 y SAM 3D, Meta no solo mejora la interacción con imágenes, sino que acerca la creación de contenido tridimensional al usuario común. Ya no se necesita experiencia en modelado 3D: basta una imagen y una frase para transformar el mundo físico en digital.
Introducing Voice AI Agents on WhatsApp
WhatsApp has always been where customers start conversations. Now, with Synthflow, those conversations can continue seamlessly over calls — answered directly by Voice AI Agents.
Enterprises can finally manage WhatsApp calls with the same automation, analytics, and security as phones.
The result: faster resolutions, 24/7 coverage, and a unified system for every customer call, whether it starts on telephony or WhatsApp.
🟢 La Casa Blanca se prepara para frenar las leyes estatales sobre inteligencia artificial

La administración Biden está preparando un movimiento legal de gran alcance: una orden ejecutiva que instruiría al Departamento de Justicia (DOJ) para demandar a los estados que promulguen sus propias regulaciones sobre inteligencia artificial. Este paso surge tras el fracaso de los republicanos en el Congreso para bloquear normativas estatales mediante una ley federal.
Un borrador de la orden, que ya circula por correos electrónicos de San Francisco, revela una Casa Blanca decidida a centralizar la regulación de la IA bajo el poder federal. No obstante, esta medida podría chocar con los límites constitucionales sobre lo que un presidente puede ordenar al DOJ, como ya se ha visto en disputas anteriores sobre inmigración o privacidad de datos.
Tensión entre estados y gobierno federal
De aprobarse la orden, estados como California, Colorado o Florida tendrán que decidir si mantienen sus regulaciones específicas o esperan a una legislación federal que sigue sin materializarse. Las empresas tecnológicas, por su parte, ya adaptándose a normativas estatales dispares, se enfrentarían a una nueva ola de incertidumbre jurídica y operativa.
Más allá del marco legal: presión creciente
Aunque el contenido del borrador se centra en el ámbito legal, sugiere que hay una presión más profunda en juego. La falta de una normativa federal clara, unida al creciente uso de la IA en todos los sectores, está empujando a la administración a tomar el control antes de que los estados llenen el vacío con reglas propias y contradictorias.
Conclusión
La iniciativa marca un cambio de tono en la gobernanza tecnológica de EE. UU., con la Casa Blanca preparada para usar el poder judicial como herramienta de centralización. Pero también abre la puerta a batallas legales prolongadas que podrían redefinir el equilibrio de poder entre estados y gobierno federal en materia de inteligencia artificial.
Gracias por llegar hasta aquí! Tengo un regalo para ti
Como muestra de agradecimiento por seguir leyendo hasta el final, quiero darte acceso a dos de mis guías más valiosas, que ahora están disponibles exclusivamente dentro de IA Secrets ACADEMY.
Puedes acceder a esta guia pulsando la imagen o aqui
Muchas gracias por leerme! Nos vemos en la siguiente edición





Reply