OpenAI enfrenta críticas por errores de precisión en sus modelos más avanzados

OpenAI enfrenta críticas por errores de precisión en sus modelos más avanzados

Aunque la inteligencia artificial avanza con rapidez y sus modelos son cada vez más capaces, nuevos datos muestran que no todos mejoran por igual en precisión. Según el ranking de Vectara, varias IA líderes como Google Gemini 2.0 o Vectara Mockingbird han logrado tasas de alucinación inferiores al 1%. En cambio, los modelos más recientes de OpenAI, como o3 y o4-mini, presentan resultados preocupantes en este aspecto.

El término “alucinación” en IA se refiere a respuestas falsas que el modelo entrega con seguridad, aunque sean incorrectas. Y aunque se pensaba que este problema iba en aumento generalizado, los datos más recientes indican lo contrario: la mayoría de los modelos han reducido significativamente sus errores, excepto algunos de OpenAI y DeepSeek.

El caso más preocupante es el modelo o3 de OpenAI, que registra una tasa de alucinación del 6.8%, según el académico Ethan Mollick. Esto contrasta con el desempeño de competidores como Google, cuyos modelos mantienen errores por debajo del 1%. DeepSeek R1 incluso supera el 14%, liderando en alucinaciones no deseadas.

Esto plantea una paradoja: los modelos diseñados para realizar tareas complejas —como los de OpenAI— son también los más propensos a equivocarse. Aunque OpenAI reconoce el problema y trabaja en soluciones, estos hallazgos muestran que lograr una IA más inteligente no siempre significa hacerla más confiable.

¿Crees que los modelos deben priorizar potencia o precisión? Cuéntanos en los comentarios.

Author’s Posts