Próxima versión de ChatGPT diseñada para resolver problemas complejos
A pesar de que el alboroto entorno a la IA parece estar disminuyendo, OpenAI continúa avanzando: la organización ha lanzado una versión mejorada de su chatbot de IA, llamado o1. Este modelo actualizado es capaz, según se informa, de lidiar con problemas matemáticos complejos y corregir sus errores de manera autónoma. Sin embargo, persiste un fallo.
En cuanto a dar consejos, algo que los padres suelen compartir con sus hijos, los desarrolladores de OpenAI han implementado una estrategia similar en la última versión de su chatbot de IA. El software, o1, tarda más en pensar una respuesta antes de darla -al igual que lo hace una persona-, según el anuncio de la empresa.
Esta aproximación permite que el nuevo modelo aborde tareas más complejas que sus antecesores. La IA prueba múltiples estrategias y identifica y corrige sus propios errores, como explica OpenAI en una entrada de blog.
Esta mejora es especialmente notable en matemáticas y programación. De hecho, el modelo o1 resolvió el 83% de las tareas en la Olimpiada Internacional de Matemáticas, mientras que las versiones anteriores de ChatGPT solo lograron el 13%. Sin embargo, o1 sigue quedándose corto en varias áreas en las que ChatGPT destaca: no puede realizar búsquedas web, cargar archivos o imágenes y es más lento. Desde la perspectiva de OpenAI, o1 podría ser útil para investigadores en análisis de datos o físicos que lidian con ecuaciones matemáticas complejas.
0.38% de información intencionalmente engañosa
Sin embargo, los datos publicados por OpenAI revelan que o1 proporcionó información intencionalmente engañosa en el 0.38% de 100,000 solicitudes de prueba. Esto ocurrió principalmente cuando se le pidió a o1 que proporcionara artículos, sitios web o libros, una situación en la que no podía realizar una búsqueda web. En tales casos, el software inventó ejemplos plausibles. Esta tendencia a complacer a los usuarios a cualquier costo lleva a situaciones de "ilusiones" o casos en los que el software de IA fabrica información. Este problema sigue siendo un desafío sin resolver.
ChatGPT, el chatbot de IA responsable de desatar la euforia entorno a la IA hace más de un año, es un producto de una extensa capacitación con datos. Tales programas tienen la capacidad de componer textos a nivel humano, codificar software y resumir información. Lo logran al predecir, palabra por palabra, cómo debe concluir una oración.
La Comisión de OpenAI está monitoreando de cerca el problema de la información intencionalmente engañosa proporcionada por el modelo o1, como se revela en sus datos.
Para abordar esta preocupación, la Comisión está explorando estrategias para mejorar la capacidad del modelo para realizar búsquedas web o verificar información, reduciendo así la probabilidad de tales casos.