ir al contenido

Gemini es la respuesta de Google a GPT-4

Más información sobre el nuevo gran modelo lingüístico de Google.

Gemini es la respuesta de Google a GPT-4.aussiedlerbote.de
Gemini es la respuesta de Google a GPT-4.aussiedlerbote.de

Gemini es la respuesta de Google a GPT-4

Google Gemini es el último (y mejor) modelo de lenguaje de IA de Google, y ofrece sólidas capacidades que rivalizan con el GPT-4 de OpenAI. Sin embargo, con todos los lanzamientos recientes de chatbots y sistemas de IA, entender exactamente qué es Gemini y cómo puedes utilizarlo puede resultar un poco difícil.

¿Qué es Google Gemini?

La respuesta sencilla es que Gemini es la respuesta de Google a GPT-4, el gran modelo de lenguaje (LLM) que utilizan ChatGPT Plus y Copilot de Microsoft. Es el modelo más actualizado y capaz que el gigante de las búsquedas ha creado hasta la fecha, y tiene previsto utilizarlo de múltiples maneras.

¿Quién puede utilizar Gemini?

Cualquiera puede utilizar Gemini, aunque no lo hará como ChatGPT. Como he indicado anteriormente, Gemini es el modelo lingüístico que ejecutará el chatbot de inteligencia artificial de Google, de forma similar a como GPT ejecuta las cosas entre bastidores en ChatGPT. Por lo tanto, no podrás ir al sitio web de Google y empezar a hablar con Gemini. En su lugar, tendrás que utilizar una de sus tres versiones diferentes para crear una aplicación que aproveche la potencia que ofrece Gemini. También puedes esperar a que alguien cree una, o utilizar Bard, el chatbot de Google, para ver qué ofrece Gemini una vez que se actualice.

Gemini tiene tres niveles

Google diseñó Gemini 1.0 para ofrecer tres tamaños o niveles diferentes. Estos tamaños están diseñados para ayudar al modelo a aprovechar al máximo sus capacidades para tareas complejas, tareas cotidianas y tareas en el dispositivo.

Gemini Ultra es la versión más grande y capaz de Google Gemini y se utilizará para realizar las tareas más complejas que Gemini pueda manejar. Esta será probablemente una de las principales versiones que se verán detrás de Bard Advanced y otros chatbots de IA que utilizan Gemini para tareas extensas y complejas, y ofrecerá el rendimiento de última generación más alto de los tres.

Gemini Pro es lo que Google considera el "mejor modelo para escalar" y la compañía afirma que será capaz de manejar una amplia gama de tareas al tiempo que ofrece un rendimiento de última generación. Es el plan intermedio, que probablemente será el más utilizado y que actualmente está disponible para probar en Bard.

Gemini Nano es la versión más pequeña y eficiente del modelo y Google afirma que se ha diseñado para funcionar en dispositivos tan pequeños como los smartphones. La compañía ya planea utilizar Gemini Nano en los teléfonos inteligentes Pixel 8 y Pixel 8 Pro, donde espera permitir que la IA amplíe la forma en que usamos nuestros dispositivos en el futuro.

¿Cómo se compara Gemini con GPT-4?

Como señalé anteriormente, Google quiere que Gemini sea su respuesta a GPT-4 de OpenAI. Según algunas de las estadísticas que Google compartió en su anuncio oficial, el nuevo modelo se enfrenta realmente bien a GPT-4V (GPT-4 con visión) y también a otros modelos. Google afirma que Gemini puede alcanzar el 59,4% en la prueba MMMU (problemas de razonamiento multidisciplinar de nivel universitario), mientras que GPT-4V alcanza el 56,8%.

Comparación de Gemini con GPT-4V y otros modelos.Crédito: Google

Las diferencias entre los dos no son asombrosas, ni mucho menos, pero es de esperar que el rendimiento de Gemini empuje a OpenAI a mejorar aún más GPT-4. Este tipo de competencia es excepcionalmente útil para los consumidores, ya que garantiza que ambos modelos seguirán mejorando en el futuro, ya que tratan de mantenerse al día y superar al otro.

Google afirma que Gemini ha sido entrenado para reconocer y comprender texto, audio, imágenes y mucho más, todo al mismo tiempo. Este razonamiento más sofisticado debería permitir al modelo manejar cualquier cosa que le eches, aunque el tiempo dirá exactamente lo bien que lo hace en aplicaciones del mundo real.

¿Es Gemini preciso?

Como cualquier modelo lingüístico de inteligencia artificial, Gemini es susceptible de alucinar y generar información errónea. Aunque la empresa no ha revelado datos concretos sobre la precisión comparativa de Gemini, siempre será importante volver a comprobar cualquier información que el modelo nos devuelva antes de publicarla en cualquier sitio. Dicho esto, no cabe duda de que estos sistemas de inteligencia artificial seguirán siendo más precisos con el tiempo, aunque el riesgo de alucinaciones siempre estará ahí.

¿Cuándo puedo desarrollar con Gemini?

Si estás interesado en desarrollar con Gemini, Google dice que liberará el acceso para desarrolladores para Gemini Pro y Gemini API a partir del 13 de diciembre. Gemini Ultra todavía está programado como "próximamente", ya que Google dice que está trabajando a través de extensas comprobaciones de confianza y seguridad en este momento. Por el momento, Google no ha facilitado información sobre los precios de Gemini. Google tampoco ha compartido con qué tipo de límites de carácter o contexto trabajará Gemini, aunque espero que esa información salga a la luz una vez que los usuarios tengan acceso abierto al modelo. Sabemos que el límite de caracteres de ChatGPT es de unos 4.000 caracteres (según la investigación de la comunidad), por lo que es probable que veamos un enfoque similar con Gemini.

Lea también:

Fuente: aussiedlerbote.de

Comentarios

Más reciente