Google ha lanzado su más reciente apuesta en el campo de la inteligencia artificial generativa con el modelo Gemini, marcando una ambiciosa incursión en la competencia con los modelos GPT de OpenAI.
Gemini, proclamado como el “modelo de IA más grande y capaz” de Google, se presenta como un avance significativo que transformará diversas aplicaciones, desde el motor de búsqueda hasta los teléfonos inteligentes Android.
En contraste con los modelos de IA convencionales que manejan un solo tipo de solicitud del usuario, Gemini es “multimodal”, aceptando entradas que incorporan texto, imágenes, audio, video y código de programación. Esta versatilidad permite una experiencia de usuario más rica y personalizada.
Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como compañía”, dijo el CEO de Google, Sundar Pichai.
Bard, el chatbot de IA propiedad de Google, ya ha integrado una versión de Gemini, y se espera que este modelo revolucione productos populares como el motor de búsqueda de Google y el navegador web Chrome. La compañía planea implementar Gemini en una amplia gama de entornos, desde grandes empresas hasta dispositivos de consumo, como el próximo Google Pixel 8 Pro.
El lanzamiento de Gemini refleja la respuesta estratégica de Google al surgimiento del modelo ChatGPT de OpenAI el año pasado, que capturó la atención y el interés masivo del público. Este nuevo esfuerzo busca recuperar la delantera y establecer a Google como líder en la innovación de inteligencia artificial generativa.
El modelo Gemini está disponible en tres tamaños diferentes: Nano, optimizado para dispositivos móviles y desarrolladores de aplicaciones; Pro, el modelo por defecto para una amplia variedad de tareas y clientes; y Ultra, la versión más avanzada que actualmente está siendo sometida a pruebas de seguridad.
Además de resaltar las capacidades de Gemini, Google destacó los avances en computación en la nube que respaldan este modelo. La empresa utilizó una nueva generación de potentes procesadores basados en la nube para entrenar a Gemini, logrando una velocidad casi tres veces superior a las versiones anteriores.
Esta tecnología también estará disponible para los clientes de la nube de Google, promoviendo un acceso más rápido y eficiente al entrenamiento de la inteligencia artificial.
A pesar de los impresionantes avances, Google reconoce los desafíos de la inteligencia artificial, especialmente en cuanto a la posibilidad de que los modelos ofrezcan resultados engañosos. Eli Collins, vicepresidente de producto de Google DeepMind, mencionó que, aunque se han implementado medidas para mejorar la objetividad en Gemini, los grandes modelos de lenguaje aún pueden generar resultados inesperados.
Cuando integramos estos modelos en productos como Bard, disponemos de técnicas adicionales para mejorar la precisión de las respuestas”, añadió.
Para abordar estas preocupaciones, Google anunció que la versión más avanzada de Gemini, Ultra, se lanzará gradualmente a “clientes selectos, desarrolladores, socios y expertos en seguridad y responsabilidad” antes de desplegarla ampliamente a principios del próximo año.
Te recomendamos: Proteger derechos del empleado ante la IA.
La evaluación de seguridad por parte de terceros garantiza un enfoque responsable en la implementación de Gemini en diversos entornos.
Google busca liderar la “era Gemini” con su nuevo modelo de inteligencia artificial multimodal, marcando un hito importante en la evolución de la IA generativa y ofreciendo soluciones más sofisticadas y personalizadas a los usuarios en todo el mundo.