A Google está com uma novidade na Inteligência Artificial (IA). Trata-se do lançamento do Gemini, um modelo de IA que já é apontado como adversário do GPT-4.
Com o lançamento, o CEO da Google, Sundar Pichai, declarou este o início de uma nova era de Inteligência Artificial na Google. O modelo está preparado para revolucionar praticamente todos os produtos da Google, tal como descrito por Pichai.
Com mais de uma década a apostar na Inteligência Artificial, o lançamento do Gemini por parte da Google é visto como um grande passo, tendo em conta o início da era da Inteligência Artificial trazida pelo ChatGPT, solução da empresa OpenAI.
“A era Gemini chegou. É com grande entusiasmo que lançamos o Gemini 1.0, o nosso modelo de IA mais capaz e geral. Construído para ser nativamente multimodal, ele pode entender muitos tipos de informações”,
escreveu Demis Hassabis, CEO e co-fundador da Google DeepMind.
O Google DeepMind reúne dois dos principais laboratórios de IA do mundo, o Google Brain e o DeepMind, em uma equipe única.
A ferramenta entende comandos em código, imagem, áudio, vídeo e texto de forma simultânea. Para programadores, consegue compreender Python, Java, C + + e GO.
O Gemini inclui vários modelos de Inteligência Artificial como é o caso do Gemini Pro, Gemini Nano e o Gemini Ultra. Gemini Pro é uma versão mais potente que, em breve, irá impulsionar serviços da Google e que está na base do Bard.
O Gemini Nano é uma versão simples do Gemini que pode ser executada offline em dispositivos Android. Já o Gemini Ultra é o LLM mais potente que a Google já desenvolveu e destina-se principalmente a ser utilizado em centros de dados e aplicações empresariais.
Para além do Bard (ChatGPT do Google) agora ser suportado pelo Gemini Pro, os clientes do Pixel 8 Pro (smartphone da Google) receberão novas funcionalidades com a ajuda do Gemini Nano. O lançamento do Gemini Ultra está previsto para o próximo ano. No dia 13 de dezembro, os programadores e clientes empresariais poderão aceder ao Gemini Pro através do Google Generative AI Studio ou do Vertex AI no Google Cloud.
O Bard passa a ter mais capacidade de compreender, resumir, programar e raciocinar comandos, fornecendo respostas mais adequadas e correctas aos seus utilizadores.
Até agora, o Gemini só está disponível em inglês, espera-se que outros idiomas estejam disponíveis em breve. Segundo Pichai, o plano é eventualmente incorporar o sistema no motor de busca do Google, produtos de publicidade, navegador Chrome e muito mais em todo o mundo.
Leia também:
A apresentação do Gemini acontece numa altura em que se celebra um ano da apresentação por parte da OpenAI do ChatGPT, produto que se tornou bastante popular no domínio da IA. A empresa está agora a ampliar o seu nível de competitividade após ter sido ultrapassado pela OpenAI, quando considerava-se uma organização “AI-first” (Inteligência Artificial em primeiro) durante quase uma década.
GPT-4 da OpenAI vs. Gemini da Google
Para a percepção de qual modelo é mais forte, a Google revela, citada pelo site The Verge, que avaliou cuidadosamente os dois sistemas e realizou testes de referência.
A Google efectuou 32 testes estabelecidos, incluindo o amplo teste de referência Multi-task Language Understanding e um que mede a capacidade de geração de código Python dos modelos. “Creio que estamos a liderar substancialmente em 30 dos 32 testes de referência”, disse Demis Hassabis, CEO da Google DeepMind, “Alguns deles são bastante específicos, enquanto outros são mais abrangentes.”
Gemini esteve em destaque nos testes pela sua capacidade de compreender e interagir com vídeo e áudio, isso deve-se em grande parte à sua conceção: a multimodalidade faz parte do plano do Gemini desde o início.
O Gemini, a mais recente adição aos extensos modelos de linguagem da Google, foi inicialmente sugerido por Pichai durante a conferência I/O em junho, e está agora disponível para todos.