O Google apresentou o Gemini, nesta quarta-feira (06), um avançado modelo de inteligência artificial (IA) que a empresa considera como o mais poderoso já desenvolvido por sua equipe. O Gemini atua como o “motor” do Bard, um concorrente do ChatGPT, e, por enquanto, está disponível apenas em inglês.
Semelhante ao ChatGPT, o Bard é um chatbot, um robô conversador que opera como uma página de bate-papo. Baseado em aprendizado de máquina, ele tem a capacidade de “imitar” respostas humanas a perguntas feitas pelos usuários, utilizando uma vasta quantidade de textos disponíveis na internet.
O Gemini também é projetado para ser integrado a outros aplicativos, entrando em competição com ferramentas como o GPT-4, o modelo de IA da OpenAI utilizado no ChatGPT.
De acordo com o Google, o Gemini superou a capacidade humana em um teste abrangente de conhecimento e resolução de problemas envolvendo 57 temas, incluindo matemática, física e história. A empresa afirma que o desempenho do Gemini foi superior ao do GPT-4 nesse teste específico.
Gemini entenderia simultaneamente diversos formatos de mensagens
A abordagem adotada para desenvolver o Gemini foi diferente, segundo o Google, em comparação com outros modelos de IA multimodais, permitindo que ele compreenda simultaneamente diversos formatos de mensagens, como texto, imagem, áudio e código.
O Gemini é destacado como útil em tarefas que demandam maior capacidade de raciocínio. Pode auxiliar programadores com códigos complexos e estudantes com suas lições de casa, por exemplo.
O modelo de IA também foi demonstrado analisando uma foto de um exercício de física, identificando um erro no cálculo e apresentando a solução correta. Ele também gerou problemas semelhantes para os usuários resolverem.
Como funciona o Gemini?
O Gemini é considerado o modelo de IA mais flexível desenvolvido pelo Google, sendo capaz de operar tanto em infraestruturas amplas, como data centers, quanto em dispositivos mais limitados, como celulares. Para atingir esse objetivo, o Gemini terá três versões:
– Gemini Ultra: Maior e mais poderoso, voltado para tarefas altamente complexas – será lançado apenas em 2024.
– Gemini Pro: Destinado a uma ampla gama de tarefas, disponível no Bard a partir desta quarta-feira e para desenvolvedores a partir de 13 de dezembro.
– Gemini Nano: Projetado para dispositivos móveis, funcionando mesmo sem internet, estará disponível no Pixel 8 Pro, o celular do Google.
Quando o Gemini estará disponível
A versão Pro do Gemini estará acessível inicialmente em inglês, com atualizações para outros idiomas em breve. No início de 2024, o Bard Advanced, com o Gemini Ultra, será lançado. Nos próximos meses, o Gemini se integrará a produtos como Busca e Chrome.
A partir de 13 de dezembro, desenvolvedores e empresas poderão utilizar o Gemini Pro por meio das plataformas de inteligência artificial Google AI Studio e Google Cloud Vertex AI. O Gemini Ultra passará por verificações de segurança antes de ser disponibilizado para todos os usuários em 2024.