O Gemini, do Google, teve uma evolução grande em relação à competição de matemática de 2024
Os seres humanos superaram modelos de inteligência artificial (IA) generativa feitos pelo Google e OpenAI em uma competição internacional de matemática de alto nível, que terminou no domingo (20). Apesar de ainda serem superiores nos cálculos, a vantagem dos humanos diminuiu: pela primeira vez, os programas alcançaram pontuações de nível ouro.
A medalha de ouro é recebida pelos 10% melhores competidores da olimpíada, e exemplifica a velocidade que as IAs generativas estão sendo aprimoradas. Ainda assim, nenhum dos modelos de IA obteve nota máxima. Cinco jovens — humanos — de menos de 20 anos foram contemplados.
Olimpíada Internacional de Matemática
A Olimpíada Internacional de Matemática( IMO , na sigla em inglês) é a competição mais prestigiada do mundo para jovens matemáticos e acontece anualmente desde 1959. Neste ano, ela foi realizada em Queensland, Austrália, no mês de julho.
Cada país participante é representado por seis estudantes de elite, pré-universitários, que competem para resolver seis problemas excepcionalmente difíceis em álgebra, combinatória, geometria e teoria dos números. As medalhas são entregues aos 50% melhores colocados, sendo cerca de 8% premiados com a cobiçada medalha de ouro.
Avanço das IAs
A evolução dos modelos de inteligência artificial generativa puderam ser medidas entre uma os resultados nas últimas olimpíadas de matemática
O Google afirmou nesta segunda-feira (21) que uma versão avançada do seu chatbot Gemini resolveu cinco dos seis problemas de matemática apresentados na IMO. As informações foram divulgadas pela CBS News.
“Podemos confirmar que o Google DeepMind atingiu o tão desejado marco, conquistando 35 dos 42 pontos possíveis — uma medalha de ouro” , disse a gigante da tecnologia americana.
De acordo com o presidente da IMO, Gregor Dolinar, “suas soluções foram surpreendentes em muitos aspectos”. Ele complementou dizendo que os avaliadores da competição as consideraram claras, precisas e, na maior parte, “fáceis de acompanhar”.
A OpenAI, fabricante do ChatGPT, disse que seu modelo de raciocínio experimental também obteve a pontuação nível ouro de 35 pontos no teste.
O resultado “superou um grande desafio de longa data em IA” na “competição de matemática mais prestigiada do mundo”, disse o pesquisador da OpenAI, Alexander Wei, em uma publicação nas redes sociais.
“Avaliamos nossos modelos nos problemas da IMO de 2025 sob as mesmas regras dos competidores humanos”, disse ele. “Para cada problema, três ex-medalhistas da IMO avaliaram independentemente a prova apresentada pelo modelo” .
Evolução em relação ao ano passado
Na IMO de 2024, o Google havia conquistado a medalha de prata, resolvendo quatro dos seis problemas. Os cálculos feitos pela máquina levaram de dois a três dias de computação, tempo muito maior do que neste ano, quando seu modelo Gemini resolveu os problemas dentro do limite de tempo de 4 horas e meia.
Os organizadores da competição não conseguiram verificar quanto poder computacional foi usado pelas IAs nem se houve ajuda humana. Já o CEO do Google DeepMind, Demis Hassabis, afirmou que a IA está evoluindo rapidamente e, com mais investimentos, poderá desenvolver até mesmo uma forma de imaginação nos próximos anos. Segundo ele, o modelo Gemini está progredindo em ritmo exponencial, impulsionado pelo aumento de recursos e talentos na área.