Enable javascript in your browser for better experience. Need to know to enable it?

÷ÈÓ°Ö±²¥

Publicado : Apr 02, 2025
Apr 2025
Avalie ?

Um dos avan?os mais significativos da IA desde o ¨²ltimo Radar foi o surgimento e prolifera??o dos modelos de racioc¨ªnio. Tamb¨¦m comercializados como modelos de pensamento, esses modelos alcan?aram desempenho de alto n¨ªvel humano em como matem¨¢tica avan?ada e programa??o.

Modelos de racioc¨ªnio s?o geralmente treinados por meio de aprendizado por refor?o ou ajuste fino supervisionado, aprimorando capacidades como pensamento passo a passo (), explora??o de alternativas () e . Exemplos incluem / da OpenAI, DeepSeek R1 e . No entanto, esses modelos devem ser vistos como uma categoria distinta de modelos de linguagem de grande porte (LLMs), em vez de simplesmente vers?es mais avan?adas.

Essa capacidade aumentada tem um custo. Modelos de racioc¨ªnio exigem maior tempo de resposta e maior consumo de tokens, levando-nos a cham¨¢-los jocosamente de IA mais lenta (como se a IA atual j¨¢ n?o fosse lenta o suficiente). Nem todas as tarefas justificam essa troca. Para tarefas mais simples, como sumariza??o de texto, gera??o de conte¨²do ou chatbots de resposta r¨¢pida, LLMs de uso geral continuam sendo a melhor escolha. Aconselhamos o uso de modelos de racioc¨ªnio em ¨¢reas STEM (ci¨ºncia, tecnologia, engenharia e matem¨¢tica), resolu??o de problemas complexos e tomada de decis?es ¡ª por exemplo, ao usar LLMs como ju¨ªzes ou melhorar a explicabilidade por meio de sa¨ªdas CoT expl¨ªcitas. No momento em que escrevemos este texto, o Claude 3.7 Sonnet, um modelo de racioc¨ªnio h¨ªbrido, havia acabado de ser , sugerindo uma poss¨ªvel fus?o entre LLMs tradicionais e modelos de racioc¨ªnio.

Inscreva-se para receber a newsletter do Technology Radar

?

?

Seja assinante

?

?

Visite nosso arquivo para acessar os volumes anteriores