Uno de los avances m¨¢s significativos en IA desde el ¨²ltimo Radar es el descubrimiento y proliferaci¨®n de los modelos de razonamiento. Tambi¨¦n comercializados comomodelos de pensamiento, estos modelos han alcanzado un rendimiento a nivel humano en como matem¨¢ticas avanzadas y programaci¨®n. Los modelos de razonamiento suelen entrenarse mediante aprendizaje por refuerzo o fine-tuning supervisado, mejorando capacidades como el raciocinio paso a paso (), la exploraci¨®n de alternativas () o la . Algunos ejemplos incluyen / de OpenAI, DeepSeek R1 y . Sin embargo, estos modelos deben considerarse una categor¨ªa propia de LLMs en lugar de simples versiones m¨¢s avanzadas. Estas prestaciones mejoradas tienen un costo. Los modelos de razonamiento requieren un tiempo de respuesta y consumo de tokens mayor, lo que ha llevado a llamarlos de manera jocosaIA m¨¢s lenta, del ingl¨¦s ¡°Slower AI¡± (como si la IA actual no fuera ya lo suficientemente lenta). No todas las tareas justifican este sacrificio. Para tareas m¨¢s simples como la sumarizaci¨®n de texto, generaci¨®n de contenido o chatbots de respuesta r¨¢pida, los LLMs de prop¨®sito general siguen siendo la mejor opci¨®n. Recomendamos usar modelos de razonamiento en campos del STEM, y en resoluci¨®n de problemas complejos y toma de decisiones como, por ejemplo, usando LLMs como jueces o para mejorar la explicabilidad mediante salidas expl¨ªcitas de CoT. Al momento de escribir esto, Claude 3.7 Sonnet, un modelo h¨ªbrido de razonamiento, acaba de ser , adelantando una posible fusi¨®n entre los LLMs tradicionales y los modelos de razonamiento.

