Durante nuestros debates para esta edici¨®n del Radar, surgieron varias herramientas y aplicaciones para la generaci¨®n de datos sint¨¦ticos. A medida que las herramientas van madurando, hemos comprobado que el uso de datos sint¨¦ticos para modelos de prueba es una t¨¦cnica potente y ampliamente ¨²til. Aunque no pretenden sustituir a los datos reales a la hora de validar el poder de discriminaci¨®n de los modelos de aprendizaje autom¨¢tico, los datos sint¨¦ticos pueden utilizarse en diversas situaciones. Por ejemplo, pueden usarse para evitar fallos catastr¨®ficos de los modelos en respuesta a sucesos que ocurren de forma excepcional o para testear las pipelines de datos sin exponer informaci¨®n personal identificable. Los datos sint¨¦ticos tambi¨¦n son ¨²tiles para explorar casos l¨ªmite que carecen de datos reales o para identificar el sesgo del modelo. Algunas herramientas ¨²tiles para generar datos son o , que generan datos que se ajustan a las propiedades estad¨ªsticas deseadas y herramientas como Synthetic Data Vault que pueden generar datos que imitan las propiedades de un conjunto de datos de referencia.

