Durante nossas discuss?es para esta edi??o do Radar, surgiram v¨¢rias ferramentas e aplica??es para gera??o de dados sint¨¦ticos. ? medida que as ferramentas amadurecem, descobrimos que usar dados sint¨¦ticos para testes de modelos ¨¦ uma t¨¦cnica poderosa e amplamente ¨²til. Embora n?o pretenda substituir os dados reais na valida??o do poder de discrimina??o dos modelos de aprendizado de m¨¢quina, os dados sint¨¦ticos podem ser usados ??em diversas situa??es. Por exemplo, podem ser usados para prote??o contra falhas catastr¨®ficas do modelo em resposta a eventos que ocorrem raramente ou para testar pipelines de dados sem expor informa??es de identifica??o pessoal. Dados sint¨¦ticos tamb¨¦m s?o ¨²teis para explorar casos extremos que n?o possuem dados reais ou para identificar vieses de modelo. Algumas ferramentas ¨²teis para gerar dados incluem ou , que geram dados de acordo com as propriedades estat¨ªsticas desejadas, e ferramentas como Synthetic Data Vault, que podem gerar dados que imitam as propriedades de um conjunto de dados de entrada.

