En versiones anteriores del radar, presentamos plataformas de prueba y validaci¨®n de datos como Great Expectations que pueden ser usados para validar supuestos y probar la calidad de los datos entrantes utilizados para entrenamiento o clasificaci¨®n. A veces, sin embargo, lo que necesitas es una simple librer¨ªa de c¨®digo para implementar verificaciones de pruebas y controles de calidad directamente en los pipelines. es una librer¨ªa en Python para probar y validar datos a trav¨¦s de una amplia gama de tipos de frames como pandas, Dask o PySpark. pandera puede implementar aserciones simples sobre campos o pruebas de hip¨®tesis basadas en modelos estad¨ªsticos. La amplia gama de librer¨ªas de frames compatibles implica que las pruebas pueden ser escritas una vez y luego aplicada a una variedad de formatos de datos subyacentes. pandera puede usarse tambi¨¦n para generar datos sint¨¦ticos para probar modelos ML.

