se ha convertido en una pr¨¢cticas por default para nuestros equipos en el ¨¢mbito de la calidad de datos, es por esto que recomendamos su adopci¨®n, no s¨®lo por la falta de mejores alternativas, sino tambi¨¦n porque nuestros equipos han obtenido grandes resultados en varios proyectos de clientes. Great Expectations es un framework que permite elaborar controles integrados para identificar anomal¨ªas o problemas de calidad en los pipelines de datos. Al igual que las pruebas unitarias que se ejecutan en un pipeline de construcci¨®n, Great Expectations realiza validaciones durante la ejecuci¨®n de un proceso de datos. Nos gusta su simplicidad y facilidad de uso ¡ª las reglas almacenadas en JSON pueden ser modificadas por nuestros expertos en el dominio de datos sin necesidad de tener conocimientos en ingenier¨ªa de datos.
Hab¨ªamos escrito sobre en la edici¨®n anterior del Radar. Nos encanta y hemos decidido moverlo al anillo "Probar" en esta edici¨®n. Great Expectations es un marco de trabajo que permite crear controles que etiquetan anomal¨ªas o problemas de calidad en los pipelines de datos. Igual que la ejecuci¨®n de una prueba unitaria en un pipeline de compilaci¨®n, Great Expectations realiza verificaciones durante la ejecuci¨®n del pipeline de datos. Nos gusta su simplicidad y facilidad de uso: las reglas almacenadas en formato JSON pueden ser modificadas por nuestros expertos del dominio de datos sin necesidad de tener habilidades de ingenier¨ªa de datos.
Con el surgimiento de CD4ML, los aspectos operacionales de la ingenier¨ªa y la ciencia de datos han recibido m¨¢s atenci¨®n. La gobernanza de datos automatizada es un aspecto de este desarrollo. es un framework que permite crear controles integrados que se?alan anomal¨ªas o problemas de calidad en los pipelines de datos. Al igual que las pruebas unitarias corren en un pipeline de compilaci¨®n, Great Expectations realiza verificaciones durante la ejecuci¨®n de un pipeline de datos. Esto es ¨²til no solo para implementar una especie de para pipelines de datos sino tambi¨¦n para garantizar que los algoritmos basados en modelos permanezcan dentro del rango operativo determinado por sus datos de entrenamiento. Los controles automatizados como este pueden ayudar a distribuir, democratizar y custodiar el acceso a los datos. Great Expectations tambi¨¦n contiene una herramienta de generaci¨®n de perfiles para ayudar a comprender las cualidades de un conjunto de datos en particular y establecer l¨ªmites apropiados.

