Artwork

محتوای ارائه شده توسط The Data Flowcast. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط The Data Flowcast یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

Modernizing Legacy Data Systems With Airflow at Procter & Gamble with Adonis Castillo Cordero

22:13
 
اشتراک گذاری
 

Manage episode 484114308 series 2948506
محتوای ارائه شده توسط The Data Flowcast. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط The Data Flowcast یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

Legacy architecture and AI workloads pose unique challenges at scale, especially in a global enterprise with complex data systems. In this episode, we explore strategies to proactively monitor and optimize pipelines while minimizing downstream failures.

Adonis Castillo Cordero, Senior Automation Manager at Procter & Gamble, joins us to share actionable best practices for dependency mapping, anomaly detection and architecture simplification using Apache Airflow.

Key Takeaways:

(03:13) Integrating legacy data systems into modern architecture.

(05:51) Designing workflows for real-time data processing.

(07:57) Mapping dependencies early to avoid pipeline failures.

(09:02) Building automated monitoring into orchestration frameworks.

(12:09) Detecting anomalies to prevent performance bottlenecks.

(15:24) Monitoring data quality to catch silent failures.

(17:02) Prioritizing responses based on impact severity.

(18:55) Simplifying dashboards to highlight critical metrics.

Resources Mentioned:

Adonis Castillo Cordero

https://www.linkedin.com/in/adoniscc/

Procter & Gamble | LinkedIn

https://www.linkedin.com/company/procter-and-gamble/

Procter & Gamble | Website

http://www.pg.com

Apache Airflow

https://airflow.apache.org/

OpenLineage

https://openlineage.io/

Azure Monitor

https://azure.microsoft.com/en-us/products/monitor/

AWS Lookout for Metrics

https://aws.amazon.com/lookout-for-metrics/

Monte Carlo

https://www.montecarlodata.com/

Great Expectations

https://greatexpectations.io/

https://www.astronomer.io/events/roadshow/london/

https://www.astronomer.io/events/roadshow/new-york/

https://www.astronomer.io/events/roadshow/sydney/

https://www.astronomer.io/events/roadshow/san-francisco/

https://www.astronomer.io/events/roadshow/chicago/

Thanks for listening to “The Data Flowcast: Mastering Apache Airflow® for Data Engineering and AI.” If you enjoyed this episode, please leave a 5-star review to help get the word out about the show. And be sure to subscribe so you never miss any of the insightful conversations.

#AI #Automation #Airflow #MachineLearning

  continue reading

75 قسمت

Artwork
iconاشتراک گذاری
 
Manage episode 484114308 series 2948506
محتوای ارائه شده توسط The Data Flowcast. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط The Data Flowcast یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

Legacy architecture and AI workloads pose unique challenges at scale, especially in a global enterprise with complex data systems. In this episode, we explore strategies to proactively monitor and optimize pipelines while minimizing downstream failures.

Adonis Castillo Cordero, Senior Automation Manager at Procter & Gamble, joins us to share actionable best practices for dependency mapping, anomaly detection and architecture simplification using Apache Airflow.

Key Takeaways:

(03:13) Integrating legacy data systems into modern architecture.

(05:51) Designing workflows for real-time data processing.

(07:57) Mapping dependencies early to avoid pipeline failures.

(09:02) Building automated monitoring into orchestration frameworks.

(12:09) Detecting anomalies to prevent performance bottlenecks.

(15:24) Monitoring data quality to catch silent failures.

(17:02) Prioritizing responses based on impact severity.

(18:55) Simplifying dashboards to highlight critical metrics.

Resources Mentioned:

Adonis Castillo Cordero

https://www.linkedin.com/in/adoniscc/

Procter & Gamble | LinkedIn

https://www.linkedin.com/company/procter-and-gamble/

Procter & Gamble | Website

http://www.pg.com

Apache Airflow

https://airflow.apache.org/

OpenLineage

https://openlineage.io/

Azure Monitor

https://azure.microsoft.com/en-us/products/monitor/

AWS Lookout for Metrics

https://aws.amazon.com/lookout-for-metrics/

Monte Carlo

https://www.montecarlodata.com/

Great Expectations

https://greatexpectations.io/

https://www.astronomer.io/events/roadshow/london/

https://www.astronomer.io/events/roadshow/new-york/

https://www.astronomer.io/events/roadshow/sydney/

https://www.astronomer.io/events/roadshow/san-francisco/

https://www.astronomer.io/events/roadshow/chicago/

Thanks for listening to “The Data Flowcast: Mastering Apache Airflow® for Data Engineering and AI.” If you enjoyed this episode, please leave a 5-star review to help get the word out about the show. And be sure to subscribe so you never miss any of the insightful conversations.

#AI #Automation #Airflow #MachineLearning

  continue reading

75 قسمت

Wszystkie odcinki

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع

در حین کاوش به این نمایش گوش دهید
پخش