ในยุคดิจิทัลที่ข้อมูลเติบโตอย่างรวดเร็ว การจัดการและการวิเคราะห์ข้อมูลเป็นสิ่งสำคัญสำหรับองค์กรในการขับเคลื่อนธุรกิจไปข้างหน้า หรือ Data-Driven Organization ที่ช่วยขับเคลื่อนให้ธุรกิจสามารถเติบโตและสามารถนำ Big Data มาสร้างประโยชน์ได้อย่างมากมาย แต่ในความเป็นจริงแล้ว การขับเคลื่อนองค์กรด้วยข้อมูลที่ต้องอาศัยกระบวนการวิเคราะห์ข้อมูล (Data Analytics) ก็ยังคงมีความยากในการดึงข้อมูลมาใช้ประโยชน์ จึงมีแนวคิดอย่าง “Data Mesh” ที่เข้ามาช่วยปรับปรุงการจัดการข้อมูลให้มีประสิทธิภาพมากขึ้น
Data Mesh คืออะไร
Data Mesh คือ แนวคิดในการสร้าง Data Architecture ให้มีคุณภาพประเภทหนึ่ง เพื่อแก้ปัญหาด้านการจัดการข้อมูล ผ่านการวิเคราะห์ข้อมูลให้อยู่ในรูปแบบของการกระจายศูนย์ (Decentralized)
โดยแนวคิดนี้เกิดขึ้นจากการเก็บข้อมูลแบบรวมศูนย์ (Centralize) ที่มักจะเกิดปัญหาในการจัดเก็บที่ไม่เป็นระบบระเบียบ ขาดการดูแลควบคุมข้อมูล ทำให้กระบวนการเข้าถึงข้อมูลเพื่อนำมาใช้งานมีความยากและซับซ้อน ทำให้ประสิทธิภาพในการทำงานขององค์กรลดลง
Data Mesh มีองค์ประกอบอะไรบ้าง
Data Product/Service
สิทธิ์ในการดูแลข้อมูลเป็นของผู้ที่เป็นเจ้าของข้อมูลเท่านั้น หากมีผู้ต้องการนำข้อมูลไปใช้ประโยชน์ จะสามารถเข้าถึงได้ด้วย API (Application Programming Interface – การเรียกใช้โปรแกรมแบบพูดคุยกันได้)
ซึ่งในทางปฏิบัติ ข้อมูลอาจถูกเก็บไว้ใน cloud หรือ storage โดยให้แผนกหรือผู้ที่ต้องการนำข้อมูลไปใช้ สามารถเข้าถึงได้ด้วย URL แต่ไม่สามารถแก้ไขข้อมูลหรือเป็นเจ้าของได้
Discoverable data catalog
ต้องมีโครงสร้างพื้นฐานที่ช่วยทำให้การค้นหาข้อมูลภายในองค์กรมีประสิทธิภาพยิ่งขึ้น
Self-serve platform
แพลตฟอร์มควรจะเอื้อประโยชน์ให้เจ้าของข้อมูลสามารถแชร์ข้อมูล และทำงานได้ง่าย สำหรับประเทศไทยอาจจะเพิ่มให้มีการบริหารจัดการหรือพัฒนา Data Product จากส่วนกลาง หากบางแผนกยังไม่สามารถทำได้ในเบื้องต้น
Service Level; Objective (SLO) & Standardization
มีการกำหนดมาตรฐานข้อมูลและการให้บริการของข้อมูลที่ถูกต้องเชื่อถือได้ มีการทำความสะอาดข้อมูล (Data Cleansing) และมีรายละเอียดอธิบายที่มาที่ไปของข้อมูล (Metadata) เพื่อให้ลูกค้าเข้าใจ และใช้งานได้อย่างเหมาะสม
Global access control
ควรมีการกำหนดมาตรการการเข้าถึงข้อมูลและการดูแลความปลอดภัยของข้อมูล เพื่อสร้างความเชื่อมั่นให้กับผู้เป็นเจ้าของข้อมูล ในการแชร์ข้อมูลที่เป็นประโยชน์สำหรับการนำไปแก้ปัญหาหรือปรับปรุงองค์กรในด้านต่าง ๆ
กระบวนการทำงานของ Data Mesh
1. Data Ownership
Data Ownership เป็นขั้นตอนแรกในการทำ Data Mesh เมื่อมีข้อมูลเกิดขึ้นหรือนำข้อมูลมาจากหน่วยใดขององค์กร เจ้าของข้อมูลจะเป็นผู้รับผิดชอบในส่วนของการดูแลข้อมูล ซึ่งต้องอาศัยทักษะของวิศวกรข้อมูลในการวางโครงสร้างรองรับข้อมูล เพื่อให้บุคคลทั่วไปสามารถใช้งานระบบได้
2. Data as a Product
Data as a Product เป็นการนำมุมมองที่เปรียบข้อมูลเป็นเสมือนสินค้าชนิดหนึ่งมาปรับใช้ โดยเราสามารถเลือกซื้อสินค้าที่ต้องการผ่านการค้นหา จากนั้นจึงนำสินค้า (ข้อมูล) ที่ได้มาใช้งานเพื่อสร้างประโยชน์ให้กับองค์กร
3. Self-serve data information
Self-serve data information เป็นขั้นตอน Data Mesh ที่ออกแบบโครงสร้างให้เหมาะกับการใช้งานข้อมูล โดยเน้นด้านการใช้งาน เพื่อให้บุคคลที่ไม่มีความรู้ด้านข้อมูลหรือผู้ที่ไม่ใช่เจ้าของข้อมูล สามารถเข้าถึง ค้นหา และดึงข้อมูลเหล่านั้นไปใช้งานได้ด้วยตนเอง ตลอดจนนำไปวิเคราะห์ร่วมกับการทำธุรกิจตามแนวคิด Business Intelligence
4. Federated computational governance
Federated computational governance เป็นส่วนสุดท้ายของกระบวนการ Data Mesh ที่ควบคุมระบบการเข้าถึงข้อมูลให้เป็นไปตามหลัก Data Governance หรือ ธรรมาภิบาลข้อมูล โดยเจ้าของข้อมูลจะเป็นผู้มีอำนาจที่สามารถกำหนดได้ว่าบุคคลหรือแผนกใดสามารถเข้าถึงข้อมูลเหล่านี้ได้บ้าง เพื่อรักษาความปลอดภัยของข้อมูลนั่นเอง
ความแตกต่างระหว่าง Data Mesh Vs Data Lake
Data Lake เป็นแนวคิดในการจัดเก็บข้อมูลขนาดใหญ่ไว้ในที่เดียวกัน โดยมักจะเป็นการจัดเก็บข้อมูลดิบ (Raw Data) ซึ่งยังไม่ได้ผ่านการประมวลผลหรือจัดรูปแบบ ข้อมูลเหล่านี้จะถูกจัดเก็บไว้ในรูปแบบที่ยืดหยุ่น เพื่อให้สามารถนำไปใช้ในการวิเคราะห์และประมวลผลได้ในภายหลัง โดยมีข้อแตกต่างจาก Data Mesh ดังนี้
- การจัดการข้อมูล: Data Mesh เน้นการกระจายอำนาจและความรับผิดชอบให้กับแผนกต่าง ๆ ในขณะที่ Data Lake จะมีการเก็บรวบรวมข้อมูลไว้ที่ศูนย์กลาง
- การเข้าถึงข้อมูล: ใน Data Mesh แต่ละแผนกสามารถเข้าถึงข้อมูลที่ต้องการได้อย่างรวดเร็ว ในขณะที่ Data Lake อาจจะมีกระบวนการเข้าถึงข้อมูลที่ซับซ้อนกว่า
- ความยืดหยุ่น: Data Lake มีความยืดหยุ่นในการจัดเก็บข้อมูลมากกว่า แต่ Data Mesh มีความยืดหยุ่นในการนำข้อมูลไปใช้ประโยชน์มากกว่า
ความแตกต่างระหว่าง Data Mesh Vs Data Fabric
Data Fabric เป็นแนวคิดการจัดการข้อมูลที่เน้นการเชื่อมโยงและบูรณาการข้อมูลจากหลากหลายแหล่งเข้าด้วยกัน เพื่อให้ผู้ใช้งานสามารถเข้าถึงและใช้ประโยชน์จากข้อมูลได้อย่างรวดเร็ว โดยไม่จำเป็นต้องรู้ว่าข้อมูลนั้นมาจากที่ไหน Data Fabric จะช่วยให้องค์กรสามารถสร้างมูลค่าจากข้อมูลได้อย่างมีประสิทธิภาพ โดยมีความแตกต่างจาก Data Mesh ดังนี้
- การจัดการข้อมูล: Data Mesh เน้นการกระจายอำนาจและความรับผิดชอบในการจัดการข้อมูลไปยังแผนกต่าง ๆ ในขณะที่ Data Fabric เน้นการบูรณาการข้อมูลจากหลายแหล่งเข้าด้วยกัน
- การเข้าถึงข้อมูล: Data Mesh ให้ความสำคัญกับการเข้าถึงข้อมูลของผู้ใช้งานแต่ละแผนก ในขณะที่ Data Fabric เน้นการเข้าถึงข้อมูลจากหลากหลายแหล่งอย่างรวดเร็ว
- การใช้งาน: Data Mesh เหมาะสำหรับองค์กรขนาดใหญ่ที่มีข้อมูลมหาศาล ในขณะที่ Data Fabric เหมาะสำหรับองค์กรที่ต้องการเชื่อมโยงและบูรณาการข้อมูลจากหลายแหล่งเข้าด้วยกัน
การปรับใช้ Data Mesh ในองค์กร
องค์กรสามารถนำแนวคิด Data Mesh มาปรับใช้เพื่อปรับปรุงการจัดการและการวิเคราะห์ข้อมูลภายในองค์กร โดยมีการแบ่งปันข้อมูลและการเข้าถึงข้อมูลระหว่างแผนกต่างๆ ซึ่งช่วยให้แต่ละแผนกสามารถนำข้อมูลไปวิเคราะห์และตัดสินใจได้อย่างอิสระ ส่งผลให้องค์กรสามารถตอบสนองความต้องการของลูกค้าได้อย่างรวดเร็วและแม่นยำมากขึ้น
สรุป Data Mesh
แนวคิด Data Mesh เปรียบเสมือนตัวช่วยที่จะทำให้การวางโครงสร้างข้อมูลมีประสิทธิภาพมากขึ้น ลดความผิดพลาดที่อาจะเกิดระหว่างการดำเนินงาน ช่วยให้บุคลากรสามารถทำงานได้อย่างสะดวกแม้ไม่มีความรู้ในด้านโครงสร้าง รวมถึงช่วยรักษาความปลอดภัยของข้อมูลจากการจำกัดสิทธิ์เข้าถึงได้อย่างมีคุณภาพ
โดยคุณสามารถนำแนวคิด Data Mesh มาใช้กับองค์กรของคุณได้แล้ววันนี้ เพียงแค่ใช้ระบบ DMS (Document Management System) ที่เปลี่ยนเอกสารกระดาษที่ยุ่งยาก สู่เอกสารดิจิทัลที่สามารถใช้งานได้สะดวกยิ่งกว่า ช่วยสร้าง workflow บนระบบอิเล็กทรอนิกส์ได้อย่างมีประสิทธิภาพ สามารถเข้าถึงข้อมูลได้ทุกที่ทุกเวลา นอกจากนี้ เจ้าของข้อมูลยังสามารถกำหนดสิทธิ์การเข้าถึงเอกสารเพื่อรักษาความปลอดภัย และก้าวสู่การเป็นองค์กรที่ขับเคลื่อนด้วยข้อมูล หรือ Data-Driven ได้อย่างสมบูรณ์
ติดต่อสอบถามข้อมูลระบบจัดการเอกสาร เพิ่มเติม
📞 02-517-555
📱063 204 0321
Line ID: @dittothailand