ทำความรู้จักโครงสร้างฐานข้อมูล Data Mesh และตัวอย่างการปรับใช้ภายในองค์กร

  • May 23, 2024

News Description

Data Mesh

 

ในยุคดิจิทัลที่ข้อมูลเติบโตอย่างรวดเร็ว การจัดการและการวิเคราะห์ข้อมูลเป็นสิ่งสำคัญสำหรับองค์กรในการขับเคลื่อนธุรกิจไปข้างหน้า หรือ Data-Driven Organization ที่ช่วยขับเคลื่อนให้ธุรกิจสามารถเติบโตและสามารถนำ Big Data มาสร้างประโยชน์ได้อย่างมากมาย แต่ในความเป็นจริงแล้ว การขับเคลื่อนองค์กรด้วยข้อมูลที่ต้องอาศัยกระบวนการวิเคราะห์ข้อมูล (Data Analytics) ก็ยังคงมีความยากในการดึงข้อมูลมาใช้ประโยชน์ จึงมีแนวคิดอย่าง Data Mesh ที่เข้ามาช่วยปรับปรุงการจัดการข้อมูลให้มีประสิทธิภาพมากขึ้น

 

 

Data Mesh คืออะไร

Data Mesh คือ แนวคิดในการสร้าง Data Architecture ให้มีคุณภาพประเภทหนึ่ง เพื่อแก้ปัญหาด้านการจัดการข้อมูล ผ่านการวิเคราะห์ข้อมูลให้อยู่ในรูปแบบของการกระจายศูนย์ (Decentralized)

โดยแนวคิดนี้เกิดขึ้นจากการเก็บข้อมูลแบบรวมศูนย์ (Centralize) ที่มักจะเกิดปัญหาในการจัดเก็บที่ไม่เป็นระบบระเบียบ ขาดการดูแลควบคุมข้อมูล ทำให้กระบวนการเข้าถึงข้อมูลเพื่อนำมาใช้งานมีความยากและซับซ้อน ทำให้ประสิทธิภาพในการทำงานขององค์กรลดลง

 

 

Data Mesh มีองค์ประกอบอะไรบ้าง

 

Data Product/Service

สิทธิ์ในการดูแลข้อมูลเป็นของผู้ที่เป็นเจ้าของข้อมูลเท่านั้น หากมีผู้ต้องการนำข้อมูลไปใช้ประโยชน์ จะสามารถเข้าถึงได้ด้วย API (Application Programming Interface – การเรียกใช้โปรแกรมแบบพูดคุยกันได้)

ซึ่งในทางปฏิบัติ ข้อมูลอาจถูกเก็บไว้ใน cloud หรือ storage โดยให้แผนกหรือผู้ที่ต้องการนำข้อมูลไปใช้ สามารถเข้าถึงได้ด้วย URL แต่ไม่สามารถแก้ไขข้อมูลหรือเป็นเจ้าของได้

 

Discoverable data catalog

ต้องมีโครงสร้างพื้นฐานที่ช่วยทำให้การค้นหาข้อมูลภายในองค์กรมีประสิทธิภาพยิ่งขึ้น

 

Self-serve platform

แพลตฟอร์มควรจะเอื้อประโยชน์ให้เจ้าของข้อมูลสามารถแชร์ข้อมูล และทำงานได้ง่าย สำหรับประเทศไทยอาจจะเพิ่มให้มีการบริหารจัดการหรือพัฒนา Data Product จากส่วนกลาง หากบางแผนกยังไม่สามารถทำได้ในเบื้องต้น

 

Service Level; Objective (SLO) & Standardization

มีการกำหนดมาตรฐานข้อมูลและการให้บริการของข้อมูลที่ถูกต้องเชื่อถือได้ มีการทำความสะอาดข้อมูล (Data Cleansing) และมีรายละเอียดอธิบายที่มาที่ไปของข้อมูล (Metadata) เพื่อให้ลูกค้าเข้าใจ และใช้งานได้อย่างเหมาะสม

 

Global access control

ควรมีการกำหนดมาตรการการเข้าถึงข้อมูลและการดูแลความปลอดภัยของข้อมูล เพื่อสร้างความเชื่อมั่นให้กับผู้เป็นเจ้าของข้อมูล ในการแชร์ข้อมูลที่เป็นประโยชน์สำหรับการนำไปแก้ปัญหาหรือปรับปรุงองค์กรในด้านต่าง ๆ

 

 

กระบวนการทำงานของ Data Mesh

 

Data Mesh คือ

 

1. Data Ownership

Data Ownership เป็นขั้นตอนแรกในการทำ Data Mesh เมื่อมีข้อมูลเกิดขึ้นหรือนำข้อมูลมาจากหน่วยใดขององค์กร เจ้าของข้อมูลจะเป็นผู้รับผิดชอบในส่วนของการดูแลข้อมูล ซึ่งต้องอาศัยทักษะของวิศวกรข้อมูลในการวางโครงสร้างรองรับข้อมูล เพื่อให้บุคคลทั่วไปสามารถใช้งานระบบได้

 

2. Data as a Product

Data as a Product เป็นการนำมุมมองที่เปรียบข้อมูลเป็นเสมือนสินค้าชนิดหนึ่งมาปรับใช้ โดยเราสามารถเลือกซื้อสินค้าที่ต้องการผ่านการค้นหา จากนั้นจึงนำสินค้า (ข้อมูล) ที่ได้มาใช้งานเพื่อสร้างประโยชน์ให้กับองค์กร

 

3. Self-serve data information

Self-serve data information เป็นขั้นตอน Data Mesh ที่ออกแบบโครงสร้างให้เหมาะกับการใช้งานข้อมูล โดยเน้นด้านการใช้งาน เพื่อให้บุคคลที่ไม่มีความรู้ด้านข้อมูลหรือผู้ที่ไม่ใช่เจ้าของข้อมูล สามารถเข้าถึง ค้นหา และดึงข้อมูลเหล่านั้นไปใช้งานได้ด้วยตนเอง ตลอดจนนำไปวิเคราะห์ร่วมกับการทำธุรกิจตามแนวคิด Business Intelligence

 

4. Federated computational governance

Federated computational governance เป็นส่วนสุดท้ายของกระบวนการ Data Mesh ที่ควบคุมระบบการเข้าถึงข้อมูลให้เป็นไปตามหลัก Data Governance หรือ ธรรมาภิบาลข้อมูล โดยเจ้าของข้อมูลจะเป็นผู้มีอำนาจที่สามารถกำหนดได้ว่าบุคคลหรือแผนกใดสามารถเข้าถึงข้อมูลเหล่านี้ได้บ้าง เพื่อรักษาความปลอดภัยของข้อมูลนั่นเอง

 

 

ความแตกต่างระหว่าง Data Mesh Vs Data Lake

Data Lake เป็นแนวคิดในการจัดเก็บข้อมูลขนาดใหญ่ไว้ในที่เดียวกัน โดยมักจะเป็นการจัดเก็บข้อมูลดิบ (Raw Data) ซึ่งยังไม่ได้ผ่านการประมวลผลหรือจัดรูปแบบ ข้อมูลเหล่านี้จะถูกจัดเก็บไว้ในรูปแบบที่ยืดหยุ่น เพื่อให้สามารถนำไปใช้ในการวิเคราะห์และประมวลผลได้ในภายหลัง โดยมีข้อแตกต่างจาก Data Mesh ดังนี้

 

  • การจัดการข้อมูล: Data Mesh เน้นการกระจายอำนาจและความรับผิดชอบให้กับแผนกต่าง ๆ ในขณะที่ Data Lake จะมีการเก็บรวบรวมข้อมูลไว้ที่ศูนย์กลาง
  • การเข้าถึงข้อมูล: ใน Data Mesh แต่ละแผนกสามารถเข้าถึงข้อมูลที่ต้องการได้อย่างรวดเร็ว ในขณะที่ Data Lake อาจจะมีกระบวนการเข้าถึงข้อมูลที่ซับซ้อนกว่า
  • ความยืดหยุ่น: Data Lake มีความยืดหยุ่นในการจัดเก็บข้อมูลมากกว่า แต่ Data Mesh มีความยืดหยุ่นในการนำข้อมูลไปใช้ประโยชน์มากกว่า

 

 

ความแตกต่างระหว่าง Data Mesh Vs Data Fabric

Data Fabric เป็นแนวคิดการจัดการข้อมูลที่เน้นการเชื่อมโยงและบูรณาการข้อมูลจากหลากหลายแหล่งเข้าด้วยกัน เพื่อให้ผู้ใช้งานสามารถเข้าถึงและใช้ประโยชน์จากข้อมูลได้อย่างรวดเร็ว โดยไม่จำเป็นต้องรู้ว่าข้อมูลนั้นมาจากที่ไหน Data Fabric จะช่วยให้องค์กรสามารถสร้างมูลค่าจากข้อมูลได้อย่างมีประสิทธิภาพ โดยมีความแตกต่างจาก Data Mesh ดังนี้

 

  • การจัดการข้อมูล: Data Mesh เน้นการกระจายอำนาจและความรับผิดชอบในการจัดการข้อมูลไปยังแผนกต่าง ๆ ในขณะที่ Data Fabric เน้นการบูรณาการข้อมูลจากหลายแหล่งเข้าด้วยกัน
  • การเข้าถึงข้อมูล: Data Mesh ให้ความสำคัญกับการเข้าถึงข้อมูลของผู้ใช้งานแต่ละแผนก ในขณะที่ Data Fabric เน้นการเข้าถึงข้อมูลจากหลากหลายแหล่งอย่างรวดเร็ว
  • การใช้งาน: Data Mesh เหมาะสำหรับองค์กรขนาดใหญ่ที่มีข้อมูลมหาศาล ในขณะที่ Data Fabric เหมาะสำหรับองค์กรที่ต้องการเชื่อมโยงและบูรณาการข้อมูลจากหลายแหล่งเข้าด้วยกัน

 

 

การปรับใช้ Data Mesh ในองค์กร

 

Data Mesh Vs Data Lake

 

องค์กรสามารถนำแนวคิด Data Mesh มาปรับใช้เพื่อปรับปรุงการจัดการและการวิเคราะห์ข้อมูลภายในองค์กร โดยมีการแบ่งปันข้อมูลและการเข้าถึงข้อมูลระหว่างแผนกต่างๆ ซึ่งช่วยให้แต่ละแผนกสามารถนำข้อมูลไปวิเคราะห์และตัดสินใจได้อย่างอิสระ ส่งผลให้องค์กรสามารถตอบสนองความต้องการของลูกค้าได้อย่างรวดเร็วและแม่นยำมากขึ้น

 

 

สรุป Data Mesh

แนวคิด Data Mesh เปรียบเสมือนตัวช่วยที่จะทำให้การวางโครงสร้างข้อมูลมีประสิทธิภาพมากขึ้น ลดความผิดพลาดที่อาจะเกิดระหว่างการดำเนินงาน ช่วยให้บุคลากรสามารถทำงานได้อย่างสะดวกแม้ไม่มีความรู้ในด้านโครงสร้าง รวมถึงช่วยรักษาความปลอดภัยของข้อมูลจากการจำกัดสิทธิ์เข้าถึงได้อย่างมีคุณภาพ

 

โดยคุณสามารถนำแนวคิด Data Mesh มาใช้กับองค์กรของคุณได้แล้ววันนี้ เพียงแค่ใช้ระบบ DMS (Document Management System) ที่เปลี่ยนเอกสารกระดาษที่ยุ่งยาก สู่เอกสารดิจิทัลที่สามารถใช้งานได้สะดวกยิ่งกว่า ช่วยสร้าง workflow บนระบบอิเล็กทรอนิกส์ได้อย่างมีประสิทธิภาพ สามารถเข้าถึงข้อมูลได้ทุกที่ทุกเวลา นอกจากนี้ เจ้าของข้อมูลยังสามารถกำหนดสิทธิ์การเข้าถึงเอกสารเพื่อรักษาความปลอดภัย และก้าวสู่การเป็นองค์กรที่ขับเคลื่อนด้วยข้อมูล หรือ Data-Driven ได้อย่างสมบูรณ์

 

 

ติดต่อสอบถามข้อมูลระบบจัดการเอกสาร เพิ่มเติม

📞 02-517-555

📱063 204 0321

Line ID: @dittothailand