Powered by Blogger.

Big Data และ Precision Time


              ในยุค 4.0 นี้เราจะได้ยินการกล่าวถึงคำว่า Big Data กันบ่อยๆ Big Data คืออะไร และมันจะใหญ่มหึมาขนาดไหน บทความนี้ ผู้เขียนจะอธิบายความหมายของ Big Data ให้เข้าใจกัน

Big Data ชื่อก็บอกตรงตัวอยู่แล้วว่าคือข้อมูลขนาดใหญ่ ในชีวิตประจำวันของเราปกติเราก็จะมีการใช้ข้อมูล การเข้าถึงข้อมูลต่างๆ อยู่ทุกๆวัน ข้อมูลขนาดใหญ่มหาศาลเป็นสิ่งที่เราไม่สามารถมองเห็นหรือจับต้องได้เป็นรูปธรรม ดังนั้นจะทำการเปรียบเทียบ Big Data ให้เห็นเป็นรูปธรรมมากขึ้น โดยเปรียบเทียบกับขนาดของธนบัตรดังต่อไปนี้

อันดับแรก เรามาเริ่มต้นกันด้วยธนบัตร 100 ดอลลาร์





$100

       
      

       

ต่อไปเมื่อเปรียบเทียบขนาดของธนบัตรจำนวน 1 ล้านดอลลาร์ (1 million;  1,000,000)  เมื่อเทียบกับขนาดร่างกายคน ก็ยังดูไม่ใหญ่มาก





$1 million

       



และเมื่อเปรียบเทียบขนาด ธนบัตร 1 พันล้านดอลลาร์ (1 billion;  1,000,000,000)  ซึงมีขนาดเป็นหนึ่งพันเท่าจากเดิม จะเห็นว่ามีขนาดที่ใหญ่กว่าตัวคนหลายเท่านัก




$1 billion

       







และเมื่อเพิ่มขนาดอีกหนึ่งพันเท่า ซึ่งก็คือขนาด 1 ล้านล้านดอลลาร์ (1 trillion;  1,000,000,000,000)
ร่ายกายของเราก็เล็กลงไปถนัดตา (ลูกศรชี้)






$1 trillion

       





เมื่อเพิ่มเลขศูนย์ไปอีกสามหลัก ก็จะมีขนาดเป็น 1 พัน ล้านล้านดอลลาร์ 
(1 quadrillion;  1,000,000,000,000,000) จะเห็นว่าธนบัตรมีขนาดใหญ่กว่าเครื่องบินจัมโบ้ เป็นหลายร้อยเท่า








$1 quadrillion

     




Big Data ก็คือข้อมูลขนาดมหาศาล ที่มีการใช้งาน การเก็บข้อมูล การประมวลผลข้อมูล ที่ใหญ่มหาศาลกว่าข้อมูลในอดีตที่เรารู้จัก ตัวอย่างของหน่วยงานที่จัดได้ว่ามีข้อมูลในระดับ Big Data เช่น
  • Google โดย Google มีการติดตั้งเครื่องเซิฟเวอร์ จำนวนมากที่เรียกว่า server farm ใน data center 12 แห่งทั่วโลกซึ่งมีจำนวนเครื่องเซิฟเวอร์รวมทั้งหมด เป็นจำนวนมากกว่า 900,000 เครื่องทั่วโลก
  • Amazon มีการติดตั้งเครื่องเซิฟเวอร์ ในระดับ server farm เช่นกัน ใน data center 9 แห่งทั่วโลก และมีจำนวนเครื่องเซิฟเวอร์รวมทั้งหมด เป็นจำนวนมากกว่า 450,000 เครื่องทั่วโลก
  • Cloud storage และ Cloud computing อื่นๆ เช่น iCloud และ Microsoft OneDrive ซึ่งมีการให้บริการกับผู้ใช้งาน หลายร้อยล้าน user ทั่วโลก โดยเริ่มที่ free account จะให้โควตาการเก็บข้อมูลขั้นต่ำที่ 5GB และสำหรับ subscription account ที่คิดค่าบริการจะได้โควตาสูงถึง 1TB

ถ้าลองคำนวณตัวเลขแบบคร่าวๆ เช่น สมมุติว่ามีจำนวนผู้ใช้งาน OneDrive แบบ subscription account จำนวน 10 ล้านคนทั่วโลก ซึ่งแต่ละคนได้โควตา storage คนละ 1TB ดังนั้นทางบริษัท Microsoft ก็จะต้องจัดเตรียมเซิฟเวอร์ ให้รองรับการเก็บข้อมูลได้ถึง 10 ล้านเทราไบต์  

เมื่อมาถึงตรงนี้เราก็ได้เห็นภาพของ Big Data แล้ว ต่อไปก็จะกล่าวถึงโครงสร้างพื้นฐาน (infrastructure) ที่จะสนับสนุนให้ Big Data ทำงานได้อย่างมีประสิทธิภาพ 

Big Data ที่มีการใช้งานอยู่ในปัจจุบัน มีการขยายขนาดในอัตราที่สูงมาก การติดตั้งระบบอุปกรณ์เน็ตเวิร์ค ก็มีการติดตั้งในลักษณะแบบคู่ขนานและกระจาย (parallel and distributed systems) เพิ่มขึ้นตามการขยายตัวของระบบ ซึ่งเมื่อมีการขยายเน็ตเวิร์ค ก็จะมีการติดตั้งฮาร์ดแวร์ เช่น router และ switch เพิ่มขึ้นตามจำนวนที่ต้องการการรองรับ

แต่เมื่อมาถึงจุดหนึ่งการเพิ่มจำนวนของฮาร์ดแวร์เพียงอย่างเดียวก็ไม่สามารถที่จะทำให้ระบบเน็ตเวิร์คมีประสิทธิภาพที่ดีตามที่คาดหวัง เพราะเน็ตเวิร์คมีโครงสร้างที่สลับซับซ้อนมากขึ้น และเมื่อยิ่งมีการขยายฮาร์ดแวร์มากขึ้น ก็จะมีปัจจัยอื่นเพิ่มตามมา เช่น ต้องการพื้นที่สำหรับการวางอุปกรณ์ ต้องการกำลังไฟฟ้าที่สูงขึ้น ต้องการระบบทำความเย็นที่มากขึ้น ซึ่งทำให้ผู้วางระบบต้องมาพิจารณาถึงแนวคิดใหม่ๆว่าจะทำอย่างไร ให้ระบบที่ใหญ่และซับซ้อนสามารถทำงานได้อย่างมีประสิทธิภาพ ถูกต้องและรวดเร็ว 
  • สิ่งหนึ่งที่จะช่วยให้การทำงานของระบบเน็ตเวิร์คโดยรวมทำงานได้ดี ก็คือจะต้องมีการตรวจสอบประสิทธิภาพของระบบ (performance monitoring) ซึ่งผู้ดูแลระบบจะต้องทำการวัดหรือตรวจสอบปริมาณ traffic เพื่อทราบจำนวนข้อมูลการใช้งานของอุปกรณ์ในเน็ตเวิร์คต่างๆ ที่เชื่อมต่อกัน ซึ่งในการวัดและตรวจสอบ จะต้องอาศัยฐานเวลาที่มีความแม่นยำสูง ที่เรียกว่า precision time สำหรับการบันทึกและประมวลผลของอุปกรณ์ที่ทำงานสัมพันธ์กันจากหลากหลายที่ และถ้าฐานเวลามีความคลาดเคลื่อนไม่สอดคล้องกัน ข้อมูลจากอุปกรณ์เน็ตเวิร์คแต่ละตัวที่ใช้ในการวิเคราะห์ระบบก็จะมีความคลาดเคลื่อนไป ทำให้ไม่สามารถแก้ปัญหาได้ตรงจุด
  • นอกจากนี้ precision time ยังมีความสำคัญในการเป็นแหล่งอ้างอิงสำหรับการจัดเก็บข้อมูล เพราะจากแนวคิดในการออกแบบระบบแบบกระจาย (distributed system) ข้อมูลที่เก็บใน cloud จะทำการจัดเก็บหรือบันทึกไปยังเซิฟเวอร์หลายตัว หรือแม้กระทั่งเซิฟเวอร์ที่ตั้งอยู่ต่างสถานที่กัน และเมื่อมีการเรียกใช้ไฟล์หรือข้อมูลจาก cloud ข้อมูลเดียวกันก็จะถูกนำกลับออกมาจากหลายเซิฟเวอร์ และเพื่อป้องกันการชนกันที่เรียกว่า data conflict ดังนั้น precision time จึงถูกนำมาใช้เป็นแหล่งอ้างอิง เพื่อให้ทราบว่าข้อมูลที่เรียกกลับมาจากเซิฟเวอร์ตัวไหน เป็นข้อมูลที่ถูกบันทึกล่าสุด และเหมาะสมสำหรับนำกลับมาใช้งาน เพราะข้อมูลที่จัดเก็บในแต่ละเซิฟเวอร์ จะมีการบันทึกเวลา (timestamps) เอาไว้ การใช้ฐานเวลาอ้างอิงเพื่อตรวจสอบ จึงทำให้ระบบ cloud สามารถทำงานได้อย่างรวดเร็ว และลดการทำงานของระบบประมวลผลทำให้ประสิทธิภาพของระบบสูงขึ้น ข้อมูลต่างๆ ใน Big Data ถึงแม้จะเป็นข้อมูลที่มีขนาดเล็ก แต่เมื่อรวมข้อมูลเล็กๆ จากหลายๆแหล่ง ในเน็ตเวิร์คที่มีจำนวนมากมายมหาศาล ก็สามารถสะสมจนมีขนาดใหญ่โตมโหฬาร 

ท้ายที่สุด เมื่อระบบเน็ตเวิร์คมีการพัฒนาและขยายระบบ อุปกรณ์ time server หรือ NTP server จะมีบทบาทสำคัญมากขึ้น precision time จาก NTP server จะช่วยทำให้การทำงานของระบบเน็ตเวิร์คขององค์กร ทำงานได้อย่างมีประสิทธิภาพ ถูกต้อง และแม่นยำ


ข้อมูลหลักของบทความนี้ได้ทำการแปลมาจาก บทความต้นฉบับของ Spectracom ซึ่งสามารถเข้าไปดาวน์โหลดข้อมูลอ้างอิงตามลิงค์ดังต่อไปนี้


บริษัท NetSync (Thailand) Limited มีความยินดีที่จะให้คำปรึกษาเรื่องระบบ Master Clock, NTP Server, Time & Frequency system

ติดต่อ คุณยุทธนา  Tel: 089-136 6399

Read more

NTP Redundancy


ปัจจุบันเมื่อการใช้งานเทคโนโลยีก้าวเข้าเข้าสู่ยุคดิจิตอล การใช้งาน IT ได้เข้ามามีบทบาทในชีวิตประจำวันมากขึ้น IOT (Internet of Things) เริ่มมีการใช้งานที่แพร่หลายในอุปกรณ์ต่างๆ รอบตัวเรา การค้าขายใน e-commerce มีการขยายตัวสูงขึ้นเรื่อยๆ การทำธุรกรรมแบบ online ก็ได้รับการส่งเสริมทั้งจากภาคราชการและภาคเอกชน ระบบเน็ตเวิร์คได้อำนวยความสะดวกในชีวิตประจำวัน จากในอดีตที่เราต้องเดินทางไปซื้อสินค้า จองตั๋ว ไปธนาคาร เราสามารถทำธุรกรรมต่างๆ ได้โดยง่ายผ่านคอมพิวเตอร์หรือโทรศัพท์ และทั้งหมดนี้กระทำโดยผ่านระบบเน็ตเวิร์ค

NTP Sever ก็เป็นอุปกรณ์หลักตัวหนึ่งที่มีความจำเป็น สำหรับเพิ่มประสิทธิภาพการทำงานของระบบเน็ตเวิร์ค NTP Server เป็นแหล่งอ้างอิงของเวลาของระบบเน็ตเวิร์ค โดยในแต่ละ transaction ของการทำงานจะมีการบันทึกเวลา เพื่อใช้อ้างอิงในภายหลัง NTP Server จึงเป็นอุปกรณ์ที่ขาดไม่ได้ สำหรับองค์กรหรือหน่วยงาน ทั้งการใช้งานภายในหน่วยงานเอง หรือรองรับการให้บริการแก่ภายนอก

คุณสมบัติในการทำ NTP Redundancy ถือได้ว่าเป็นคุณสมบัติหนึ่งที่มีความสำคัญต่อภาพรวมของระบบเน็ตเวิร์ค  โดยปกติอุปกรณ์หลักต่างๆ ในเน็ตเวิร์ค ล้วนต้องการระบบสำรอง เพื่อป้องกันความผิดพลาด ในกรณีที่อุปกรณ์หลัก (primary) เกิดการขัดข้อง อุปกรณ์รอง (backup) ก็จะรับภาระทำหน้าแทน เพื่อไม่ให้การทำงานของระบบเกิดการสะดุด  อุปกรณ์สำคัญๆ เช่น router  core switch ก็มักจะมีการติดตั้งแบบ redundancy เพื่อรองรับเหตุการณ์ หรือแม้กระทั่งภายในตัวอุปกรณ์เน็ตเวิร์คเอง ก็ยังต้องการคุณสมบัติของ redundant power supply ซึ่งรองรับแหล่งจ่ายไฟจาก 2 แหล่ง เพื่อป้องกันไม่ให้การทำงานของตัวอุปกรณ์ล้มเหลว ในกรณีระบบไฟฟ้าขัดข้อง




NTP over Anycast



NTP over Anycast เป็นโปรโตคอลที่รองรับการทำงานของ NTP redundancy โดยในเน็ตเวิร์คของหน่วยงานใดๆ อาจจะมี NTP Server จำนวนมากกว่าหนึ่งตัว แต่ทางด้าน NTP client ที่ไปขอซิงค์เวลา จะเห็นเพียงค่า IP address ค่าเดียว ซึ่งจะไปรับเวลามาจากตัว NTP Server ที่อยู่ใกล้ที่สุดในวง

จากหลักการทำงานที่ client จะไปรับเวลาจาก NTP Server ที่อยู่ใกล้สุดในวง ทำให้ค่าหน่วงเวลาที่เกิดขึ้น (Latency) มีค่าน้อย และมีค่า availability ของการไปซิงค์เวลาที่ดี

การจัดการสำหรับตัว client ก็ง่ายและสะดวก เพราะการใช้ IP address เพียงค่าเดียว จะทำได้ง่ายกว่าการที่จะต้องตั้งค่า IP address สำหรับการไปขอซิงค์เวลาจากหลายๆ NTP Server  ซึ่งถ้าในกรณีที่หน่วยงานมีจำนวนเครื่องของ client เป็นจำนวนมาก เช่น 1,000 เครื่อง การตั้งค่าให้รับเวลาเพียง IP address เดียว จะประหยัดเวลากว่าการที่จะต้องตั้งค่าให้ client ทั้งหมด จำนวน 1,000 เครื่องไปรับเวลาจากหลายๆ NTP Server ใช้เวลาในการตั้งค่าสั้นลง และไม่ต้องกังวลว่า NTP Server จะตัวไหนจะให้บริการ ซึ่งระบบจะเป็นตัวจัดการให้เองโดยอัตโนมัติ

นอกจากนั้นในบางกรณี client ในเน็ตเวิร์คบางชนิด อาจจะมี client software ที่ไม่ซับซ้อนโดยสามารถใส่ค่าของ NTP Server ได้เพียงค่าเดียว อุปกรณ์ดังกล่าวก็จะไม่สามารถทำการซิงค์เวลาได้เลยในกรณีที่ NTP Server ตัวหลักเกิดเสีย (จะไปซิงค์เวลาจากตัวสำรองก็ไม่ได้ เพราะตัวสำรอง มีค่า IP address ทีต่างค่ากัน)





การทำงานของ NTP Server จะทำงานตามการจัดการของโปรโตคอล Open Shortest Path First (OSPF) ซึ่งเป็นโปรโตคอลพื้นฐานของตัวอุปกรณ์ router ทั่วไป โดยจะไปซิงค์เวลาจากตัวที่ใกล้ที่สุดในเวลาปกติ และเมื่อ NTP Server ในวงเกิดขัดข้อง โปรโตคอล OSPF ก็จะทำการ route การซิงค์เวลาจาก client ไปยัง NTP Server ตัวที่อยู่ใกล้กันตัวถัดไป (next nearest)



client สามารถซิงค์เวลาจาก NTP Server ได้ตามปกติจากตัวที่อยู่ใกล้กันตัวถัดไป โดยไม่จำเป็นต้องรับรู้ถึงความผิดปกติของ NTP Server ที่อยู่ในวง การทำงานจึงต่อเนื่องไม่เกิดการสะดุดใดๆ และเมื่อ NTP Server ในวงเดียวกัน กลับมาให้บริการได้อีกครั้ง client ก็จะกลับมาซิงค์เวลาจาก NTP Server ตัวเดิมตามการทำงานของ OSPF

หลักการการทำงานของ NTP over Anycast คือให้ NTP Server ทำงานร่วมกันกับ โปรโตคอล OSPF ซึ่ง Spectracom เป็นผู้ผลิต NTP Server รายแรกที่ประยุกต์ใช้คุณสมบัติดังกล่าว โดย NTP Server จากผู้ผลิตรายอื่นในท้องตลาด ก็ยังไม่รองรับการทำงานนี้ นับว่า Spectracom เป็นผู้นำในวงการของ NTP Server อย่างแท้จริง


บทความนี้ได้ทำการแปลมาจาก บทความต้นฉบับของ Spectracom ซึ่งสามารถเข้าไปดาวน์โหลดข้อมูลต้นฉบับตามลิงค์ดังต่อไปนี้




บริษัท NetSync (Thailand) Limited มีความยินดีที่จะให้คำปรึกษาเรื่องระบบ Master Clock, NTP Server, Time & Frequency system

ติดต่อ คุณยุทธนา  Tel: 089-136 6399 



Read more