สิ่งหนึ่งที่สำคัญสำหรับ Big Data คือ ชุดของเครื่องมือต่าง ๆ
ช่วยทำให้การทำงานกับ Big Data ง่ายขึ้น
โดยในปี 2016 เราน่าจะศึกษาสิ่งต่าง ๆ ดังต่อไปนี้บ้างนะ
- Visualization
- Apache Spark
- HBase
- Cask Data Application (CDA)
มาดูรายละเอียดกันหน่อย
Visualization
Library ที่ต้องศึกษาเลยก็คือ D3.js นั่นเอง
แต่ว่ามันใช้งานยากมาก ถึง มากที่สุด
ซึ่งทำให้มีคนสร้าง libary หุ้มมันมาให้ใช้ง่าย ๆ มากมาย
มีตัวที่น่าสนใจสำหรับ Big Data คือ NVD3
ซึ่งทำให้ชีวิตง่ายขึ้นเยอะ
Apache Spark และ HBase
เป็น framework ที่ไม่ควรพลาดด้วยประการทั้งปวง
สำหรับการประมวลผลข้อมูล และจัดเก็บข้อมูลขนาดใหญ่
แน่นอนว่าในปี 2016 นั้น มันจะมีบทบาทที่สำคัญอย่างมาก
Cask Data Application (CDA)
เป็น abstraction layer ที่ทำงานอยู่บน Apache Hadoop
ทำให้การพัฒนาระบบงานมันง่าย และ รวดเร็วมากขึ้น
ทั้ง real time และ batch processing
แน่นอนว่าสามารถทำงานร่วมกับเครื่องมือเหล่านี้ได้ด้วย
- HBase
- Hive
- Tephra คือ Transaction management สำหรับ HBase
- Tigon คือ Real time streaming ด้วย Apache Twill
นักพัฒนา software ลองศึกษากันไว้นะครับ
ทั้งเรื่องความรู้พื้นฐานของ Big Data
ทั้งเรื่องเครื่องมือต่าง ๆ สำหรับจัดการ และ พัฒนาระบบ