big-data Archive

[แปล] Data Lake มันคืออะไรกันแน่

อ่านบทความเรื่อง Data Lake จาก bliki ของคุณ Martin Fowler จึงนำมาแปลกันเล็กน้อย เพื่อทำให้ตัวเองเข้าใจว่า Data Lake มันคืออะไรกันแน่ ? มันแตกต่างจาก Data Warehouse และ Data Mart อย่างไร ? มาดูกันดีกว่า

Read More…

มาดูการสร้างระบบ Analytic ของ Pinterest.com กันหน่อย

ทางทีมพัฒนาของ Pinterest ได้เขียนบทความอธิบายการสร้างระบบ Analytic ของตัวเอง เอาไว้ที่ Building Pinalytics: Pinterest’s data analytics engine มาดูว่าเขาสร้างระบบนี้อย่างไร และมีอะไรที่น่าสนใจบ้าง

Read More…

Big Data จะเริ่มต้นด้วย Hadoop ดีไหมนะ ?

บ่อยครั้งจะพบว่า developer และ architect หลายๆ คน บอกว่า ฉันทำ Big Data Project อยู่นะ ซึ่งฟังดูแล้วเรารู้สึกว่าเป็น project ที่แจ่ม สุดยอดมากๆ แต่เมื่อลงไปสัมผัสกับ project เหล่านั้นกลับพบว่า มันไม่ได้เป็นสิ่งที่แจ่มดังที่ฟังมา !! ดังนั้น คำถามแรก ที่ต้องถามก่อนคือ คุณเชื่อว่า project ที่ทำอยู่คือ Big Data จริงหรือไม่

Read More…

แนะนำ GraphLab สำหรับการสร้างระบบเพื่อวิเคราะห์ Big Data

มาทำความรู้จักกับ GraphLab ซึ่งเป็นหนึ่งใน Startup ซึ่งทาง  AWS  Startup ให้การสนับสนุน โดยระบบทั้งหมดทำงานอยู่บน Cloud infrastructure ของ AWS (Amazon Web Services) ลองมาดูว่า GraphLab มันน่าสนใจอย่างไร และเราจะเริ่มใช้งานอย่างไรดี

Read More…

เปิดโลกกับ Internet of Everything (IoE)

ได้พูดคุยเกี่ยวกับเรื่อง Internet of Everything (IoE) หรือเรียกว่า Internet of Thing (IoT) เห็นว่าเป็น trend สำหรับยุคนี้เลย มีการพูดถึงอย่างมาก ดังนั้น มาลองศึกษาดูหน่อยว่ามันคืออะไรบ้าง รวมไปถึงที่ไปที่มาของมันว่าเป็นอย่างไร และมาดูว่ามีผลิตภัณฑ์ที่น่าสนใจกัน

Read More…

ทำไมต้องมาดู Riak ด้วยล่ะ .. เพื่อรองรับ Big Data

หลังจากอธิบายเกี่ยวกับ Model database สำหรับจัดการ Big Data ไปแล้ว รวมทั้งการติดตั้ง Riak ด้วย Docker แต่สิ่งที่เรายังไม่รู้เลยก็คือ Riak มันคืออะไร ทำไมต้องศึกษา Riak ด้วยล่ะ เข้ามาจัดการ Big Data อย่างไร ดังนั้น มาเริ่มต้นดูกันเลยดีกว่า

Read More…

ทำการติดตั้ง Riak Cluster ด้วย Docker กันหน่อย

ก่อนที่จะทำความรู้จักกับ Riak ที่เขาบอกว่ามันคือ Distributed Key-value database นั้น เรามาทำการติดตั้งเพื่อใช้งานมันดีกว่า ซึ่งจะติดตั้งแบบง่ายๆ คงไม่ดีแน่ ดังนั้น เรามาทำการติดตั้งแบบ Cluster ผ่าน Docker กันดีกว่า เป้าหมาย คือ ต้องการสร้าง Riak Cluster ขึ้นมา ประกอบไปด้วย 5 node มาเริ่มกันเลยดีกว่า

Read More…

มาดูฐานข้อมูลรูปแบบต่างๆ สำหรับจัดการ Big Data กันบ้าง

พอดีได้พูดคุยเกี่ยวกับการจัดการข้อมูลที่เรียกได้ว่าเป็น Big Data ซึ่งปัญหาแรกๆ ที่คุยกันเลยก็คือ เราจะจัดเก็บข้อมูลแบบนี้ด้วยอะไรดี แต่ก่อนอื่นนั้น สิ่งที่เราควรทำความรู้จักก่อนคือ ไอ้ Big Data เนี่ยมันคืออะไร และมี Model การจัดการอย่างไรรวมทั้งมีเครื่องมืออะไรให้ใช้บ้าง จึงจะทำให้เรารู้และเข้าใจ เพื่อเลือกใช้งานสิ่งที่เหมาะสมกับงานของเราจริงๆ

Read More…