ตอนเช้าเจอบทความว่าด้วยเรื่องของ Delta Lakeสะกดถูกแล้ว เพราะว่า ไม่ใช่ Data Lake นะอ่านเจอแล้วก็งง ๆ ว่า มันคืออะไรเลยลองหาข้อมูล เพื่อทำให้เข้าใจมากขึ้นสรุปสั้น ๆ ไว้ดังนี้
Read More…
ช่วงนี้มีข่าวเรื่องการจองฉีดวัคซีนกันเยอะเลยไปหาดูข้อมูลเกี่ยวกับฉีดวัคซีนของแต่ละประเทศว่าเป็นอย่างไรบ้างพบว่ามีหลายแหล่ง แต่ก็มีที่ Our World in Data ทำการสรุปข้อมูล รายงานรวมทั้ง share ข้อมูลของการฉีดวัคซีนทั้งโลกไว้
Read More…
ปกติ Elasticsaearch ข้อมูลต่าง ๆ ที่จัดเก็บในแต่ละ index จะสามารถค้นหาได้ก็ต่อเมื่อ ทำการบันทึกลงใน disk แล้วเท่านั้นหรือเรียกว่า Schema on writeโดย schema หรือโครงสร้างข้อมูลจะต้องถูกวางแผนก่อนเสมอว่าจะมีโครงสร้างอย่างไร ว่าแต่ละ field จะมีชนิดอะไร
Read More…
ช่วงปลายปีมีโอกาสไปสอนและแบ่งปันความรู้เรื่อง ELK stack สำหรับ Big Data Analytic เป็นเวลา 3 วัน ที่สำนักวิทยบริการ มหาวิทยาลัยราชภัฏยะลา โดยครั้งนี้มีเวลา 3 วัน จึงทำให้ได้เนื้อหาที่เข้มข้นและลงรายละเอียดเยอะ เลยทำการสรุปไว้นิดหน่อย ไว้ปีหน้าหาเวลามาแบ่งปันกันนิดหน่อย เนื่องจาก ELK stack มันเปลี่ยนบ่อยเหลือเกิน มาเริ่มกันเลย
Read More…
หัวข้อสุดท้ายที่เข้าฟังในงาน Code Mania 1010 :: All about passion คือ Real-time Bot Detection using Machine Learning จาก Agoda ส่วนที่น่าสนใจคือ ขั้นตอนของการสร้าง model เพื่อนำมามาตรวจสอบ ในแต่ละ request ที่เข้ามายังระบบว่า เป็น Bot ที่เราไม่ต้องการหรือไม่ ตลอดจนการนำไปใช้งาน ซึ่งจะมี feature จำนวนมาก แน่นอนว่า feature ต่าง ๆ ไม่สามารถเปิดเผยได้ มิเช่นนั้น จะโดนเล่นงานแน่นอน !! มาเริ่มกันเลย
Read More…
จากการอ่านบทความเรื่อง Migration Complete – Amazon’s Consumer Business Just Turned off its Final Oracle Database นั้น มีเรื่องที่น่าสนใจเยอะมาก ๆ ทั้งจำนวนทีมและ product ที่ต้องทำการย้าย จากบทความบอกว่ามีมากกว่า 100 ทีมที่ต้องทำการย้าย ทั้งปัญหาและประโยชน์ที่ได้รับจากการย้ายครั้งนี้
Read More…
หลังจากที่มีโอกาสแบ่งปันเรื่องของ Elastic Stack ไปพอสมควร จึงทำการสรุปสิ่งที่แบ่งปันไว้นิดหน่อย ซึ่งเป็นอีกมุมมองที่คนใช้งานหรือคนที่สนใจควรรู้ไว้บ้าง มาเริ่มกันเลย
Read More…
จากกลุ่ม Data Science Thailand ทำการ share บทความ เรื่อง The Top 10 Big Data Challenges ซึ่งเป็น infographic สรุปเรื่อง 10 อันดับในความท้ายของการนำ Big Data มาใช้ในองค์กร ทำการสร้างไว้ตั้งแต่ปี 2015 เห็นว่าน่าสนใจ เลยนำมาสรุปไว้นิดหน่อย
Read More…
วันนี้อ่านเจอเอกสารที่น่าสนใจว่าด้วยเรื่อง Big Data Technology with 8V ซึ่งทำการอธิบายคุณสมบัติของ Big Data เพื่อกำหนดว่าในแต่ละส่วนต้องทำอะไร นำพาไปสู่การเลือก process และ technology ที่เหมาะสม โดยแบ่งออกเป็น 8 กลุ่มดังนี้ Volume Value Veracity Visualization Variety Velocity Viscosity Virality
Read More…
โดยปกตินั้นข้อมูลมีการเปลี่ยนแปลงอยู่เสมอ ยิ่งในปัจจุบันอัตราการเปลี่ยนแปลงสูงมาก ๆ ทั้ง Volume, Velocity และ Variety ทำให้เครื่องมือต่าง ๆ ที่มีอยู่อาจจะไม่เพียงพอต่อความต้องการ ทั้งการจัดเก็บ ทั้งการรวบรวม ทั้งการวิเคราะห์ ประมวลผล ซึ่งมีความซับซ้อน และต้องการให้ทำงานแบบ realtime ดังนั้นเราต้องการวิธีการใหม่ เครื่องมือใหม่ ๆ architecture ใหม่
Read More…