BigData Archive

ว่าด้วยเรื่องของ Delta Lake ?

ตอนเช้าเจอบทความว่าด้วยเรื่องของ Delta Lakeสะกดถูกแล้ว เพราะว่า ไม่ใช่ Data Lake นะอ่านเจอแล้วก็งง ๆ ว่า มันคืออะไรเลยลองหาข้อมูล เพื่อทำให้เข้าใจมากขึ้นสรุปสั้น ๆ ไว้ดังนี้

Read More…

[Open Data] ข้อมูลการฉีดวัคซีน COVID-19 จาก Our World in Data

ช่วงนี้มีข่าวเรื่องการจองฉีดวัคซีนกันเยอะเลยไปหาดูข้อมูลเกี่ยวกับฉีดวัคซีนของแต่ละประเทศว่าเป็นอย่างไรบ้างพบว่ามีหลายแหล่ง แต่ก็มีที่ Our World in Data ทำการสรุปข้อมูล รายงานรวมทั้ง share ข้อมูลของการฉีดวัคซีนทั้งโลกไว้

Read More…

Elasticsearch 7.11 :: ว่าด้วยเรื่อง Schema on read

ปกติ Elasticsaearch ข้อมูลต่าง ๆ ที่จัดเก็บในแต่ละ index จะสามารถค้นหาได้ก็ต่อเมื่อ ทำการบันทึกลงใน disk แล้วเท่านั้นหรือเรียกว่า Schema on writeโดย schema หรือโครงสร้างข้อมูลจะต้องถูกวางแผนก่อนเสมอว่าจะมีโครงสร้างอย่างไร ว่าแต่ละ field จะมีชนิดอะไร

Read More…

สรุปการสอนและแบ่งปันเรื่อง ELK stack ช่วงปลายปีที่มหาวิทยาลัยราชภัฏยะลา

ช่วงปลายปีมีโอกาสไปสอนและแบ่งปันความรู้เรื่อง ELK stack สำหรับ Big Data Analytic เป็นเวลา 3 วัน ที่สำนักวิทยบริการ มหาวิทยาลัยราชภัฏยะลา โดยครั้งนี้มีเวลา 3 วัน จึงทำให้ได้เนื้อหาที่เข้มข้นและลงรายละเอียดเยอะ เลยทำการสรุปไว้นิดหน่อย ไว้ปีหน้าหาเวลามาแบ่งปันกันนิดหน่อย เนื่องจาก ELK stack มันเปลี่ยนบ่อยเหลือเกิน มาเริ่มกันเลย

Read More…

สรุปเรื่องการตรวจจับ Bot ด้วย Machine Leaning จากงาน Code Mania 1010

หัวข้อสุดท้ายที่เข้าฟังในงาน Code Mania 1010 :: All about passion คือ Real-time Bot Detection using Machine Learning จาก Agoda ส่วนที่น่าสนใจคือ ขั้นตอนของการสร้าง model เพื่อนำมามาตรวจสอบ ในแต่ละ request ที่เข้ามายังระบบว่า เป็น Bot ที่เราไม่ต้องการหรือไม่ ตลอดจนการนำไปใช้งาน ซึ่งจะมี feature จำนวนมาก แน่นอนว่า feature ต่าง ๆ ไม่สามารถเปิดเผยได้ มิเช่นนั้น จะโดนเล่นงานแน่นอน !! มาเริ่มกันเลย

Read More…

สิ่งที่น่าสนใจสำหรับการย้ายฐานข้อมูลออกจาก Oracle ของ Amazon

จากการอ่านบทความเรื่อง Migration Complete – Amazon’s Consumer Business Just Turned off its Final Oracle Database นั้น มีเรื่องที่น่าสนใจเยอะมาก ๆ ทั้งจำนวนทีมและ product ที่ต้องทำการย้าย จากบทความบอกว่ามีมากกว่า 100 ทีมที่ต้องทำการย้าย ทั้งปัญหาและประโยชน์ที่ได้รับจากการย้ายครั้งนี้

Read More…

ว่าด้วยเรื่องที่ควรรู้และเข้าใจเกี่ยวกับ Elasticsearch

หลังจากที่มีโอกาสแบ่งปันเรื่องของ Elastic Stack ไปพอสมควร จึงทำการสรุปสิ่งที่แบ่งปันไว้นิดหน่อย ซึ่งเป็นอีกมุมมองที่คนใช้งานหรือคนที่สนใจควรรู้ไว้บ้าง มาเริ่มกันเลย

Read More…

สรุปจาก Infographic เรื่อง The Top 10 Big Data Challenges

จากกลุ่ม Data Science Thailand ทำการ share บทความ เรื่อง The Top 10 Big Data Challenges  ซึ่งเป็น infographic สรุปเรื่อง 10 อันดับในความท้ายของการนำ Big Data มาใช้ในองค์กร ทำการสร้างไว้ตั้งแต่ปี 2015 เห็นว่าน่าสนใจ เลยนำมาสรุปไว้นิดหน่อย

Read More…

ว่าด้วยเรื่อง 8V สำหรับ Big Data

วันนี้อ่านเจอเอกสารที่น่าสนใจว่าด้วยเรื่อง Big Data Technology with 8V ซึ่งทำการอธิบายคุณสมบัติของ Big Data เพื่อกำหนดว่าในแต่ละส่วนต้องทำอะไร นำพาไปสู่การเลือก process และ technology ที่เหมาะสม โดยแบ่งออกเป็น 8 กลุ่มดังนี้ Volume Value Veracity Visualization Variety Velocity Viscosity Virality

Read More…

ว่าด้วยเรื่องของ Fast Data

โดยปกตินั้นข้อมูลมีการเปลี่ยนแปลงอยู่เสมอ ยิ่งในปัจจุบันอัตราการเปลี่ยนแปลงสูงมาก ๆ ทั้ง Volume, Velocity และ Variety ทำให้เครื่องมือต่าง ๆ ที่มีอยู่อาจจะไม่เพียงพอต่อความต้องการ ทั้งการจัดเก็บ ทั้งการรวบรวม ทั้งการวิเคราะห์ ประมวลผล ซึ่งมีความซับซ้อน และต้องการให้ทำงานแบบ realtime ดังนั้นเราต้องการวิธีการใหม่ เครื่องมือใหม่ ๆ architecture ใหม่

Read More…