Screen Shot 2558-03-04 at 5.50.13 PM
ในปัจจุบันข้อมูลต่างๆ ทั้งในโลกของ Social network
ทั้งจากอุปกรณ์ต่างๆ มันโตขึ้นมาก (Internet of Things)
ทั้งจากในองค์กรต่างๆ ที่เพิ่มขึ้นสูงอย่างรวดเร็ว
ยิ่งในองค์กรใหญ่ๆ แล้วนั้นแล้วยิ่งมีข้อมูลสูงมากๆ
ดังนั้น จะมีอะไรมาจัดการและวิเคราะห์ข้อมูลเหล่านี้บ้างนะ ?

คำว่า Big Data มันเข้ามาบีบทบาทมากมายเหลือเกิน

ยิ่งในองค์กรใหญ่ๆ ยิ่งไม่ต้องพูดถึง
มันได้กลายเป็นชื่อหลักในทุกๆ โปรเจคที่เก็บกับข้อมูลไปเรียบร้อยแล้ว

สิ่งที่องค์กรต่างๆ ต้องการก็คือ platform ที่มาจัดการพวก Big Data
หรือเรียกว่า Big Data Platform นั่นเอง
เพื่อให้ได้ platform ที่ตรงกับความต้องการมากที่สุด
… แต่ที่น่ากลัวก็คือ ทำตามกระแสนะสิ !!
… โดยที่ตัวเองยังไม่รู้ว่าต้องการอะไร ?

บางครั้งเจอว่า เราจะเอา feature ของสิ่งที่เราจะนำมาใช้งานเป็นตัวตั้งต้น
แล้วจึงไปหาเครื่องมืออื่นๆ มาเปรียบเทียบ
ลองเดากันดูสิว่า สุดท้ายแล้วจะเลือกอะไร !!

ดังนั้น ก่อนที่จะเลือก platform อะไรมาใช้งานนั้น

มาทำความเข้าใจกับข้อมูล และ ความต้องการก่อนไหม
ซึ่งแน่นอนว่ามันมี 2 กลุ่มให้คุณเลือก คือ

  • General purpose
  • Domain specific

ทั้งสองกลุ่มนั้นล้วนมีประโยชน์ และต่างมี tradeoff เช่นเดียวกัน กล่าวคือ
General purpose นั้น สร้างขึ้นมาเพื่อให้ผู้ใช้งานคิด และ สร้างคุณค่า
ออกมาจากข้อมูลด้วยตนเอง
ดังนั้น จะเตรียมส่วนของการเข้าถึงข้อมูลในรูปแบบต่างๆ ไว้ให้ใช้งาน

ส่วน Domain specific นั้นออกแบบมาให้ใช้แบบ end-to-end ตรงตาม doamin ที่ได้กำหนดไว้เลย
หรือตรงตาม use case ที่ได้กำหนดไว้แล้ว จะเปลี่ยนแปลงได้น้อยมากๆ

คำถามที่มักจะได้รับก็คือ

แล้วเราจะเลือกอย่างไรดีล่ะ ?
แล้วจะตอบอย่างไรดีล่ะ ?

เนื่องจากในการเลือกนั้น มันมีเหตุปัจจัยเยอะนะ
ยิ่งองค์กรใหญ่ยิ่งมีเหตุเยอะมากๆ ทั้งต่อหน้าและลับหลัง !!
แต่เรามาดูเหตุผลที่ดูสมเหตุสมผลกันหน่อยดีกว่านะ

1. เรื่องความสามารถของคนในองค์กรต่อเรื่อง Data Analysis

แน่นอนว่าก่อนอื่น บรรดา manager นั้นควรทำการดูว่า
คนในองค์กร หรือ ทีมนั้นมีความรู้ความสามารถเรื่อง Data Analytic มากน้อยเพียงใดก่อน

ถ้าคนในองค์กรมีความรู้ความสามารถที่ดีแล้ว
สามารถที่จะเรื่อง platform หรือ เครื่องมือกลุ่มของ General purpose ได้เลย

ส่วน Domain specific ก็ได้เช่นกัน แจ่มันจะเป็นการปิดกั้น
ความรู้ความสามารถของคนในองค์มากไปหรือเปล่า ตรงนี้ต้องคิดนะครับ
แต่สิ่งที่ดีก็คือ สามารถทำการวิเคราะห์แบบซับซ้อนได้
โดยไม่ต้องทำการ training มากเท่าไร
เนื่องจากสิ่งที่เลือกมันทำให้เกือบทั้งหมด

ลองดูว่า คุณจะเลือกมองที่มุมใดเป็นหลักนะครับ
ทั้งมุมมองของความรู้ความสามารถทางด้าน Data Analytic/Data Science
ทั้งมุมมองในการพัฒนาความรู้ความสามารถของคน
ทั้งมุมมองในการใช้เครื่องมือ
ทั้งในมุมมองของธุรกิจ
ทั้งในมุมมองของความสะดวก รวดเร็ว

2. เรื่องของ Use cases

เป็นอีกเรื่องหนึ่งที่สำคัญมากๆ ในการตัดสินใจเลือกเครื่องมือมาใช้งาน
ดังนั้น คุณควรรู้ในสิ่งที่คุณต้องการก่อนนะ

ถ้าคุณมี use caseท ชัดเจนแล้ว
platform ในกลุ่ม Domain specific จะตรงกับคุณมากๆ
ทำให้คุณลงในรายละเอียดลึกๆ ได้เลย
แต่มันจะลำบาก และ ใช้ค่าใช้จ่ายสูงมากๆ
ในการเพิ่ม use case อื่นๆ เข้ามา

ส่วน General purpose นั้น มันจะทำให้ระบบของคุณมันยืดหยุ่นมากกว่า
ถ้าคุณมองแล้วว่า use case ของคุณมันมีโอกาสเปลี่ยนแปลง
หรือมีการเติบโตในรูปแบบใดรูปแบบหนึ่ง

ดังนั้น ควรรู้ว่าตัวเองต้องการอะไรก่อนนะครับ
ไม่ใช่ทำตามกระแส หรือ แฟชั่น
หรือตามเขาบอกมาว่ามันดี

3. รูปแบบข้อมูลของคุณเป็นอย่างไร

ในโลกของ Big Data นั้นไม่มีทางเลยที่คุณจะแปลงข้อมูลไปอยู่ในรูปแบบที่กำหนดได้ทั้งหมด
ถ้าทำแบบนั้นมันก็ไม่ใช่ Big Data สินะ

ยิ่งในองค์กรใหญ่ ข้อมูลเดิมๆ อาจจะมีหลากหลายรูปแบบได้
หรือเปลี่ยนแปลงอยู่อย่างตลอดเวลา
ดังนั้นทำให้เครื่องมือในกลุ่ม General purpose มันตรงกับความต้องการมากกว่านะ

เนื่องจากพวก Domain specific นั้นมีค่าใช้จ่ายในการเปลี่ยนแปลง หรือ ขยายที่สูงพอควร
ค่าใช้จ่ายมันทั้งเงิน และ เวลานะครับ

4. เรื่องของค่าใช้จ่าย

ในองค์กรใหญ่ๆ นั้นเรื่องค่าใช้จ่ายอาจจะไม่ใช่ประเด็นสำคัญเท่าไร
เพราะว่าเงินไม่ใช่ของเรานิ !!
แต่ในองค์กรขนาดเล็และกลางมันส่งผลมากพอสมควรเลยนะ

เครื่องมือในกลุ่ม Domain specific นั้นอาจจะแพงในช่วงเริ่มต้นกว่า General pupose นิดหน่อย
เพราะว่าต้องซื้อมาใช้งาน ติดตั้ง และ integrate เข้ากับระบบงานของเรา
เมื่อทุกอย่างเรียบร้อย ก็ใช้งานกันไป
แต่จะมีค่าใช้จ่ายหลังจากนั้นเช่น
เรื่องของ operation cost, maintain cost และ resource ต่างๆ เป็นต้น

ดังนั้น ลองเลือกกันดูนะครับ
แต่เหนือสิ่งอื่นใด ต้องรู้ตัวเองก่อนว่าต้องการอะไรครับ

2cf7095