ว่าด้วยเรื่องของ Computer Vision จากงาน Code Mania 1010

จากหัวข้อแรกในงาน Code Mania 1010 :: All about passion
ช่วง keynote speaker นั้น
พูดในหัวข้อ Toward Virtual People: A Case Study on Fake Obama
เป็นการพูดถึงโลกและเทคโนโลยีมีการปรับปรุงและเปลี่ยนไปอย่างมาก
ยิ่งในโลกของ AI (Artificial intelligence), Computer vision และ ML (Machine Learning)
แน่นอนย่อมมันทั้งข้อดีและข้อเสีย

โดยเรื่องนี้ผมเคยดูและฟังมาน่าจะ 2 ครั้งแล้ว (ยังชอบเสมอ)

สามารถดูผ่าน TED :: Fake videos of real people — and how to spot them

ส่วนตัวอย่างของ Fake Obama ก็จาก BBC News ได้เลย ชัดมาก ๆ

ใน VDO :: Fake Obama created using AI video tool – BBC News

แต่สิ่งที่ผมสนใจมาก ๆ คือ อนาคตของงานและการวิจัย

ว่าจะไปทิศทางไหนบ้าง ?
โดยผู้พูดได้แนะนำไว้ว่า
ในอนาคตเราต้องการสิ่งที่ interact กับเราได้เหมือนมนุษย์ด้วยกันมากขึ้น
บางครั้งคิดว่าเป็นการ interact กับมนุษย์ไปเลย
ซึ่งนั่นคือ การพูดคุยแบบเห็นหน้าเห็นตา
มากกว่าข้อความและเสียง
ดังนั้นเรื่องของ Virtual Reality
จึงน่าจะเป็นสิ่งที่น่าจะเกิดขึ้นและสำคัญมาก ๆ
ยกตัวอย่างของงานวิจัยและงานที่มีบริษัททำออกมาขายแล้ว เช่น

การเปลี่ยนปากของผู้พูดใน VDO/หนัง ให้เป็นไปตามภาษาของแต่ละประเทศ
การสร้าง VDO ต่าง ๆ จากรูปภาพ
การลองเสื้อผ้าแบบ reality มากขึ้น

อีกอย่างที่ผู้พูดอยากให้มีเยอะ ๆ ในเมืองไทย คือ

เรื่องของความรู้ความเข้าใจเกี่ยวกับ Computer Vision
นั่นคือ การสนใจในปัญหาเกี่ยวกับการมองเห็นของ computer
แน่นอนว่า ปัญหาหลัก ๆ คือ
การสอนให้ computer เข้าใจการมองเห็นตามมุมมองของมนุษย์ (Machine Learning)
เนื่องจากปัญหานี้นั้น
ทาง Computer Vision นั้นยังเหมือนเด็ก
นั่นคือ ยังไม่มีความรู้และเข้าใจเหมือนมนุษย์
จึงทำให้ผลการทำงานผิดพลาดบ่อยมาก ๆ (Overfitting problem)

เรื่องของ Computer Vision มีเยอะมาก ๆ

ยกตัวอย่างเช่น

Image recognition
Image segmentation
Image captioning
3D understanding คือการทำความเข้าใจหรือรู้จักในมุมมองต่าง ๆ

Computer จะเก่งมาก ๆ
แต่ปัญหาใน Computer Vision ก็ยังกว้างและมีปัญหามากมาย
นั่นคือ Teach computer to imagine
จะสอนให้ computer สามารถจินตนาการได้อย่างไร ?

ทั้งเรื่องของ Image generation
ทั้งเรื่องของ Music generation
ทั้งเรื่องของ Image inpainting (เพิ่มเติมส่วนที่ขาดหายไป)
ทั้งเรื่องของ Style transfer
ทั้งเรื่องของ Image translation และอื่น ๆ อีกมากมาย

เราจำเป็นต้องสอน computer เพื่อให้รู้และเข้าใจ

ด้วยข้อมูลจำนวนมหาศาล เพื่อให้ได้ความรู้และมีความรู้ตามที่ต้องการ
แต่ปัญหาจากสิ่งที่สอนก็อาจจะทำให้เกิด bias ได้เช่นกัน
แต่ก็ขึ้นอยู่กับเป้าหมายของการสอนมากกว่า ว่าต้องการอะไร

สิ่งที่เป็นปัญหาต่อมาของ Computer Vision คือ

นักวิจัยทำการทดลองใส่ noise เข้ายังรูปภาพ
ผลที่ได้คือ computer จะโดนหลอก และทำงานผิดพลาด
ซึ่งทางผู้พูดชี้ให้เห็น ความเปราะบางของการเรียนรู้
ว่าถ้ามีความเปราะบางแบบนี้
อาจจะก่อให้เกิดปัญหาร้ายแรงได้
ยกตัวอย่างเช่น

ใน self-driving car
ถ้าทำการหลอกที่ป้ายความเร็ว ให้ขับเร็วได้ อาจจะก่อให้เกิดอันตรายได้

ในเรื่องของการ scan หน้า
มีการสร้างแว่นพิเศษสำหรับหลอกว่าเป็นคนอื่นได้อีกด้วย

https://www.theverge.com/2016/11/3/13507542/facial-recognition-glasses-trick-impersonate-fool

จะเห็นได้ว่า เรื่องต่าง ๆ เหล่านี้ มีทั้งข้อดีและข้อเสีย
แน่นอนว่า ก็ยังต้องคิดค้นและวิจัย เพื่อปรับปรุงกันต่อไป
แต่ด้วยเทคโนโลยีที่ทันสมัย
จึงช่วยทำให้การคิดค้นและวิจัยมีความก้าวหน้าที่สูงมาก ๆ

Tags:codemania,computer-vision,machine-learning

cc :: somkiat

ว่าด้วยเรื่องของ Computer Vision จากงาน Code Mania 1010

Article by Somkiat Puisungnoen

Article by Somkiat Puisungnoen

Related Posts