
ทาง Google เพื่อปล่อย embedding model ชื่อว่า Gemini embedding 2 preview ออกมาซึ่งเป็น model ที่รองรับ input หลายชนิด หรือ Multimodel เช่น

หนึ่งในกระบวนการทำงานสำคัญของ RAG (Retrieval Augmented Generation)คือ การทำ chunking ข้อมูลที่มีขนาดใหญ่ เกินกว่า context windows ของ LLM modelให้อยู่ในขนาดที่เล็ก ๆ และ เหมาะสม ซึ่งมีวิธีการทำ chunking มากมายทั้ง fixed-size, paragraph, document เป็นต้นจากนั้นก็ทำการ embedding เพื่อช่วยให้ค้นหา หรือ retrieve ได้รวดเร็วมากขึ้นด้วยการค้นหาแบบ vector search หรือ semantic search นั่นเอง

หลังจากที่ทาง Redis 8 ถูกปล่อยออกมาซึ่งมี data type ใหม่คือ Vector Sets เข้ามา (preview feature)โดยนำความสามารถของ sorted set มาใช้กับ vectorเมื่อทำการเพิ่มข้อมูลเข้าไป เช่น text, image เป็นต้นจะต้องทำการแปลงเป็น vector หรือเรียกว่า embedding ก่อนจากนั้นจะทำการเรียงลำดับตามค่าความเหมือน หรือ distance ให้ทันที