ocr Archive

ทดลองใช้ Mistral OCR สำหรับอ่านข้อมูลจาก PDF

เห็น Mistral OCR เปิดให้ใช้งานพอดีมี use case ต้องใช้งานเกี่ยวกับ OCR(Optical Character Recognition)ซึ่งเป็นไฟล์ PDF ที่ scan เป็นรูป มาจากเอกสารที่เป็นกระดาษดังนั้นจึงต้องทำการอ่านข้อมูลจากไฟล์เหล่านี้มาใช้งานทั้งการ chunking และ embeddingเพื่อทำการจัดเก็บใน Vector database เพื่อใช้งานต่อไปดังนั้นมาลองใช้งานกันดู

Read More…

ว่าง ๆ อ่านข้อมูลผู้ติดเชื้อ COVID-19 ของไทยจากภาพกันหน่อย

เนื่องจากปกติจะคอยดูและบันทึกข้อมูลของผู้ติดเชื้อ COVID 19 ของประเทศไทยรายวันไว้ด้วยที่ข้อมูลเป็นรูปภาพเช่นจากไทยรู้สู้โควิดจึงต้องเก็บข้อมูลไว้แบบ manualทำไปทำมารู้สึกเบื่อและเหนื่อยจึงลองเขียน program อ่านค่าข้อมูลจากรูปภาพด้วย Tesseract OCR กันหน่อยมือใหม่หัดลองเขียนแบบมั่ว ๆ

Read More…