เห็นว่าทางทีมพัฒนา Playwright จาก Microsoft นั้น
ทำการปล่อย Playwright MCP server ออกมาแล้ว (Official)
ช่วยให้เราสามารถควบคุม web browser แบบอัตโนมัติผ่าน Playwright ได้เลย
โดยการทำงานจะสร้าง tree ขึ้นมาจาก accessibility element ขึ้นมาให้
เพื่อให้ LLM สามารถเข้าถึงได้ง่าย และ สะดวกมากยิ่งขึ้น
หรือจะเปลี่ยนไปใช้ nision mode หรือ screenshot mode ก็ได้
และมี use case ให้ใช้งานดังนี้

  • การกรอกข้อมูลใน form
  • การ extract หรืออ่านข้อมูลจาก element ต่าง ๆ ในหน้า web นั่นคือการทำ web scraping นั่นเอง
  • ช่วยให้สร้าง automation testing ด้วย LLM ได้ง่ายและสะดวกขึ้น
  • ใช้สำหรับสร้าง Agent สำหรับการควบคุม web browser เพื่อใช้งานในเรื่องต่าง ๆ ที่ต้องการ

การใช้งานก็ไม่ยาก เพียง config ใน MCP ได้เลย

หรือทำการติดตั้งใน VS Code ได้เลย

ลองใช้งานกันดูครับ