Google กำลังพัฒนา AI 'ตัวแทนผู้ใช้คอมพิวเตอร์'

วันจันทร์ที่ 28 ตุลาคม พ.ศ. 2567
image

ตามรายงานจาก The Information Google อาจจะเปิดตัว AI ตัวแทนผู้ใช้คอมพิวเตอร์ของตัวเองในเดือนธันวาคม โครงการนี้มีชื่อรหัสว่า "Project Jarvis" ซึ่งจะสามารถทำงานต่างๆ แทนผู้ใช้ได้ เช่น การรวบรวมข้อมูล การซื้อสินค้า หรือการจองเที่ยวบิน

Jarvis จะใช้เทคโนโลยี Gemini รุ่นใหม่ของ Google และทำงานผ่านเว็บเบราว์เซอร์ (โดยเฉพาะ Chrome) โดยมีจุดมุ่งหมายเพื่อช่วยผู้ใช้ "อัตโนมัติงานประจำวันบนเว็บ" ผ่านการจับภาพหน้าจอและการคลิกปุ่มหรือการใส่ข้อความ รายงานระบุว่าในขณะนี้ Jarvis ยังใช้เวลาในการทำงานแต่ละครั้งประมาณ "ไม่กี่วินาที"

บริษัทเทคโนโลยี AI รายใหญ่หลายแห่งกำลังพัฒนาโมเดล AI ที่สามารถทำงานคล้ายกับ Jarvis เช่น Copilot Vision ของ Microsoft ซึ่งสามารถโต้ตอบกับผู้ใช้เกี่ยวกับหน้าเว็บที่กำลังดูอยู่ Apple Intelligence คาดว่าจะสามารถรับรู้สิ่งที่อยู่บนหน้าจอและทำงานต่างๆ แทนผู้ใช้ได้ในปีหน้า Anthropic ได้เปิดตัว Claude เวอร์ชันเบต้าที่สามารถใช้คอมพิวเตอร์แทนผู้ใช้ได้ (แม้ว่าจะยังมีข้อผิดพลาดอยู่บ้าง) และ OpenAI ก็กำลังพัฒนาโมเดลคล้ายกันนี้เช่นกัน

The Information ระบุว่าแผนการเปิดตัว Jarvis ในเดือนธันวาคมของ Google อาจมีการเปลี่ยนแปลง และ Google อาจจะเลือกที่จะเปิดให้ผู้ทดสอบจำนวนเล็กน้อยเพื่อช่วยในการแก้ไขปัญหาและปรับปรุงระบบ

แหล่งข่าว:  https://www.theverge.com/2024/10/26/24280431/google-project-jarvis-ai-system-computer-using-agent