New York Times ใช้ AI แบบ Generative เป็นเครื่องมือในการรายงานข่าวได้อย่างไร
การเติบโตของโมเดล AI แบบ Generative ที่ทรงพลังในช่วงไม่กี่ปีที่ผ่านมา นำไปสู่เรื่องราวมากมายเกี่ยวกับบริษัทต่างๆ ที่พยายามใช้ AI แทนที่งานของมนุษย์ แต่บทความล่าสุดของ New York Times ได้ชี้ให้เห็นอีกด้านหนึ่ง ที่ AI กลายเป็นเพียงเครื่องมืออันทรงพลังที่ช่วยในงานที่ยังต้องอาศัยทักษะเฉพาะของมนุษย์
ในการรายงานข่าวชิ้นหนึ่ง Times ได้ตรวจสอบการสนทนากว่า 400 ชั่วโมง จากการประชุมต่างๆ ในช่วงสามปีที่ผ่านมา รวมถึงเอกสารและสื่อการฝึกอบรมเพิ่มเติม การตรวจสอบข้อมูลจำนวนมากขนาดนี้เป็นงานที่น่าท้าทาย แม้แต่สำหรับทีมนักข่าวสี่คน นั่นคือเหตุผลที่ Times ระบุในหมายเหตุประกอบบทความว่าได้ "ใช้ปัญญาประดิษฐ์เพื่อช่วยระบุช่วงเวลาสำคัญ" จากวิดีโอเพื่อนำมารายงาน
ช่วยในการถอดเทป
ขั้นตอนแรกคือการใช้เครื่องมืออัตโนมัติในการถอดความวิดีโอ ซึ่งทำให้ได้ชุดการถอดความที่ "มีคำรวมเกือบห้าล้านคำ" ตามที่ระบุในหมายเหตุ นี่ไม่ใช่การใช้ AI แบบก้าวล้ำแต่อย่างใด - Times เองก็เคยเขียนถึงเครื่องมือถอดความอัตโนมัติ Otter.ai ตั้งแต่ปี 2019
คู่มือล่าสุดของ Wirecutter เกี่ยวกับบริการถอดความอัตโนมัติระบุว่า บริการถอดความด้วย AI ที่ดีที่สุดที่ทดสอบในปี 2018 มีความแม่นยำเพียง 73 เปอร์เซ็นต์ ในขณะที่บริการที่แม่นยำน้อยที่สุดที่ทดสอบในปี 2024 มีความแม่นยำถึง 94 เปอร์เซ็นต์ ยิ่งไปกว่านั้น Wirecutter ยังระบุว่าระบบที่ดีที่สุดในปัจจุบัน เช่น OpenAI's Whisper "มีความแม่นยำมากกว่าการถอดความโดยมนุษย์ที่แม่นยำน้อยที่สุด"
ความก้าวหน้าอย่างรวดเร็วนี้เป็นข่าวร้ายสำหรับผู้ที่หาเลี้ยงชีพด้วยการถอดความคำพูด แต่สำหรับนักข่าวอย่าง Times ที่สามารถถอดความเสียงหลายร้อยชั่วโมงได้อย่างรวดเร็วและแม่นยำในต้นทุนที่ต่ำกว่ามาก ระบบ AI เหล่านี้กลายเป็นเครื่องมือสำคัญอีกชิ้นหนึ่งในชุดเครื่องมือการรายงานข่าว
การวิเคราะห์ด้วย AI และมนุษย์
หลังจากการถอดความอัตโนมัติเสร็จสิ้น นักข่าว NYT ยังต้องเผชิญกับงานยากในการอ่านข้อความที่ถอดความ 5 ล้านคำเพื่อเลือกข้อมูลที่เกี่ยวข้อง ทีมได้ "ใช้โมเดลภาษาขนาดใหญ่หลายตัว" ซึ่งช่วยให้พวกเขา "ค้นหาหัวข้อที่น่าสนใจในการถอดความ มองหาประเด็นที่โดดเด่น และระบุธีมที่เกิดขึ้นซ้ำๆ"
การสรุปชุดเอกสารที่ซับซ้อนและการระบุธีมถูกยกให้เป็นหนึ่งในการใช้งานที่ปฏิบัติได้จริงมากที่สุดสำหรับโมเดลภาษาขนาดใหญ่ ตัวอย่างเช่น Anthropic ได้แสดงให้เห็นถึงความสามารถของโมเดล Claude ในการวิเคราะห์เนื้อหาหนังสือทั้งเล่มและตอบคำถามแบบโต้ตอบได้ เช่นเดียวกับ Google's NotebookLM ที่สามารถสร้างบทวิจารณ์และพอดคาสต์ที่น่าสนใจได้
อย่างไรก็ตาม มีข้อจำกัดสำคัญในความสามารถการวิเคราะห์ข้อความของ LLM จากการศึกษาพบว่า AI มี "ความสามารถที่จำกัดในการวิเคราะห์และสรุปเนื้อหาที่ซับซ้อนซึ่งต้องการความเข้าใจอย่างลึกซึ้งเกี่ยวกับบริบท ความหมายที่ละเอียดอ่อน หรือความหมายที่แฝงอยู่" บางครั้งยังสร้างข้อความที่ "ถูกต้องตามหลักไวยากรณ์ แต่ไม่ถูกต้องตามข้อเท็จจริง"
ด้วยเหตุนี้ Times จึงใช้วิธีผสมผสานระหว่าง AI และมนุษย์ โดยให้ AI ช่วยคัดกรองข้อมูลในเบื้องต้น จากนั้นทีมนักข่าวจะ "ตรวจสอบแต่ละส่วนด้วยตนเองและใช้วิจารณญาณในการตัดสินความหมายและความเกี่ยวข้องของเนื้อหา" รวมถึงตรวจสอบความถูกต้องกับต้นฉบับทั้งหมด
วิธีการนี้ช่วยให้สามารถใช้จุดแข็งของทั้งสองฝ่าย โดย AI ช่วยประมวลผลข้อมูลจำนวนมากอย่างรวดเร็ว ในขณะที่มนุษย์ช่วยตรวจสอบความถูกต้องและทำความเข้าใจบริบทที่ซับซ้อน ทำให้ AI กลายเป็นเครื่องมือที่มีประโยชน์สำหรับนักข่าวในยุคดิจิทัล
แหล่งที่มา: https://arstechnica.com/ai/2024/10/the-new-york-times-shows-how-ai-can-aid-reporters-without-replacing-them