New York Times ใช้ AI แบบ Generative เป็นเครื่องมือในการรายงานข่าวได้อย่างไร

วันพุธที่ 30 ตุลาคม พ.ศ. 2567
image

การเติบโตของโมเดล AI แบบ Generative ที่ทรงพลังในช่วงไม่กี่ปีที่ผ่านมา นำไปสู่เรื่องราวมากมายเกี่ยวกับบริษัทต่างๆ ที่พยายามใช้ AI แทนที่งานของมนุษย์ แต่บทความล่าสุดของ New York Times ได้ชี้ให้เห็นอีกด้านหนึ่ง ที่ AI กลายเป็นเพียงเครื่องมืออันทรงพลังที่ช่วยในงานที่ยังต้องอาศัยทักษะเฉพาะของมนุษย์

ในการรายงานข่าวชิ้นหนึ่ง Times ได้ตรวจสอบการสนทนากว่า 400 ชั่วโมง จากการประชุมต่างๆ ในช่วงสามปีที่ผ่านมา รวมถึงเอกสารและสื่อการฝึกอบรมเพิ่มเติม การตรวจสอบข้อมูลจำนวนมากขนาดนี้เป็นงานที่น่าท้าทาย แม้แต่สำหรับทีมนักข่าวสี่คน นั่นคือเหตุผลที่ Times ระบุในหมายเหตุประกอบบทความว่าได้ "ใช้ปัญญาประดิษฐ์เพื่อช่วยระบุช่วงเวลาสำคัญ" จากวิดีโอเพื่อนำมารายงาน

 

ช่วยในการถอดเทป

ขั้นตอนแรกคือการใช้เครื่องมืออัตโนมัติในการถอดความวิดีโอ ซึ่งทำให้ได้ชุดการถอดความที่ "มีคำรวมเกือบห้าล้านคำ" ตามที่ระบุในหมายเหตุ นี่ไม่ใช่การใช้ AI แบบก้าวล้ำแต่อย่างใด - Times เองก็เคยเขียนถึงเครื่องมือถอดความอัตโนมัติ Otter.ai ตั้งแต่ปี 2019

คู่มือล่าสุดของ Wirecutter เกี่ยวกับบริการถอดความอัตโนมัติระบุว่า บริการถอดความด้วย AI ที่ดีที่สุดที่ทดสอบในปี 2018 มีความแม่นยำเพียง 73 เปอร์เซ็นต์ ในขณะที่บริการที่แม่นยำน้อยที่สุดที่ทดสอบในปี 2024 มีความแม่นยำถึง 94 เปอร์เซ็นต์ ยิ่งไปกว่านั้น Wirecutter ยังระบุว่าระบบที่ดีที่สุดในปัจจุบัน เช่น OpenAI's Whisper "มีความแม่นยำมากกว่าการถอดความโดยมนุษย์ที่แม่นยำน้อยที่สุด"

ความก้าวหน้าอย่างรวดเร็วนี้เป็นข่าวร้ายสำหรับผู้ที่หาเลี้ยงชีพด้วยการถอดความคำพูด แต่สำหรับนักข่าวอย่าง Times ที่สามารถถอดความเสียงหลายร้อยชั่วโมงได้อย่างรวดเร็วและแม่นยำในต้นทุนที่ต่ำกว่ามาก ระบบ AI เหล่านี้กลายเป็นเครื่องมือสำคัญอีกชิ้นหนึ่งในชุดเครื่องมือการรายงานข่าว
 


การวิเคราะห์ด้วย AI และมนุษย์

หลังจากการถอดความอัตโนมัติเสร็จสิ้น นักข่าว NYT ยังต้องเผชิญกับงานยากในการอ่านข้อความที่ถอดความ 5 ล้านคำเพื่อเลือกข้อมูลที่เกี่ยวข้อง ทีมได้ "ใช้โมเดลภาษาขนาดใหญ่หลายตัว" ซึ่งช่วยให้พวกเขา "ค้นหาหัวข้อที่น่าสนใจในการถอดความ มองหาประเด็นที่โดดเด่น และระบุธีมที่เกิดขึ้นซ้ำๆ"

การสรุปชุดเอกสารที่ซับซ้อนและการระบุธีมถูกยกให้เป็นหนึ่งในการใช้งานที่ปฏิบัติได้จริงมากที่สุดสำหรับโมเดลภาษาขนาดใหญ่ ตัวอย่างเช่น Anthropic ได้แสดงให้เห็นถึงความสามารถของโมเดล Claude ในการวิเคราะห์เนื้อหาหนังสือทั้งเล่มและตอบคำถามแบบโต้ตอบได้ เช่นเดียวกับ Google's NotebookLM ที่สามารถสร้างบทวิจารณ์และพอดคาสต์ที่น่าสนใจได้

อย่างไรก็ตาม มีข้อจำกัดสำคัญในความสามารถการวิเคราะห์ข้อความของ LLM จากการศึกษาพบว่า AI มี "ความสามารถที่จำกัดในการวิเคราะห์และสรุปเนื้อหาที่ซับซ้อนซึ่งต้องการความเข้าใจอย่างลึกซึ้งเกี่ยวกับบริบท ความหมายที่ละเอียดอ่อน หรือความหมายที่แฝงอยู่" บางครั้งยังสร้างข้อความที่ "ถูกต้องตามหลักไวยากรณ์ แต่ไม่ถูกต้องตามข้อเท็จจริง"

ด้วยเหตุนี้ Times จึงใช้วิธีผสมผสานระหว่าง AI และมนุษย์ โดยให้ AI ช่วยคัดกรองข้อมูลในเบื้องต้น จากนั้นทีมนักข่าวจะ "ตรวจสอบแต่ละส่วนด้วยตนเองและใช้วิจารณญาณในการตัดสินความหมายและความเกี่ยวข้องของเนื้อหา" รวมถึงตรวจสอบความถูกต้องกับต้นฉบับทั้งหมด

วิธีการนี้ช่วยให้สามารถใช้จุดแข็งของทั้งสองฝ่าย โดย AI ช่วยประมวลผลข้อมูลจำนวนมากอย่างรวดเร็ว ในขณะที่มนุษย์ช่วยตรวจสอบความถูกต้องและทำความเข้าใจบริบทที่ซับซ้อน ทำให้ AI กลายเป็นเครื่องมือที่มีประโยชน์สำหรับนักข่าวในยุคดิจิทัล
 


แหล่งที่มา: https://arstechnica.com/ai/2024/10/the-new-york-times-shows-how-ai-can-aid-reporters-without-replacing-them