Bitget App

เทรดอย่างชาญฉลาดกว่าที่เคย

พนักงาน OpenAI กล่าวหาผลการทดสอบมาตรฐานของโมเดล AI ล่าสุดของ xAI, Grok3 ว่าทำให้เข้าใจผิด

พนักงาน OpenAI กล่าวหาผลการทดสอบมาตรฐานของโมเดล AI ล่าสุดของ xAI, Grok3 ว่าทำให้เข้าใจผิด

ดูต้นฉบับ

Bitget2025/02/23 03:37

เมื่อไม่นานมานี้ พนักงานของ OpenAI ได้กล่าวหาบริษัท xAI ของ Elon Musk อย่างเปิดเผยว่าปล่อยผลการทดสอบมาตรฐานที่ทำให้เข้าใจผิดสำหรับโมเดล AI ล่าสุดของพวกเขา Grok3 ในการตอบสนอง Igor Babushkin ผู้ร่วมก่อตั้ง xAI ยืนยันว่าไม่มีการกระทำที่ไม่เหมาะสม

แผนภูมิของ xAI แสดงให้เห็นว่า Grok3 สองเวอร์ชัน - Grok3 Reasoning Beta และ Grok3 mini Reasoning - มีประสิทธิภาพดีกว่าโมเดลที่แข็งแกร่งที่สุดของ OpenAI ในปัจจุบัน o3-mini-high ใน AIME 2025 อย่างไรก็ตาม พนักงานของ OpenAI ได้ชี้ให้เห็นอย่างรวดเร็วบนแพลตฟอร์ม X ว่าแผนภูมิของ xAI ไม่ได้รวมคะแนนของ o3-mini-high ภายใต้เงื่อนไข "cons@64" ใน AIME 2025

บนแพลตฟอร์ม X Babushkin โต้แย้งว่า OpenAI ก็เคยปล่อยแผนภูมิการทดสอบมาตรฐานที่ทำให้เข้าใจผิดในลักษณะเดียวกันในอดีต แม้ว่าแผนภูมิเหล่านี้จะถูกใช้เพื่อเปรียบเทียบประสิทธิภาพของโมเดลของพวกเขาเอง

ข้อสงวนสิทธิ์: เนื้อหาทั้งหมดในบทความนี้เป็นเพียงความคิดเห็นของผู้เขียนเท่านั้น ไม่ได้มีส่วนเกี่ยวข้องกับแพลตฟอร์มแต่อย่างใด บทความนี้ไม่มีจุดประสงค์เพื่อใช้เป็นข้อมูลอ้างอิงประกอบการตัดสินใจลงทุน

PoolX: ล็อกเพื่อรับโทเค็นใหม่

APR สูงสุดถึง 12% เปิดตลอด ได้ Airdrop ตลอด

ล็อกเลย!