พนักงาน OpenAI กล่าวหาผลการทดสอบมาตรฐานของโมเดล AI ล่าสุดของ xAI, Grok3 ว่าทำให้เข้าใจผิด
เมื่อไม่นานมานี้ พนักงานของ OpenAI ได้กล่าวหาบริษัท xAI ของ Elon Musk อย่างเปิดเผยว่าปล่อยผลการทดสอบมาตรฐานที่ทำให้เข้าใจผิดสำหรับโมเดล AI ล่าสุดของพวกเขา Grok3 ในการตอบสนอง Igor Babushkin ผู้ร่วมก่อตั้ง xAI ยืนยันว่าไม่มีการกระทำที่ไม่เหมาะสม
แผนภูมิของ xAI แสดงให้เห็นว่า Grok3 สองเวอร์ชัน - Grok3 Reasoning Beta และ Grok3 mini Reasoning - มีประสิทธิภาพดีกว่าโมเดลที่แข็งแกร่งที่สุดของ OpenAI ในปัจจุบัน o3-mini-high ใน AIME 2025 อย่างไรก็ตาม พนักงานของ OpenAI ได้ชี้ให้เห็นอย่างรวดเร็วบนแพลตฟอร์ม X ว่าแผนภูมิของ xAI ไม่ได้รวมคะแนนของ o3-mini-high ภายใต้เงื่อนไข "cons@64" ใน AIME 2025
บนแพลตฟอร์ม X Babushkin โต้แย้งว่า OpenAI ก็เคยปล่อยแผนภูมิการทดสอบมาตรฐานที่ทำให้เข้าใจผิดในลักษณะเดียวกันในอดีต แม้ว่าแผนภูมิเหล่านี้จะถูกใช้เพื่อเปรียบเทียบประสิทธิภาพของโมเดลของพวกเขาเอง
ข้อสงวนสิทธิ์: เนื้อหาทั้งหมดในบทความนี้เป็นเพียงความคิดเห็นของผู้เขียนเท่านั้น ไม่ได้มีส่วนเกี่ยวข้องกับแพลตฟอร์มแต่อย่างใด บทความนี้ไม่มีจุดประสงค์เพื่อใช้เป็นข้อมูลอ้างอิงประกอบการตัดสินใจลงทุน
เผื่อคุณอาจชื่นชอบ
บริษัทพิมพ์ธนบัตรและกษาปณ์แห่งประเทศจีนประกาศว่า: เราไม่เคยออกหรือขายสกุลเงินเสมือนใดๆ
ข่าวที่ว่า 'ทรัมป์จะเป็นคนปฏิบัติ' เป็นเท็จ เนื่องจากบัญชีถูกแฮ็กโดยแฮ็กเกอร์
ซีอีโอของ Token Metrics ระบุว่า ก.ล.ต. สหรัฐฯ จะถอนฟ้องคดีที่มีต่อพวกเขา
กำลังมาแรง
เพิ่มเติมราคาคริปโต
เพิ่มเติม








