Співробітники OpenAI публічно звинувачують результати тестів продуктивності останньої AI-моделі xAI, Grok3, у введенні в оману
Нещодавно співробітник OpenAI публічно звинуватив компанію xAI Ілона Маска у випуску оманливих результатів тестів для останньої моделі штучного інтелекту Grok3. У відповідь Ігор Бабушкін, співзасновник xAI, наполягав на тому, що жодних порушень не було.
Графік xAI показує, що дві версії Grok3 - Grok3 Reasoning Beta та Grok3 mini Reasoning - перевершили найсильнішу доступну модель OpenAI o3-mini-high на AIME 2025. Однак співробітник OpenAI швидко вказав на платформі X, що графік xAI не включав оцінку o3-mini-high за умовою "cons@64" у AIME 2025.
На платформі X Бабушкін стверджував, що OpenAI також випускала подібні оманливі графіки тестів у минулому, незважаючи на те, що ці графіки використовувалися для порівняння продуктивності їхніх власних моделей.
Відмова від відповідальності: зміст цієї статті відображає виключно думку автора і не представляє платформу в будь-якій якості. Ця стаття не повинна бути орієнтиром під час прийняття інвестиційних рішень.
Вас також може зацікавити
У тренді
БільшеЦіни на криптовалюти
Більше








