Розробники та дослідники не оцінили «найрозумніший ШІ у світі» Ілона Маска — Grok 3
Ілон Маск представив Grok 3 — нову версію чат-бота від xAI, назвавши її «на порядок більш потужною» за попередню. Деякі дослідники штучного інтелекту та експерти протестували Grok 3, і їхні перші реакції виявилися змішаними.
Про це пише Business Insider.
Маск стверджує, що нова модель перевершує флагманський GPT-4o від OpenAI та конкуруючі ШІ-системи від Google, DeepSeek і Anthropic у ключових тестах з математики, науки та програмування.
«Ми щодня покращуємо моделі, і буквально протягом 24 годин ви побачите зміни», — заявив Маск під час трансляції у соцмережі X, де виступав разом із трьома інженерами xAI.
Андрій Карпаті, комп’ютерний науковець, співзасновник OpenAI та колишній керівник напрямку ШІ в Tesla, у своєму дописі в X зазначив, що Grok 3 успішно виконав завдання, зокрема пошук складної інформації у науковій роботі. Проте, як і OpenAI o1-pro, він мав труднощі з розв’язанням «хитрих» партій у хрестики-нулики.
«Загальне враження — це рівень приблизно o1-pro, випереджає DeepSeek-R1, хоча для точних висновків потрібні реальні оцінки», — додав Карпати, який отримав ранній доступ до Grok 3.
xAI також представила новий інструмент для Grok 3 під назвою DeepSearch. Він покликаний покращити дослідження, генерацію ідей та аналіз даних, а також пояснювати, як саме ШІ обробляє запити й формує відповіді. За даними Business Insider, стартап працював над цим інструментом ще з кінця минулого року.
Карпаті зазначив, що DeepSearch приблизно відповідає DeepResearch від Perplexity, що є непоганим результатом, але все ще поступається новій функції «Deep Research» від OpenAI, яка виглядає більш ґрунтовною та надійною.
Ітан Моллік, професор Уортонської бізнес-школи Пенсильванського університету, який досліджує ШІ, вважає, що хоча xAI швидко масштабується, Grok 3 не є беззаперечним лідером.
«Дуже міцна модель передового рівня, але не настільки, щоб відмовитися від використання ваших поточних аналогів», — написав Моллік у понеділок у LinkedIn.
Він додав, що хоча Grok 3 перевершує деякі моделі OpenAI у певних тестах, він не є явним лідером над OpenAI o3.
Гері Маркус, засновник Geometric Intelligence і давній критик ажіотажу навколо ШІ, поставився до запуску скептично.
«Ілон Маск обіцяв, що Grok 3 стане найрозумнішим штучним інтелектом в історії. Спойлер: це не так», — написав Маркус у Substack.
Источник: ua.news