Google запускає Gemini Deep Think AI, модель міркування, яка паралельно тестує кілька ідей
Google DeepMind запускає Gemini 2.5 Deep Think , яка, за словами компанії, є їхньою найсучаснішою моделлю мислення на основі штучного інтелекту, здатною відповідати на запитання, досліджуючи та розглядаючи кілька ідей одночасно, а потім використовуючи ці результати для вибору найкращої відповіді.
Передплатники Ultra від Google вартістю 250 доларів на місяць отримають доступ до Gemini 2.5 Deep Think у додатку Gemini, починаючи з п’ятниці.
Вперше представлена у травні на Google I/O 2025, Gemini 2.5 Deep Think – це перша публічно доступна багатоагентна модель Google. Ці системи породжують кількох агентів на основі штучного інтелекту для паралельного розв’язання питання, процес, який використовує значно більше обчислювальних ресурсів, ніж один агент, але, як правило, призводить до кращих відповідей.
Google використав варіацію Gemini 2.5 Deep Think, щоб здобути золоту медаль на цьогорічній Міжнародній математичній олімпіаді (IMO).
Поряд із Gemini 2.5 Deep Think, компанія заявляє, що випускає модель, яку вона використовувала в IMO, для обраної групи математиків та науковців. Google стверджує, що ця модель штучного інтелекту «потрібні години для роздумів», а не секунди чи хвилини, як більшість моделей штучного інтелекту, орієнтованих на споживача. Компанія сподівається, що модель IMO покращить дослідницькі зусилля, і прагне отримати відгуки про те, як покращити багатоагентну систему для академічного використання.
Google зазначає, що модель Gemini 2.5 Deep Think є значним покращенням порівняно з тим, що було анонсовано на I/O. Компанія також стверджує, що розробила «нові методи навчання з підкріпленням», щоб заохотити Gemini 2.5 Deep Think краще використовувати свої шляхи міркування.
«Глибоке мислення може допомогти людям розв’язувати проблеми, які потребують креативності, стратегічного планування та поетапного вдосконалення», – йдеться у дописі в блозі Google, опублікованому в TechCrunch.
Компанія стверджує, що Gemini 2.5 Deep Think досягає найсучасніших результатів у Humanity’s Last Exam (HLE) — складному тесті, що вимірює здатність штучного інтелекту відповідати на тисячі запитань, зібраних за допомогою краудсорсингу, з математики, гуманітарних наук та природничих наук. Google стверджує, що її модель набрала 34,8% у HLE (без інструментів), порівняно з Grok 4 від xAI, який набрав 25,4%, та o3 від OpenAI, який набрав 20,3%.
Google також стверджує, що Gemini 2.5 Deep Think перевершує моделі штучного інтелекту від OpenAI, xAI та Anthropic у LiveCodeBench6, складному тесті конкурентного кодування. Модель Google набрала 87,6%, тоді як Grok 4 набрала 79%, а o3 від OpenAI – 72%.

Gemini 2.5 Deep Think автоматично працює з такими інструментами, як виконання коду та пошук Google, і компанія стверджує, що він здатний створювати «набагато довші відповіді», ніж традиційні моделі штучного інтелекту.
Під час тестування Google модель виконувала детальніші та естетично привабливіші завдання веб-розробки порівняно з іншими моделями штучного інтелекту. Компанія стверджує, що модель може допомогти дослідникам і «потенційно пришвидшити шлях до відкриттів».

Схоже, що кілька провідних лабораторій штучного інтелекту сходяться навколо багатоагентного підходу.
Нещодавно компанія Ілона Маска xAI випустила власну мультиагентну систему Grok 4 Heavy , яка, за її словами, змогла досягти провідної в галузі продуктивності за кількома тестами. Дослідник OpenAI Ноам Браун розповів у подкасті , що неопублікована модель штучного інтелекту, яку компанія використовувала для отримання золотої медалі на цьогорічній Міжнародній математичній олімпіаді (IMO), також була мультиагентною системою. Тим часом, агент Research від Anthropic , який генерує ґрунтовні дослідницькі завдання, також працює на базі мультиагентної системи.
Незважаючи на високу продуктивність, схоже, що обслуговування багатоагентних систем ще дорожче, ніж традиційних моделей штучного інтелекту. Це означає, що технологічні компанії можуть тримати ці системи закритими в рамках своїх найдорожчих планів підписки, що вирішили зробити xAI, а тепер і Google.
У найближчі тижні Google планує поділитися Gemini 2.5 Deep Think з вибраною групою тестувальників через Gemini API. Компанія стверджує, що хоче краще зрозуміти, як розробники та підприємства можуть використовувати її багатоагентну систему.