Что умеет Gemini 3.0 и Antigravity: подробный разбор релиза Google

Кратко о релизе

Gemini 3.0 вышел и это потрясающая модель.

Google представила Gemini 3.0 и сопутствующий инструмент Antigravity — набор, который делает акцент на агентности и мультимодальности. Модель доступна в базовой версии бесплатно, а продвинутая ветка DeepThink обещает улучшенные результаты в отдельных доменах и будет доступна на «ультра»-плане примерно за $200, но не сразу.

Ключевые возможности Gemini 3.0

Gemini 3.0 проявляет сильный акцент на нескольких направлениях одновременно:

Мультимодальность: работа с изображениями и видео, воспроизведение графиков и генерация фронтенд-кода по картинкам.
Агентность: длительные последовательные задачи, многшаговые рабочие процессы и артефакты-промежуточные продукты, которые модель генерирует в процессе.
Генерация фронтенда и ассетов: SVG, анимированные сцены, сайт-страницы и игровые ассеты.
Интеграция с локальной средой: Antigravity создает папку проекта на машине и может запускать процессы локально.

Что такое артефакты и как они помогают

Артефакты — это промежуточные файлы и планы, которые Gemini создает, чтобы структурировать работу. Пример — имплементационный план, ассеты, сгенерированные изображения и код, которые затем собираются в проект.

Бенчмарки и тесты: где Gemini опережает конкурентов

По представленным данным, Gemini 3.0 лидирует в ряде тяжёлых бенчмарков:

GPQA Diamond — сложные вопросы уровня PhD;
AMA25 — олимпиады по математике;
ARK AGI 2 — визуально-логические задачи (авторы считают, что этот бенч нельзя полностью решать LLM и достижение 100% означало бы AGI);
Vending Bench 2 — симуляция управления бизнесом (вендинг), моделирование заработка и последовательности действий;

В сравнении с упомянутыми в тестах моделями, Gemini 3.0 в ряде показателей опережает Cloud 4.0 Sonnet, GPT 5.1 и предыдущих лидеров вроде Клод 4.5.net. В некоторых оценках DeepThink показывает лучшие результаты, особенно по ARK AGI 2 и GPQA Diamond, но будет доступен только платным пользователям ультраплана.

Практические примеры и ограничения

На практике Gemini успешно генерирует:

анимированные SVG (рок-группа на стадионе);
HTML/CSS ассеты и прототипы сайтов;
компоненты для игр и игровые поля.

Однако не все задачи даются идеально: тест на юмор с «шутками-панчами» продемонстрировал слабую связность у Gemini — в ряде случаев модель путала логику сцен и выдавала неудачные шутки. Это показывает, что даже сильные LLM по-прежнему имеют узкие места в тонких семантических сценариях.

Antigravity — что это и как работает

Antigravity — это Agent-First IDE, которое можно установить на macOS и Windows. Его ключевые характеристики:

режим планирования и режим создания;
автоматическое создание папки проекта и локальных файлов;
панель управления агентом с логами и просмотром артефактов;
встроенные генераторы картинок, обёрнутые вокруг модулей вроде «нано-банана» и «Gemini 2.5 Flash Computer Use»;

Рабочий цикл типичен для agent-сред: вы даёте промпт, агент планирует шаги, создаёт артефакты, генерирует код и ассеты, а пользователь подтверждает или отклоняет действия. Можно настроить уровень автономности агента — от постоянного подтверждения до полного самоуправления.

В демонстрациях Antigravity запускал терминальные команды и строил walkthrough с артефактами; в одном случае использовалась команда npm rendef (как часть демонстрации запуска сборки).

Сравнения с другими агентными системами

Сопоставление с другими системами показало: некоторые конкуренты (например, упомянутый Клод 4.5 Sonnet) тратят больше времени и совершают дополнительные попытки (включая обращение в браузер), но при этом иногда считают задачу завершённой преждевременно. В ряде агентных задач Gemini справился лучше — особенно когда требовалась последовательная работа с инструментами и генерация фронтенда.

Доступность и что дальше

Базовая версия Gemini 3.0 доступна всем бесплатно. DeepThink — платная опция на «ультра»-плане (~$200) и пока не сразу доступна. Antigravity распространяется как локальный IDE для разработчиков.

Выводы и значение релиза

Gemini 3.0 укрепляет тренд на мультимодальные и агентные системы: модель демонстрирует отличные результаты в тяжёлых бенчмарках, при этом остаются области для улучшения (тонкий юмор, финальная доводка ассетов). Antigravity переводит агентную работу в локальную IDE-парадигму и делает создание проектов более привычным для разработчиков.

Для разработчиков и команд это означает: быстрее создавать прототипы, дольше держать состояние работы в агенте и получать готовые артефакты. Ограничения отражают текущую стадию LLM — сильная логика и генерация, но не безошибочная семантика в редких творческих задачах.

🎥 Смотреть видео