Кратко о релизе
Gemini 3.0 вышел и это потрясающая модель.
Google представила Gemini 3.0 и сопутствующий инструмент Antigravity — набор, который делает акцент на агентности и мультимодальности. Модель доступна в базовой версии бесплатно, а продвинутая ветка DeepThink обещает улучшенные результаты в отдельных доменах и будет доступна на «ультра»-плане примерно за $200, но не сразу.
Ключевые возможности Gemini 3.0
Gemini 3.0 проявляет сильный акцент на нескольких направлениях одновременно:
- Мультимодальность: работа с изображениями и видео, воспроизведение графиков и генерация фронтенд-кода по картинкам.
- Агентность: длительные последовательные задачи, многшаговые рабочие процессы и артефакты-промежуточные продукты, которые модель генерирует в процессе.
- Генерация фронтенда и ассетов: SVG, анимированные сцены, сайт-страницы и игровые ассеты.
- Интеграция с локальной средой: Antigravity создает папку проекта на машине и может запускать процессы локально.
Что такое артефакты и как они помогают
Артефакты — это промежуточные файлы и планы, которые Gemini создает, чтобы структурировать работу. Пример — имплементационный план, ассеты, сгенерированные изображения и код, которые затем собираются в проект.
Бенчмарки и тесты: где Gemini опережает конкурентов
По представленным данным, Gemini 3.0 лидирует в ряде тяжёлых бенчмарков:
- GPQA Diamond — сложные вопросы уровня PhD;
- AMA25 — олимпиады по математике;
- ARK AGI 2 — визуально-логические задачи (авторы считают, что этот бенч нельзя полностью решать LLM и достижение 100% означало бы AGI);
- Vending Bench 2 — симуляция управления бизнесом (вендинг), моделирование заработка и последовательности действий;
В сравнении с упомянутыми в тестах моделями, Gemini 3.0 в ряде показателей опережает Cloud 4.0 Sonnet, GPT 5.1 и предыдущих лидеров вроде Клод 4.5.net. В некоторых оценках DeepThink показывает лучшие результаты, особенно по ARK AGI 2 и GPQA Diamond, но будет доступен только платным пользователям ультраплана.
Практические примеры и ограничения
На практике Gemini успешно генерирует:
- анимированные SVG (рок-группа на стадионе);
- HTML/CSS ассеты и прототипы сайтов;
- компоненты для игр и игровые поля.
Однако не все задачи даются идеально: тест на юмор с «шутками-панчами» продемонстрировал слабую связность у Gemini — в ряде случаев модель путала логику сцен и выдавала неудачные шутки. Это показывает, что даже сильные LLM по-прежнему имеют узкие места в тонких семантических сценариях.
Antigravity — что это и как работает
Antigravity — это Agent-First IDE, которое можно установить на macOS и Windows. Его ключевые характеристики:
- режим планирования и режим создания;
- автоматическое создание папки проекта и локальных файлов;
- панель управления агентом с логами и просмотром артефактов;
- встроенные генераторы картинок, обёрнутые вокруг модулей вроде «нано-банана» и «Gemini 2.5 Flash Computer Use»;
Рабочий цикл типичен для agent-сред: вы даёте промпт, агент планирует шаги, создаёт артефакты, генерирует код и ассеты, а пользователь подтверждает или отклоняет действия. Можно настроить уровень автономности агента — от постоянного подтверждения до полного самоуправления.
В демонстрациях Antigravity запускал терминальные команды и строил walkthrough с артефактами; в одном случае использовалась команда npm rendef (как часть демонстрации запуска сборки).
Сравнения с другими агентными системами
Сопоставление с другими системами показало: некоторые конкуренты (например, упомянутый Клод 4.5 Sonnet) тратят больше времени и совершают дополнительные попытки (включая обращение в браузер), но при этом иногда считают задачу завершённой преждевременно. В ряде агентных задач Gemini справился лучше — особенно когда требовалась последовательная работа с инструментами и генерация фронтенда.
Доступность и что дальше
Базовая версия Gemini 3.0 доступна всем бесплатно. DeepThink — платная опция на «ультра»-плане (~$200) и пока не сразу доступна. Antigravity распространяется как локальный IDE для разработчиков.
Выводы и значение релиза
Gemini 3.0 укрепляет тренд на мультимодальные и агентные системы: модель демонстрирует отличные результаты в тяжёлых бенчмарках, при этом остаются области для улучшения (тонкий юмор, финальная доводка ассетов). Antigravity переводит агентную работу в локальную IDE-парадигму и делает создание проектов более привычным для разработчиков.
Для разработчиков и команд это означает: быстрее создавать прототипы, дольше держать состояние работы в агенте и получать готовые артефакты. Ограничения отражают текущую стадию LLM — сильная логика и генерация, но не безошибочная семантика в редких творческих задачах.