На что способна нейросеть Gemini и какие у нее недостатки

Новая модель от Google может распознавать различные объекты реального мира, разбирать графики, решать алгебраические и геометрические задачи, понимать рукописный текст, распознавать и генерировать код, распознавать речь, а также переводить с одного языка на другой, работать с видео. На текущий момент есть три версии Gemini:
— Ultra. Флагманская модель с максимальными возможностями. Именно она показывает самую высокую производительность в сложных задачах, включая анализ и работу с несколькими модальностями. На ее основе планируется запустить продвинутую версию чат-бота Bard Advanced в 2024 году.
— Gemini Pro. Версия среднего уровня для более широкого круга задач. Она стала основой Google Bard. Позволяет генерировать тексты и изображения, задавать вопросы и искать информацию. Чат-бот с Pro-версией модели сейчас доступен в 170 странах, правда, пока только на английском языке.
— Gemini Nano. Базовая версия, предназначенная для локального применения на мобильных устройствах. Будет доступна для пользователей на смартфонах Google Pixel 8 в следующем году.
А теперь о недостатках. Пока представленные Google демо-ролики работы Gemini — скорее презентация возможного потенциала модели, а не ее актуальные функции. Да, Gemini может многое, но ее еще нужно обучать и обучать, давая подробные текстовые запросы. Или, например, если попросить Gemini дать краткий обзор новостей, то модель отказывается комментировать потенциально спорные темы или даже предлагает самому пользователю тщательно погуглить.
Зарегистрируйтесь, чтобы оставлять комментарии
Вход
Заходите через социальные сети
FacebookTwitter