The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Google открыл AI-модель Gemma, основанную на технологиях, общих с чат-ботом Gemini

23.02.2024 22:57

Компания Google объявила о публикации большой языковой модели машинного обучения Gemma, построенной с использованием технологий, применяемых для построения модели чат-бота Gemini, пытающегося конкурировать с ChatGPT. Модель доступна в четырёх вариантах, охватывающих 2 и 7 миллиардов параметров, в базовом и оптимизированном для диалоговых систем представлениях. Варианты с 2 млрд параметров подходят для использования в потребительских приложениях и для их обработки достаточно CPU. Варианты с 7 млрд параметров требуют более мощного оборудования и наличия GPU или TPU.

Среди областей применения модели Gemma называется создание диалоговых систем и виртуальных ассистентов, генерация текста, формирование ответов на вопросы, заданные на естественном языке, краткое изложение и обобщение содержимого, объяснение сути концепций и терминов, исправление ошибок в тексте, помощь в изучении языков. Поддерживается создание различных видов текстовых данных, включая стихи, код на языках программирования, рерайтинг произведений другими словами, формирование писем по шаблону. При этом модель имеет относительно небольшой размер, позволяющий использовать её на своём оборудовании с ограниченными ресурсами, например, на обычных ноутбуках и ПК.

Лицензия на модель разрешает бесплатное использование и распространение не только в исследовательских и персональных проектах, но и в коммерческих продуктах. Также разрешено создание и публикация изменённых вариантов модели. При этом условия использования запрещают применение модели для совершения вредоносных действий и предписывают по возможности использовать в своих продуктах самую свежую версию Gemma.

Поддержка работы с моделями Gemma уже добавлена в инструментарии Transformers, Responsible Generative AI Toolkit, MaxText, NVIDIA NeMo и NVIDIA TensorRT-LLM. Google опубликовал отдельный движок вывода gemma.cpp для Gemma, написанный на C++. Поддержка Gemma также уже добавлена в движок llama.cpp. Для оптимизации модели можно использовать фреймворк Keras и бэкенды для TensorFlow, JAX и PyTorch.

Размер учитываемого моделью Gemma контекста составляет 8 тысяч токенов (число токенов, которые модель может обработать и запомнить при генерации текста). Для сравнения размер контекста у моделей Gemini и GPT-4 составляет 32 тысячи токенов, а у модели GPT-4 Turbo - 128 тысяч. Моделью поддерживается только английский язык. В сравнении, проведённом Huggingface, среди открытых моделей Gemma-7B уступает только модели LLama 2 70B Chat, но опережает модели DeciLM-7B, PHI-2 (2.7B) и Mistral-7B-v0.1. В сравнении, проведённом Google, модель Gemma-7B немного опережает LLama 2 7B/13B и Mistral-7B.




  +-------------+----------+-------------+-------------+
  | Benchmark   | Gemma 7B | Mistral 7B  | Llama-2 7B  |
  +-------------+----------+-------------+-------------+
  | MMLU        |   64.3   |     60.1    |     45.3    |
  | HellaSwag   |   81.2   |     81.3    |     77.2    |
  | HumanEval   |   32.3   |     30.5    |     12.8    |
  +-------------+----------+-------------+-------------+

  +-------------+----------+-------------+
  | Benchmark   | Gemma 2B | Phi-2 2.7B  |
  +-------------+----------+-------------+
  | MMLU        |   42.3   |     56.7    |
  | MBPP        |   29.2   |     59.1    |
  | BoolQ       |   69.4   |     83.3    |
  +-------------+----------+-------------+



  1. Главная ссылка к новости (https://blog.google/technology...)
  2. OpenNews: Открыт код Jina Embedding, модели для векторного представления смысла текста
  3. OpenNews: Представлен OpenXLA, инструментарий для оптимизации и компиляции моделей машинного обучения
  4. OpenNews: Опубликован OpenChatKit, инструментарий для создания чатботов
  5. OpenNews: Первый выпуск открытого AI-бота OpenAssistant, напоминающего ChatGPT
  6. OpenNews: Проект RedPajama развивает открытый набор данных для систем искусственного интеллекта
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/60642-gemma
Ключевые слова: gemma, ai, llm
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (54) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 23:06, 23/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +8 +/
    > При этом условия использования запрещают применение модели для совершения вредоносных действий

    Это несвободное ПО. Я должен иметь право использовать модель для любой цели.

     
     
  • 2.2, Аноним (2), 23:09, 23/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Кто определяет действия вредоносными?
     
     
  • 3.53, Аноним (53), 13:32, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Судья.
     
     
  • 4.75, Антон 19887234 (?), 14:08, 28/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Не судья, а привлеченные эксперты.
    А судья назначает срок.
     
  • 2.7, Аноним (-), 23:59, 23/02/2024 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Напиши свою и используй, делов то.
     
  • 2.29, Петрович69 (?), 10:08, 24/02/2024 Скрыто ботом-модератором     [к модератору]
  • +/
     
  • 2.30, Аноним (-), 10:17, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Это все равно опенсорс - т.к модель открыта.
    То что тебе что-то не нравится - это твои личные трудности.
    Сам выдумал себе какие-то категории "свободы" и теперь бухтишь.

    Любой автор может выбрать ту лицензию какая ему нравится, или придумать свою - это его свобода и выбор.
    Никто мне не может запретить выкладывать код, например, под CC BY-ND.

     
     
  • 3.44, Аноним (1), 11:44, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    опенсорс это не то, что хочет аноним, а то что определено юристами - одно из требований к опенсорсу - возможность использования для любых целей
     
     
  • 4.45, Аноним (-), 11:59, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    И какие юристы определили, что такое опенсорс?
    Возможно ты про определение FSF? Ну так кроме того есть еще определение OSI.
    А еще есть всякие либробуты разной степени упоротости.

    А вот то, что слово Open Source не принадлежит никому - это факт.
    Потому что воришки из OSI даже пытались закопирайтить(!!!) его, но суд им отказал.
    Они даже целый блогпост накалякали, со своим нытьем
    opensource.org/pressreleases/certified-open-source.php

     
  • 4.61, Аноним (61), 19:24, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > опенсорс это

    Открытые исходники. Всё. Остальное уже дело лицензий.

     
  • 2.34, Аноним (34), 10:27, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Помнится, у Гугла по этой же причине были проблемы с жсоном или чем-то там -- лицензия запрещала вредоносные действия.
     
  • 2.62, Аноним (62), 20:00, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    По-моему, так это означает "Можете использовать как хотите, но если поймают, то мы тут вообще ни при чём".
     

  • 1.3, Аноним (3), 23:24, 23/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Уже сравнили с другими моделями - очень слабо
     
     
  • 2.11, Шпиц Шария (?), 00:18, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > Уже сравнили с другими моделями - очень слабо

    Ты же не думаешь, что на шару будут годноту выкладывать?

     
  • 2.31, Аноним (-), 10:20, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    С платными или бесплатными?
    Я конечно понимаю, что любители халявы наглеют с каждым годом.
    Но тут ситуация, почти как в анекдоте про слепую девочку и тазик пельменей:
    гугл бесплатно раздает пирожки с капустой
    вечно ноющее шообщество "а пачиму не с мясом?!"

    В общем бесполезные паразиты меня в очередной раз не разочаровали))


     
     
  • 3.38, Аноним (34), 11:06, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    >паразиты меня

    Ты забыл добавить "вроде" перед "меня". Ну, если пишешь, то не пропускай слова, а то очень коряво выглядит и всем приходится по контексту догадываться, что это ты про себя написал.

     
     
  • 4.41, Аноним (-), 11:16, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Возможно ты не понял фразу.
    Она говорит о том, что "бесполезные паразиты, которые сами ничего не делают, но хотят халявы" в очередной раз меня не разочаровали.
    Но это не очень удивительно, тут я часто встречаю людей, которые вообще слабо понимают происходящее.
     
     
  • 5.43, Аноним (34), 11:30, 24/02/2024 Скрыто ботом-модератором     [к модератору]
  • +/
     
  • 3.47, Аноним (47), 12:21, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну почему ж паразиты? Они выполняют важную функцию в развитии открытого ПО - тестирование. За свой, причем, счет.
     
     
  • 4.70, Минона (ok), 22:49, 25/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Багрепорты пишут единицы.
     
  • 3.56, kusb (?), 16:03, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    У родителей была слепая 10-летняя дочь. Чтобы хоть как-то компенсировать её нелёгкую судьбу, они баловали её, всегда старались купить и достать всё самое лучшее. Но одна странная особенность девочки всё же огорчала родителей. Каждый раз - будь то завтрак, обед или ужин - слепая дочка упрекала родителей в том, что они накладывают себе самую вкусную еду и в большом количестве, а ей - то, что останется, и очень мало. Мол, вы пользуетесь тем, что я ничего не вижу, и потому кидаете мне объедки. Естессно, всё было не так, и родители были обеспокоены такими подозрениями дочери. И вот однажды мать решила посоветоваться с психологом. Он посоветовал ей: "В следующий раз сварите всем пельмени. И дочке навалите этих пельменей целый таз. Она оценит объёмы блюда и поймёт, что вы её не обделили". Радостная мама понеслась домой варить пельмени. Все их вывалила в тазик, поставила на стол и позвала дочку кушать. Слепая девочка с обречённым выражением лица садится за стол, ощупывает таз и огромную гору пельменей со словами: "ПРЕДСТАВЛЯЮ, СКОЛЬКО ВЫ СЕБЕ НАХЕРАЧИЛИ!"
     

  • 1.6, rm_ (ok), 23:58, 23/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • –5 +/
    У всех этих моделей не хватает хауту по запуску, вот у меня есть комп с GPU, он включён и загружена ОС, а дальше пошагово? Открыл страницу этой модели, там начинают с кода на питоне, серьёзно? Мне не вср*лся ваш питон никуда, хочу просто поле ввода промта и показ результатов. Можно в браузере, можно нет.
     
     
  • 2.10, Шпиц Шария (?), 00:16, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +7 +/
    > Мне не вср*лся ваш питон никуда, хочу просто поле ввода промта и показ результатов.

    Для таких как ты есть коммерческие подписки. Ты платишь временем на то, как запустить это без how to, либо деньгами за готовый продукт.

     
  • 2.36, gra (ok), 10:30, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    ollama
     
  • 2.63, Аноним (62), 20:03, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    koboldcpp неплохая штука. Как раз - скачал практически любую мейнстримную модель и можешь запускать.
     

  • 1.9, Шпиц Шария (?), 00:14, 24/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    В чате на huggingface уже есть.
     
  • 1.12, Аноним (12), 00:18, 24/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    >This repository is publicly accessible, but you have to accept the conditions to access its files and content. To access Gemma on Hugging Face, you’re required to review and agree to Google’s usage license. To do this, please ensure you’re logged-in to Hugging Face and click below. Requests are processed immediately.

    Ещё в статье не упомянуто, что чтобы просто даже просмотреть репозиторий, включая текст лицензии на модель, нужно иметь аккаунт на HuggingFace.co (регистрация через вредоносную фингерпринтинговую псевдокапчу), быть в него залогиненым, и подтвердить согласие с лицензией.

    Это дискриминация, слежка и KYC-процедура, уничтожающие "опенсорс" (потому что с ограничением по использованию — это не опенсорс).

     
     
  • 2.14, Шпиц Шария (?), 00:22, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Эта модель для разработчиков, которые ужа давно имеют учётки на hf. И вообще тебе никто ничем не обязан.
     
     
  • 3.16, Аноним (12), 00:24, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    DMCA и Бёрнскую конвенцию никто тоже соблюдать не обязан.
     
     
  • 4.26, Sw00p aka Jerom (?), 09:04, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    можешь сразу забыть, что родился человеком :)
     
  • 4.33, Аноним (-), 10:27, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Не соблюдай.
    Будешь жить в обществе таких же несоблюдателей.
    Думаю софт серверное кореи и ирана тебе легко заменит софт от соблюдателей dmca.
     
  • 2.15, Аноним (12), 00:23, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    За сим считаю, что нужно распространять через IPFS, Freenet и магнит-ссылки протокола Bit Torrent второй версии склонированные репозитории в виде 7-zip архивов. И зеркалить их на другие платформы.
     
     
  • 3.18, Аноним (18), 01:15, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    К слову: https://ai.google.dev/gemma/terms не требует реализовывать KYC и выдачу моделей только принявшим лицензию, и разрешает распространять. Так что засунуть скачанный с HF архив в торрент по идее полностью легально, если в самих репозиториях не указанно иначе.
     
  • 2.32, Аноним (-), 10:24, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Это дискриминация, слежка и KYC-процедура, уничтожающие "опенсорс" (потому что с ограничением по использованию — это не опенсорс).

    Тебе что-то не нравится - проходи мимо.
    Не нужно тут вонять про "это не опенсорс".
    То что пачка поехавших комми придумала какие-то "свои особенные" определения опенсорса, не делает их ценными.

    Open Source - это открытый код. И все - ни больше, ни меньше.

     
     
  • 3.40, Бывалый Смузихлёб (ok), 11:15, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Open Source - это открытый код. И все - ни больше, ни
    > меньше.

    С подобным подходом и у микрософта код винды открытый. Для тех кого надо, правда.
    А причём тут абстрактные комми - так и осталось неясным. Будто паршивый перевод англоязычного коммента с какого-нибудь говнореддита от тех, кого чуть ли не с детства запугивали абстрактными коммунистами( которые не за что-то конкретное, а просто за всё то что тебе не нравится и против всего того что тебе нравится )


     
     
  • 4.46, Аноним (-), 12:09, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > С подобным подходом и у микрософта код винды открытый. Для тех кого надо, правда.

    Я тебя возможно удивлю, но ГПЛ лицензия обязывает предоставлять код только тем, кто легально получил бинарник.

    > А причём тут абстрактные комми - так и осталось неясным.

    Хм... почему абстрактные?
    Вполне реалные - Столлман и его секта например. Можно почитать его манифест и найти там весьма интересное.
    Предложения типа "а давайте запретим платить программерам большие ЗП", "давайте введем налог на железо", "давайте создадим Гос. министерство которое будет определять проекты и распределять деньги", ну и вишенка сверху "давайте наказывать тех кто не проникся нашими идеями".

     
     
  • 5.57, Бывалый Смузихлёб (ok), 16:52, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    всё это... противоречит исходному комменту

    столлман - это столлман, а не коммунист. Разумеется, даже в СССР, даже при коммунизме( хотя он если и был, то военный и даже не декларировался в названии в отличие от социализма и "советов", смысл которых сейчас вообще почти не понимают. напомню, Союз Советских Социалистических Республик. Видишь коммунизм ? )

    Продвинутым профи не столько платили именно деньги( в СССР ), сколько предлагали тонны социалки, а именно:
    Не-оплата ипотеки на 10-15-50 лет, а тупо предоставление жилья в собственность. Если хочешь - то частного дома с куском земли. Живи и кайфуй, мб даже кур-свиней сезонно разводи. Заселяйся и живи вкайф и делай свои дела, ты ведь профи!
    Кто одинок( без бабы или мужика ) - тому место в общаге. Практически халявное. Если с кем-то породнится - то см пункт про жильё.

     
     
  • 6.60, Аноним (61), 19:20, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > кур-свиней сезонно разводи

    сегодня даже кур чтобы разводить нужно тонну бумажек получить в виде согласия соседей, ветеринарных справок и т.д.

     
  • 6.73, Аноним (73), 23:06, 26/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > а тупо предоставление жилья в собственность

    Нет
    Собственности на жилье не было вообще
    Жилье предоставляли в найм, в собственность его отдал ненавистный вам Ельцин
    А при совке давали в найм и спокойно выселяли если человек увольнялся с завода, просто давали 72 часа на то что бы покинуть квартиру и плевать есть ли у тебя куда
    Вот такой реальный был союз, а не выдуманный

     
     
  • 7.74, anonymous (??), 20:16, 27/02/2024 Скрыто ботом-модератором     [к модератору]
  • –1 +/
     

  • 1.13, Аноним (12), 00:20, 24/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    >Поддержка работы с моделями Gemma уже добавлена в инструментарии

    llama.cpp не упомянули — она там из коробки. сам гугл добавил и модель в него сконвертил.

     
  • 1.20, Аноним (20), 03:00, 24/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > условия использования ... предписывают по возможности использовать в своих продуктах самую свежую версию Gemma.

    Всё читал и думал, гдеж подстава-то. А вона оно где. Плохо это. Впрочем, это ж Хухл.

     
     
  • 2.42, Аноним (42), 11:26, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    >4.1 Updates
    >Google may update Gemma from time to time, and you must make reasonable efforts to use the latest version of Gemma.

    Это чтобы обязать пользователей быть подверженными самой последней версии встроенной в модель цензуры и дезинформации.

     
     
  • 3.59, Аноним (-), 17:45, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > Это чтобы обязать пользователей быть подверженными самой последней версии встроенной в модель цензуры и дезинформации.

    Вы видимо даже отдалённо не представляете как работают AI такого типа, раз пишете подобную ересь.

     
     
  • 4.64, Аноним (62), 20:05, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Да вот прекрасно туда встраивают цензуру. Вас, видимо, вчерашний шторм с генерацией картинок в (как раз) гугловской модели не разбудил.
     
     
  • 5.65, Аноним (65), 20:21, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Так анон наверное писал не про коммерческий зацензуренный мусор, который годится разве что для обсуждения и рисования котиков, а про открытые модели, которые могут работать локально. Я вот такие использую для серых и черных схем (уж извините за прямоту) с полным отсутствием цензуры.
     

  • 1.22, Аноним (22), 03:25, 24/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А генерация правил блокировки рекламы от Гугля, по мнению Гугля, считается "вредоносным действием"?
     
     
  • 2.58, Аноним (-), 17:43, 24/02/2024 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > А генерация правил блокировки рекламы от Гугля, по мнению Гугля, считается "вредоносным действием"?

    Обычно с блокировщиками сидят только немолодые и небогатые люди на устаревшем железе. Такие априори неинтересны гуглу из-за своей неплатежеспособности. У 99% остальных, реклама, зонды и куки включены по-умолчанию и на максимум.

     
     
  • 3.66, Аноним (66), 08:24, 25/02/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Обычно с блокировщиками сидят только немолодые и небогатые люди на устаревшем железе.

    Откуда такие сведения?

    Из общих соображений - умение ограничивать входящий поток ненужной информации резко повышает эффективность любой интеллектуальной деятельности.

    А если эта деятельность хоть чуть-чуть направлена на зарабатывания денег, то повышается эффективность зарабатывания денег.

     

  • 1.67, S22 (?), 10:49, 25/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Gemma - кровь. Как бы намекает, чего хочет ИИ.
     
     
  • 2.69, Анонус (?), 13:27, 25/02/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > Ге́мма (лат. gemma — «глазок», почка на виноградной лозе)

    А гемо-  от греческого αἷμα (айма или хайма).

     

  • 1.71, Минона (ok), 22:52, 25/02/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Поздно гуглик спохватился и пытается запрыгнуть в уходящий поезд.
     
  • 1.76, Прадед (?), 02:23, 01/03/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Молодцы гугловозы, решили подорвать рынок, хароший ход
     
  • 1.78, Аноним (78), 01:38, 03/03/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Я просто оставлю это здесь: https://arxiv.org/pdf/2402.11753
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру