Как устроены малые языковые модели и в чем их преимущества перед большими?

РБКHi-Tech

SLM схватывают на лету

Как устроены малые языковые модели и в чем их преимущества перед большими моделями

Автор: Сергей Лукашкин, к. ф.-м. н., эксперт по цифровой трансформации, ранее работал в научно-образовательном центре «Цифровые технологии в образовании» ВШМ СПбГУ

Справка от ChatGPT

SLM (Small Language Model) — в сфере ИИ это языковая модель с ограниченным числом параметров, предназначенная для обработки и предсказания слов или фраз в контексте предыдущих слов. Основная цель SLM — предсказать следующее слово или последовательность слов, исходя из предыдущего контекста. Такие модели используют методы машинного обучения для анализа текста и могут быть обучены на больших корпусах данных для повышения точности предсказаний. SLM широко применяются в задачах обработки естественного языка, например в системах автозамены, автодополнения, в машинном переводе, распознавании речи и генерации текста.

Что такое SLM и LLM

Малые языковые модели, в отличие от больших языковых моделей (LLM), обученных на огромных массивах данных, используют небольшие объемы информации, но лучшего качества, поэтому работают точнее.

Четкого разделения между LLM и SLM пока что нет. Одни относят к большим языковым моделям те, что работают с 100 млн и более параметров, а к малым — от 1 млн до 10 млн. Другие называют цифры 100+ млрд и 10 млрд соответственно. Но речь идет не только о числе параметров, но и объеме данных, физических размерах и нейронной архитектуре. Если упростить, то малая языковая модель — это та, что требует в разы меньше ресурсов при обучении и анализе данных, чем большая.

O'qishni davom ettirish uchun tizimga kiring. Bu tez va bepul.

Roʻyxatdan oʻtish orqali men foydalanish shartlari 

Tavsiya etilgan maqolalar

От полицейских собак до «умных» хирургов От полицейских собак до «умных» хирургов

Как устроена мировая робототехника и какие модели стали хитами отрасли

РБК
Евпатория Евпатория

Евпатория — город, существующий во многих измерениях

Знание – сила
Павел Воронин: «В ближайшие три года ИИ-решения начнут приносить реальную экономию бизнесу» Павел Воронин: «В ближайшие три года ИИ-решения начнут приносить реальную экономию бизнесу»

Гендиректор МТС Web Services Павел Воронин — об автоматизации и нейросетях

РБК
Чтобы изучать Вселенную, надо выходить в космос Чтобы изучать Вселенную, надо выходить в космос

Институт астрономии РАН запустит УФ-обсерваторию и создаст лунную базу

Наука и жизнь
Быстрее, мощнее, эффективнее Быстрее, мощнее, эффективнее

Как при росте возможностей ИИ снизить его ресурсопотребление

РБК
Что скрывается за модным словом «роялти» ? Что скрывается за модным словом «роялти» ?

Пассивный доход на интеллектуальной собственности: как работает роялти?

Наука и техника
Александр Чулок: «Мы не стараемся угадать будущее, мы хотим его создать» Александр Чулок: «Мы не стараемся угадать будущее, мы хотим его создать»

Прогнозист Александр Чулок — о том, чем станет ИИ для общества в будущем

РБК
Молодой Цезарь Молодой Цезарь

Карьера Цезаря могла бы оборваться, едва начавшись, равно как и его жизнь...

Знание – сила
«Не хрустальная, не развалишься»: токсичные фразы, которыми мать сломает жизнь любой дочери «Не хрустальная, не развалишься»: токсичные фразы, которыми мать сломает жизнь любой дочери

Колкие фразы матери, которые ломают дальнейшую судьбу девочки

VOICE
Убить Лумумбу Убить Лумумбу

Патрис Лумумба был одним из самых мужественных лидеров своего поколения

Знание – сила
Подросток Лимонов. Продолжение Подросток Лимонов. Продолжение

В СССР Лимонов не был диссидентом, но был чужим для советской системы

Esquire
«Дом А. Ф. Лосева» «Дом А. Ф. Лосева»

О том, как создавалась уникальная структура Дома Лосева

Знание – сила
Мост в небесах Мост в небесах

Некоторые современные мосты сооружают только для того, чтобы заинтриговать

Знание – сила
Современные подводные лодки постройки Швеции и Нидерландов Современные подводные лодки постройки Швеции и Нидерландов

Швеция и Нидерланды: как изменилась отечественная школа подводного судостроения

Наука и техника
Космическая пыль в междупланетном пространстве Космическая пыль в междупланетном пространстве

Наука в годы войны: астроном Фесенков об астероидах и космической пыли

Наука и жизнь
Дрофа – степной реликт Дрофа – степной реликт

Все ли знают о самой крупной птице России? Это дрофа

Знание – сила
Мысль как вечное движение, – или «Что такое интеллигенция»… Мысль как вечное движение, – или «Что такое интеллигенция»…

Беседа с Константином Кедровым о немецком философе Гегеле

Знание – сила
Когда ещё был лес… Когда ещё был лес…

Рассказ Саши Тэмлейн «Когда ещё был лес…»

Наука и жизнь
Жизнь и открытия Степана Куторги: от классиков до звероящеров Жизнь и открытия Степана Куторги: от классиков до звероящеров

«Удивительные ошибки» гения: как российский ученый открыл звероящеров

Наука и техника
Есть ли жизнь на Марсе? Есть ли жизнь на Марсе?

Пройдемся по имеющимся фактам в вопросе о жизни на Марсе

Наука и техника
Наука в фантастике: эпизоды истории Наука в фантастике: эпизоды истории

Сказочная повесть — фантастика с просветительской задачей

Наука и жизнь
Жабрей и зябра, они же пикульники Жабрей и зябра, они же пикульники

Пикульники — настоящие джентльмены среди растения, хотя и каждый со своим нравом

Наука и жизнь
Безмолвный пациент, или вакцинация в аквакультуре Безмолвный пациент, или вакцинация в аквакультуре

Кто, как и зачем вакцинирует рыб в аквахозяйствах?

Наука и жизнь
О колокольчиках в саду О колокольчиках в саду

Оказывается, не все колокольчики голубые и не у всех венчики похожи на колокола

Наука и жизнь
Эра литий-ионных аккумуляторов Эра литий-ионных аккумуляторов

Почему ученые трудятся над тем, чтобы повысить безопасность батареек

Наука и техника
Карманные мозги, что управляют всем: микроконтроллеры от первых 4-бит до IoT-революции Карманные мозги, что управляют всем: микроконтроллеры от первых 4-бит до IoT-революции

История микроконтроллеров от их зарождения до современных тенденций

Наука и техника
Узорочье древних славянок Узорочье древних славянок

Древняя мода: как выглядела одежда на Руси до XIII века

Знание – сила
Скелетные мышцы самолета – система управления Скелетные мышцы самолета – система управления

Зачем самолетам демпферы, гидроусилители, закрылки и предкрылки?

Наука и техника
Культура всегда со страной Культура всегда со страной

Разговор с директором Эрмитажа о роли, которую играют сейчас музеи

Знание – сила
Вьетнамский вклад в импортозамещение Вьетнамский вклад в импортозамещение

Концерн TH Group открыл завод по переработке молока в Калужской области

Агроинвестор
Открыть в приложении