Как устроены малые языковые модели и в чем их преимущества перед большими?

РБКHi-Tech

SLM схватывают на лету

Как устроены малые языковые модели и в чем их преимущества перед большими моделями

Автор: Сергей Лукашкин, к. ф.-м. н., эксперт по цифровой трансформации, ранее работал в научно-образовательном центре «Цифровые технологии в образовании» ВШМ СПбГУ

Справка от ChatGPT

SLM (Small Language Model) — в сфере ИИ это языковая модель с ограниченным числом параметров, предназначенная для обработки и предсказания слов или фраз в контексте предыдущих слов. Основная цель SLM — предсказать следующее слово или последовательность слов, исходя из предыдущего контекста. Такие модели используют методы машинного обучения для анализа текста и могут быть обучены на больших корпусах данных для повышения точности предсказаний. SLM широко применяются в задачах обработки естественного языка, например в системах автозамены, автодополнения, в машинном переводе, распознавании речи и генерации текста.

Что такое SLM и LLM

Малые языковые модели, в отличие от больших языковых моделей (LLM), обученных на огромных массивах данных, используют небольшие объемы информации, но лучшего качества, поэтому работают точнее.

Четкого разделения между LLM и SLM пока что нет. Одни относят к большим языковым моделям те, что работают с 100 млн и более параметров, а к малым — от 1 млн до 10 млн. Другие называют цифры 100+ млрд и 10 млрд соответственно. Но речь идет не только о числе параметров, но и объеме данных, физических размерах и нейронной архитектуре. Если упростить, то малая языковая модель — это та, что требует в разы меньше ресурсов при обучении и анализе данных, чем большая.

O'qishni davom ettirish uchun tizimga kiring. Bu tez va bepul.

Roʻyxatdan oʻtish orqali men foydalanish shartlari 

Tavsiya etilgan maqolalar

«Я очень скупой на оценки» «Я очень скупой на оценки»

Какова цена входа в виноделие и стоит ли обижаться на оценки в гиде

РБК
От Шагала до мурала От Шагала до мурала

Арт-маршрут от Ниццы до Перпиньяна, достойный целых каникул

Y Magazine
Дейнотерий – слон с берегов Дона Дейнотерий – слон с берегов Дона

Слоны – одни из самых стабильных в эволюционном плане животных...

Наука и техника
Рыбный день Рыбный день

Рыба — один из древнейших символов в ювелирном искусстве...

Y Magazine
Сезон слабого зернового экспорта Сезон слабого зернового экспорта

Основная причина сокращения поставок зерна по итогам сезона 2024/25

Агроинвестор
Изумрудный истребитель Изумрудный истребитель

Какой рыбак не знает зимородка, этого красавца в изумрудно-синем камзоле?

Наука и жизнь
«Эффект коктейля» для керамических покрытий «Эффект коктейля» для керамических покрытий

Керамика на основе карбида гафния и карбида циркония для агрессинвых сред

Наука и жизнь
Культура всегда со страной Культура всегда со страной

Разговор с директором Эрмитажа о роли, которую играют сейчас музеи

Знание – сила
Земля на стыке гипотез Земля на стыке гипотез

Земля в процессе своего развития расширялась или сжималась?

Знание – сила
Откуда что пошло на флоте Откуда что пошло на флоте

Повседневная жизнь на парусном военном корабле XVIII века

Наука и техника
Буль-буль Буль-буль

Фантастический рассказ Владислава Кулигина «Буль-буль»

Знание – сила
Просто красота Просто красота

Дизайнер Кристиан Гранде — о творческом пути в яхтенном дизайне

Y Magazine
Чёрные мысли на белом снегу Чёрные мысли на белом снегу

Рассказ Елены Ворон «Чёрные мысли на белом снегу»

Наука и жизнь
Узорочье древних славянок Узорочье древних славянок

Древняя мода: как выглядела одежда на Руси до XIII века

Знание – сила
Кадровый агропотенциал Кадровый агропотенциал

Роль государства и бизнеса в решении проблемы дефицита персонала

Агроинвестор
Okean в океане Okean в океане

Актуальная модельная линейка Okean интересного бренда Okean Yachts

Y Magazine
Пустые кресла и забытые письма: одиночество как экспонат Пустые кресла и забытые письма: одиночество как экспонат

Мы приезжаем в музей смотреть не на экспонаты, а внутрь себя

Знание – сила
Архив богини Фауны Архив богини Фауны

Зоологический музей Московского университета – «отражение самой природы»

Знание – сила
Как молния выбирает цель Как молния выбирает цель

Как молния находит молниеотвод среди множества других привлекательных целей?

Наука и жизнь
Про пропан Про пропан

Если газ сжиженный, то он всё-таки ещё газ или уже жидкость?

Наука и жизнь
Круизы: новая глава Круизы: новая глава

Rei — проект 196‑метровой круизной яхты от конгломерата Viken Group

Y Magazine
Величавый коровяк Величавый коровяк

Величавый коровяк: высокий, стройный, мощный, прочно вросший в землю

Наука и жизнь
Скелетные мышцы самолета – система управления Скелетные мышцы самолета – система управления

Зачем самолетам демпферы, гидроусилители, закрылки и предкрылки?

Наука и техника
Посвящено Беатриче Посвящено Беатриче

Данте обнаружил, осознал, как мало он знает

Наука и жизнь
О пользе «бумажной волокиты» О пользе «бумажной волокиты»

На каком языке говорили евреи, вернувшиеся из вавилонского пленения?

Знание – сила
«Мы уже не живем в своей колыбели» «Мы уже не живем в своей колыбели»

Чем дышит и живет Институт космических исследований РАН?

Знание – сила
О колокольчиках в саду О колокольчиках в саду

Оказывается, не все колокольчики голубые и не у всех венчики похожи на колокола

Наука и жизнь
Банановые перспективы российских субтропиков Банановые перспективы российских субтропиков

Инвесторы хотят импортозаместить экзотические фрукты

Агроинвестор
Эра литий-ионных аккумуляторов Эра литий-ионных аккумуляторов

Почему ученые трудятся над тем, чтобы повысить безопасность батареек

Наука и техника
Вьетнамский вклад в импортозамещение Вьетнамский вклад в импортозамещение

Концерн TH Group открыл завод по переработке молока в Калужской области

Агроинвестор
Открыть в приложении