LongMem — ответ Microsoft на неограниченную длину контекста

Новая структура совершит революцию в моделях ИИ.

  • Фреймворк позволяет иметь неограниченную длину контекста.
  • Неограниченная длина контекста означает более персонализированный разговор с моделями ИИ.
  • По сути, это следующий шаг ИИ к полному приближению к человеку.
майкрософт лонгмем

Microsoft была в авангарде обучения ИИ и инструментов ИИ в целом. Copilot появится в Windows 11 очень скоро, как часть обновлений Windows. ИИ проникает в Microsoft Teams с интеллектуальное резюме, помогающее людям работать легче.

Bing также является одним из самых интересных инструментов искусственного интеллекта., а его функции позволяют оптимизировать как вашу работу, так и вашу навигацию в Интернете.

Но ранее на этой неделе Microsoft также представила, что Orca 13B скоро станет открытым исходным кодом. Orca 13B — это небольшая модель ИИ, которая работает с тем же качеством и скоростью, что и другие модели ИИ, такие как ChatGPT.

Теперь, в битве ИИ и исследований ИИ, Microsoft предлагает LongMem, гипотетическая структура и языковая модель ИИ.

Согласно этой ветке Reddit, LongMem допускает неограниченную длину контекста при уменьшенном использовании памяти GPU и CPU. Все это делается на более высокой скорости.

Microsoft Research предлагает новую структуру LongMem, позволяющую использовать неограниченную длину контекста, а также уменьшать использование памяти графического процессора и повышать скорость логического вывода. Код будет открытым
к ты/ламаШилл в МестнаяLLaMA

Является ли LongMem ответом Microsoft для неограниченной длины контекста?

Итак, чтобы понять, что значит иметь неограниченную длину контекста, нам сначала нужно понять, что означает длина контекста?

Длина контекста относится к количеству токенов (слов, знаков и т. д.), разрешенных моделью, ее вводом и выводом, а также вашим.майкрософт лонгмем

Например, ChatGPT имеет ограниченное количество токенов, что означает, что длина его контекста также ограничена. Как только ChatGPT преодолеет этот предел, все непрерывное взаимодействие, которое у вас было с ним до этого момента, потеряет всякое значение. Или, лучше сказать, он будет сброшен.

Так что, если вы начинаете разговор с ChatGPT на тему Windows, и этот разговор длится дольше, чем ограниченный контекст длины, то инструмент ИИ потеряет контекст и либо начнет отклоняться от темы, либо весь разговор перезагрузить.

Неограниченная длина контекста гарантирует, что этого не произойдет, а модель ИИ будет продолжать отвечать вам по теме, а также изучать и адаптировать информацию, когда вы говорите ей о Windows.

Это означает, что модель ИИ также будет персонализировать разговор в соответствии с вашим вводом, поэтому контекст должен иметь неограниченную длину.

Как работает LongMem?

Microsoft обещает именно это своим новым исследованием фреймворка LongMem. LongMem позволит большим языковым моделям запоминать долгосрочные контексты и использовать долговременную память при сниженной мощности процессора.

Фреймворк состоит из замороженной большой языковой модели в качестве кодировщика памяти, остаточной боковой сети. как средство извлечения и чтения памяти, а также кэшированный банк памяти, в котором хранятся пары ключ-значение из прошлых контексты.

В исследовании, проведенном Microsoft, эксперименты показывают, что LongMem превосходит базовые показатели в моделировании длинного текста, понимании длинного контекста и задачах обучения в контексте с дополненной памятью. Кроме того, долговременная память позволяет использовать больше демонстрационных примеров для лучшего обучения.

И хорошая новость заключается в том, что LongMem будет с открытым исходным кодом. Таким образом, вы сможете изучить его и узнать, как внедрить фреймворк в свою собственную модель ИИ. Вы можете проверить его профиль GitHub здесь.

И если вам интересно прочитать всю исследовательскую работу по фреймворку, зайди сюда и посмотри.

Что вы думаете об этом новом технологическом прорыве? Изменит ли это то, как работают модели ИИ? Не забудьте сообщить нам свои мысли и мнения ниже.

Microsoft ускоряет научные открытия с помощью DeepSpeed4Science

Microsoft ускоряет научные открытия с помощью DeepSpeed4ScienceMicrosoft

DeepSpeed4Science занимается различными темами естественных наук, от изменения климата до лечения болезней.Инициатива уже работает над различными проектами, от погоды до молекулярной биологии.Как в...

Читать далее
Outlook получает новый интерфейс обратной связи, включая инструкции по устранению проблем.

Outlook получает новый интерфейс обратной связи, включая инструкции по устранению проблем.MicrosoftПерспективы

Новый опыт обратной связи позволит вам искать похожие отзывы и решения.Внедрение запланировано на октябрь 2023 года.Новый интерфейс позволит вам найти похожие отзывы, обходные пути и инструкции по ...

Читать далее
Microsoft Purview получает новую страницу отчетов для предотвращения кражи IP

Microsoft Purview получает новую страницу отчетов для предотвращения кражи IPMicrosoftКибербезопасность

Новая страница отчетов появится в Purview в январе 2024 года.Предварительный просмотр этой функции состоится позднее в этом месяце.Он станет общедоступным в 2024 году.Новая страница отчетов облегчи...

Читать далее