O maior modelo de linguagem poderoso treinado pela Microsoft e NVIDIA

  • Uma colaboração entre a Microsoft e a NVIDIA levou ao nascimento da maior e mais poderosa linguagem baseada em IA da atualidade.
  • As duas empresas trabalharam em inúmeras inovações antes de uma descoberta.
  • A linguagem é alimentada por IA e se origina de uma série de testes.

A Microsoft e a NVIDIA anunciaram hoje que treinaram com sucesso a maior e mais poderosa linguagem até hoje. O Megatron-Turing Natural Language Generation (MT-NLP) foi criado para ser o sucessor dos modelos Turing NLG 17B e Megatron-LM das empresas.

O MT-NLP tem 530 bilhões de parâmetros com a capacidade de um amplo conjunto de tarefas de linguagem natural. Segundo as duas empresas, também possui capacidades de compreensão, raciocínio e linguagem natural.

Primeira descoberta

As duas empresas trabalharam no passado em várias inovações, mas esta é considerada a mais poderosa.

A qualidade obtida é um passo significativo na jornada de desbloquear a IA em linguagem natural. As duas inovações DeepSpeed ​​e Megatron-LM serão as principais beneficiárias do desenvolvimento do modelo de IA e abrirão o caminho para que grandes modelos de IA sejam acessíveis e mais rápidos de treinar.

A Microsoft treina um modelo de linguagem no estilo GPT3 de 530 bilhões de parâmetros. Este é o maior LM existente. (Há também o misterioso modelo MOE multimodal 1,5 trilhão + 'Wu Dao', mas pouco se sabe sobre ele). Microsoft treina no conjunto de dados 'The Pile'. https://t.co/md03QzqlxA

- Jack Clark (@jackclarkSF) 11 de outubro de 2021

Treinamento

O treinamento ocorreu em 560 servidores Nvidia DGX A100, com 8 GPUs Nvidia A100 de 80 GB cada.

Embora o MT-NLP tenha a capacidade de inferir operações matemáticas básicas, ele não é totalmente preciso. No entanto, supera a memorização e pode completar tarefas.

Tais modelos são cruciais para amplificar os vieses presentes nos dados em que são treinados.

Embora a Microsoft reconheça que houve desafios, ela está empenhada em enfrentá-los, estabelecendo marcos contínuos por meio de pesquisas contínuas e, ao mesmo tempo, minimizando possíveis danos aos usuários.

Por enquanto, os usuários podem aproveitar os marcos conquistados enquanto esperamos para ver o que vem por aí.

O que você acha da colaboração entre a Microsoft e a NVIDIA? Você tem alguma expectativa? Deixe-nos saber na seção de comentários abaixo.

Novo Cyberpunk 2077 DLC e série de anime supostamente chegando em 2022

Novo Cyberpunk 2077 DLC e série de anime supostamente chegando em 2022Miscelânea

Todos os fãs do Cyberpunk 2077 têm muito pelo que esperar em 2022.Rumores mostram que um novo DLC massivo está em andamento para o título popular.Aparentemente, o jogo também receberá um patch prin...

Consulte Mais informação
A Microsoft corrige problemas de acessibilidade na atualização mais recente do OneDrive

A Microsoft corrige problemas de acessibilidade na atualização mais recente do OneDriveMiscelânea

A Microsoft atualizou seu aplicativo OneDrive para iOS e corrigiu vários problemas com o recurso VoiceOver.A atualização também inclui uma série de melhorias na estabilidade e desempenho e deve res...

Consulte Mais informação
Os arquivos do Office ficarão mais acessíveis a partir do Explorador de Arquivos e do menu Iniciar

Os arquivos do Office ficarão mais acessíveis a partir do Explorador de Arquivos e do menu IniciarMiscelânea

Há cerca de três anos, a empresa de tecnologia Redmond fez algumas alterações na caixa de pesquisa do File Explorer e permitiu que os usuários pesquisassem seu armazenamento em nuvem OneDrive e arq...

Consulte Mais informação