Microsoft e Nvidia estão facilitando a execução de modelos de IA no Windows

A Microsoft e a Nvidia querem ajudar os desenvolvedores a executar e configurar modelos de IA em PCs com Windows. Durante o evento Microsoft Ignite na quarta-feira, Microsoft anunciou Windows AI Studio: um novo hub onde os desenvolvedores podem acessar e modificar modelos de IA para atender às suas necessidades.

O Windows AI Studio permite que os desenvolvedores acessem ferramentas e modelos de desenvolvimento do Azure AI Studio existente e de outros serviços como o Hugging Face. Ele também fornece “configuração de espaço de trabalho guiada” de ponta a ponta com uma interface de usuário para configuração de modelo e instruções para ajustar vários modelos de linguagem pequena (SLMs), como Phi da Microsoft, Llama 2 da Meta e Mistral.

O Windows AI Studio também permite que os desenvolvedores testem o desempenho de seus modelos usando modelos Prompt Flow e Gradio. A Microsoft afirma que lançará o Windows AI Studio como uma extensão do Visual Studio Code nas “próximas semanas”.

A Nvidia, da mesma forma, Atualizações reveladas Ao TensorRT-LLM, que a empresa lançou inicialmente para Windows como uma forma de executar grandes modelos de linguagem (LLMs) com mais eficiência em GPUs H100. No entanto, esta atualização mais recente traz o TensorRT-LLM para PCs que executam GPUs GeForce RTX séries 30 e 40 com 8 GB ou mais de RAM.

Além disso, a Nvidia em breve tornará o TensorRT-LLM compatível com a API de bate-papo da OpenAI por meio de um novo wrapper. Isso permitirá que os desenvolvedores executem LLMs localmente em seus computadores, o que é ideal para aqueles interessados em armazenar dados privados na nuvem. A Nvidia diz que o próximo lançamento do TensorRT-LLM 6.0 adicionará inferência até cinco vezes mais rápida, bem como suporte para os novos modelos Mistral 7B e Nemotron-3 8B.

Tudo isso faz parte do objetivo da Microsoft em criar Padrão de desenvolvimento de “episódio híbrido”., que supostamente permitirá o desenvolvimento de IA por meio da nuvem e localmente em dispositivos. Com este conceito, os desenvolvedores não precisam depender apenas de seus próprios sistemas para impulsionar o desenvolvimento de IA, pois podem acessar os servidores em nuvem da Microsoft para aliviar a carga de suas máquinas.

Hereward Berrye

“Viciado em TV certificado. Ninja zumbi irritantemente humilde. Defensor do café. Especialista em web. Solucionador de problemas.”

Microsoft e Nvidia estão facilitando a execução de modelos de IA no Windows

Rumor: Diz-se que o Switch 2 é totalmente compatível com versões anteriores de uma tela maior de 1080p

Links do Hackaday: 28 de abril de 2024

Melhores habilidades em Stellar Blade para desbloquear no início do jogo 2024

Visit Portugal apresenta Leitura Fácil com…

Shari Redstone está jogando jogos de guerra de fusões e aquisições com o CEO da Paramount removido

Travis Kelce e Taylor Swift elogiados por serem “tão legais e realistas” no evento de caridade Patrick Mahomes em Las Vegas

O rei dos dinossauros não era um gênio! Cientistas estão jogando água fria na teoria de que o T.Rex era tão inteligente quanto um macaco

Deixe um comentário Cancelar resposta

More Stories