A Microsoft apresentou o modelo de linguagem pequena Phi-3-Silica para PCs Copilot Plus

Após a apresentação do modelo compacto de IA Phi-3-vision, a Microsoft apresentou na conferência anual Microsoft Build 2024 outro modelo de linguagem pequena (SLM) Phi-3-Silica, que será usado em computadores da classe Copilot Plus PC. Esses PCs são equipados com chips que possuem uma unidade de processamento neural (NPU) integrada que permite recursos locais baseados em IA.

Fonte da imagem: Pixabay

Este é o menor de todos os modelos da família Phi-3, com 3,3 bilhões de parâmetros. A família Phi-3 também inclui o modelo Phi-3-mini com 3,8 bilhões de parâmetros, Phi-3-vision (4,2 bilhões de parâmetros), Phi-3-small (7 bilhões de parâmetros) e Phi-3-medium (14 bilhões de parâmetros). ).

Espera-se que os primeiros laptops da marca Copilot Plus PC com Phi-3-Silica integrado estejam à venda em junho deste ano. Segundo a Microsoft, o Time to first token (TTFT) do Phi-3-Silica é de 650 tokens por segundo, e durante a operação o modelo consome cerca de 1,5 W, liberando a potência do processador e acelerador gráfico do PC para processar outros cálculos. Ao gerar tokens, o modelo reutiliza o cache KV NPU, a própria geração é realizada na CPU a uma velocidade de aproximadamente 27 tokens por segundo.

«Os modelos Phi-3 superam significativamente os modelos de linguagem de tamanhos iguais e maiores nas principais métricas. “Phi-3-mini tem desempenho melhor do que modelos com o dobro de seu tamanho, e Phi-3-small e Phi-3-medium superam modelos muito maiores, incluindo o GPT-3.5T”, disse a Microsoft.

avalanche

Postagens recentes

A Suprema Corte dos EUA impediu a Sony de processar seu provedor de serviços de internet por auxiliar piratas.

A Suprema Corte dos EUA decidiu que os provedores de serviços de internet não podem…

42 minutos atrás

A NASA reconheceu que as empresas privadas não estão preparadas para construir estações espaciais e seguirão o caminho da Roscosmos.

A futura estação orbital russa será construída na ISS e, posteriormente, separada dela para operar…

1 hora atrás

Ilusão do Autopilot: o serviço da Tesla não é um robotáxi, dizem autoridades da Califórnia.

Em junho passado, a Tesla lançou seu tão prometido serviço de robotáxi perto de sua…

1 hora atrás

A DJI apresenta o drone compacto Avata 360 com visibilidade panorâmica em 8K.

A DJI, maior fabricante chinesa de drones civis, apresentou o Avata 360. Ele oferece vídeo…

2 horas atrás

Gartner: Até 2030, o custo da inferência diminuirá em 90%, mas a IA de alta qualidade não ficará mais barata.

Segundo a previsão da Gartner, até 2030, a inferência de modelos de aprendizado de máquina…

2 horas atrás