A Microsoft apresentou o modelo de linguagem pequena Phi-3-Silica para PCs Copilot Plus

Após a apresentação do modelo compacto de IA Phi-3-vision, a Microsoft apresentou na conferência anual Microsoft Build 2024 outro modelo de linguagem pequena (SLM) Phi-3-Silica, que será usado em computadores da classe Copilot Plus PC. Esses PCs são equipados com chips que possuem uma unidade de processamento neural (NPU) integrada que permite recursos locais baseados em IA.

Fonte da imagem: Pixabay

Este é o menor de todos os modelos da família Phi-3, com 3,3 bilhões de parâmetros. A família Phi-3 também inclui o modelo Phi-3-mini com 3,8 bilhões de parâmetros, Phi-3-vision (4,2 bilhões de parâmetros), Phi-3-small (7 bilhões de parâmetros) e Phi-3-medium (14 bilhões de parâmetros). ).

Espera-se que os primeiros laptops da marca Copilot Plus PC com Phi-3-Silica integrado estejam à venda em junho deste ano. Segundo a Microsoft, o Time to first token (TTFT) do Phi-3-Silica é de 650 tokens por segundo, e durante a operação o modelo consome cerca de 1,5 W, liberando a potência do processador e acelerador gráfico do PC para processar outros cálculos. Ao gerar tokens, o modelo reutiliza o cache KV NPU, a própria geração é realizada na CPU a uma velocidade de aproximadamente 27 tokens por segundo.

«Os modelos Phi-3 superam significativamente os modelos de linguagem de tamanhos iguais e maiores nas principais métricas. “Phi-3-mini tem desempenho melhor do que modelos com o dobro de seu tamanho, e Phi-3-small e Phi-3-medium superam modelos muito maiores, incluindo o GPT-3.5T”, disse a Microsoft.

avalanche

Postagens recentes

Sob a liderança de Lip-Bu Tan, a Intel nunca conseguiu se livrar de seus problemas centrais.

O impressionante desempenho das ações da Intel este ano pode dar a impressão de que…

1 hora atrás

Drones e roteadores cuja importação para os EUA é proibida poderão receber atualizações de segurança até janeiro de 2029.

Em determinado momento, as autoridades americanas decidiram que drones e roteadores de internet importados da…

1 hora atrás

Heróis de Poder e Magia: Era Antiga – Uma Época de Auge

Intel Core i3-10300 3.7 GHz / AMD Ryzen 3 3100 3.6 GHz, 8 GB de…

2 horas atrás

A guerra no Oriente Médio agravou a escassez de materiais de construção e componentes para centros de dados.

O conflito em curso no Oriente Médio, devido ao fechamento do Estreito de Ormuz, exacerbou…

3 horas atrás

A Mitsubishi Heavy Industries está modernizando sua produção de turbinas a gás para atender à demanda de operadores de data centers com inteligência artificial.

A Mitsubishi Heavy Industries (MHI), fabricante japonesa de turbinas a gás, anunciou uma modernização de…

4 horas atrás