Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Yandex está procurando treinadores para treinar YandexGPT para traduzir texto de imagens, arquivos de áudio e vídeo

A rede neural YandexGPT será ensinada a reconhecer e traduzir texto de imagens, arquivos de áudio e vídeo, escreve Vedomosti com referência à descrição do trabalho de um treinador de IA publicada no site da empresa Yandex. Segundo fonte de recursos próxima à Yandex, está prevista a contratação de cerca de uma dezena de especialistas nesse perfil.

Fonte da imagem: geralt/Pixabay

Conforme indicado na descrição do trabalho, as responsabilidades do formador incluem treinar o modelo generativo criando os seus próprios exemplos de referência, bem como avaliar a qualidade da tradução e treinar a rede neural para reconhecer e traduzir texto de imagens e vídeos.

No início de 2023, a Yandex anunciou um conjunto de treinadores de IA para modelos de treinamento da família YandexGPT, lembrou um representante da empresa. Mas se naquela época contratavam especialistas na área de humanidades que pudessem trabalhar com textos em língua russa, agora estamos falando de especialistas que se orientam em temas altamente especializados para aprofundar especificamente seu conhecimento do modelo de IA. Por exemplo, eles devem compreender a terminologia de uma variedade de campos – da física ao direito, disse um representante da Yandex.

Alexey Khakhunov, CEO da Dbrain e autor do canal AI Happens Telegram, observou que no aprendizado de máquina os critérios mais importantes são a pureza e a qualidade dos dados. Segundo Khakhunov, o treinamento de modelos modernos requer dois tipos de especialistas: neurolinguistas que sabem como funcionam as redes neurais e podem criar algoritmos modernos, principalmente traduções automáticas, e especialistas fluentes em vários idiomas, o que lhes permite criar pares entre diferentes idiomas.

Neste caso, é necessário não fazer uma tradução literal, mas sim coletar tipos de traduções semanticamente semelhantes. “As mesmas frases podem ter significados diferentes em idiomas diferentes, e é importante que o tradutor confie em um conhecimento profundo do idioma, e não em uma tradução literal”, explicou o especialista.

O especialista da Aliança de Inteligência Artificial, Andrei Komissarov, concordou com ele, segundo quem o problema é que, em um grande número de idiomas, as redes neurais fazem traduções literais porque não percebem as sutilezas da linguagem e não podem trabalhar com unidades fraseológicas. “Neste caso estamos falando de treinamento adicional do modelo. Isso requer um senso de linguagem”, observou ele.

Agora as coisas estão indo de forma diferente para as redes neurais com tradução. “Se a máquina consegue lidar mais ou menos com o idioma inglês, então, no caso do chinês, se você traduzir o texto de um lado para o outro, ele se transformará em um conjunto incoerente de palavras”, disse Komissarov.

avalanche

Próximo Computador de placa única Raspberry Pi 5 lançado com 2 GB de RAM e custando US$ 50 »

Anterior « Waymo mostrou um robotáxi espaçoso e barato da “geração 6”

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Jogos

Life is Strange: Reunion – O desespero leva ao sucesso. Análise / Jogos

Jogado no PlayStation 5 Quando Life is Strange: Double Exposure foi lançado, parecia que a…

3 horas atrás

Jogos

O diretor criativo da Naughty Dog deixou os fãs curiosos com uma foto de sua viagem de negócios — a imagem parece ser uma prévia de Uncharted 5.

Lançados em 2016 e 2017, Uncharted 4: A Thief's End e Uncharted: The Lost Legacy…

5 horas atrás

Carros, motos, veículos

O avião sem leme X-65 da Boeing está um passo mais perto de voar — ele será controlado por correntes de ar.

A Aurora Flight Sciences, subsidiária da Boeing, anunciou um marco importante no projeto da aeronave…

6 horas atrás

Desenvolvimento e fabricação de eletrônicos

Atualmente, a memória representa até 30% dos custos de construção de data centers — quatro vezes mais do que em 2023.

Os analistas da SemiAnalysis estimam que a memória representará aproximadamente 30% do investimento total de…

6 horas atrás

Espaço

A Terra é visível pela vigia: o comandante da missão lunar Artemis II enviou fotos deslumbrantes do nosso planeta.

Há algumas horas, a espaçonave Orion e sua tripulação concluíram com sucesso uma manobra de…

7 horas atrás

Redes e comunicações

A MSI lançou o adaptador PCIe sem fio Herald BE9400 com suporte para Wi-Fi 7 e Bluetooth 5.4.

A MSI lançou o adaptador sem fio Herald BE9400 como uma placa de expansão PCIe,…