A IBM introduziu um conjunto de dados para a programação da aprendizagem II

A IBM espera criar meios inteligentes para desenvolver uma espécie de ImageNet analógico, que realmente se tornou um conjunto padrão de imagens para modelos de treinamento II. Na Think Conference, a empresa informou que, para isso, coletou uma grande variedade de código-fonte.

O conjunto chamado Project Codenet contém 14 milhões de amostras com um volume total de 500 milhões de linhas de código em mais de 55 idiomas de programação: de Java, C e vão para COBOL, PASCAL e FORTRAN. No entanto, mais de três quartos de todo o código cai em C ++ e Python.

A fonte do código foi as duas competições de programação japonesa: Aizu e ATCODER. Sob os termos de competições, os participantes deveriam escrever o código necessário para transformar a discagem especificada de dados de entrada em um conjunto de saída desejada para 4000 tarefas diferentes. Assim, foram obtidas 14 milhões de amostras de código, aproximadamente metade dos quais eram trabalhadores, e o restante foi marcado como erros não compilados, incorretos ou contendo contendo.

O IBM quer que o projeto Codenet segue nas pilhas de ImageNet e tenha se tornado um conjunto de dados padrão de fato para a aprendizagem II modelos que podem reconhecer a estrutura dos programas. Assume-se que Codenet pode ser usado para criar ferramentas de desenvolvimento inteligentes que procurem os procedimentos necessários em aplicativos e bibliotecas, transferir de uma linguagem de programação para outra, seleção das implementações corretas e expressa errônea, classificação do código e assim por diante.

avalanche

Postagens recentes

Bitcoin está se aproximando de US$ 70 mil em meio à simpatia dos políticos americanos

Os recentes discursos do candidato presidencial dos EUA, Donald Trump, a representantes da indústria cripto…

28 minutos atrás

Canais do YouTube com mais de 10.000 assinantes também serão obrigados a se reportar ao Roskomnadzor

Hoje soube-se que o Comitê Estadual de Política de Informação da Duma aprovou uma emenda…

48 minutos atrás

Rumores: a marca revelou o nome da segunda adição de história ao Starfield

O addon Shattered Space para o RPG espacial Starfield da Bethesda Game Studios ainda nem…

53 minutos atrás

A TP-Link lançou o Archer BE3600 – um roteador com suporte para Wi-Fi 7 por apenas US$ 99

Roteadores modernos com suporte para Wi-Fi 7 custam hoje centenas de dólares: os preços dos…

53 minutos atrás

O Google permitirá que você transfira videochamadas do seu smartphone para dispositivos Android próximos

Esta semana, o Google começou a lançar dois novos recursos que visam expandir a experiência…

1 hora atrás

Fim de uma era: a Loja e o Marketplace do Xbox 360 estão fechando hoje

Nas últimas duas décadas, o mercado de consoles de jogos mudou significativamente. Uma das mudanças…

1 hora atrás