O Sweep visa automatizar tarefas básicas de desenvolvimento usando modelos de linguagem grandes

Paulo Boaventura
43 Views
7 Min Read

Os desenvolvedores gastam muito tempo em tarefas rotineiras e repetitivas – e surpreendentemente pouco na codificação real.

Na pesquisa de desenvolvedores de 2022 do Stack Overflow, 63% dos entrevistados disseram que dedicam mais de 30 minutos por dia procurando respostas ou soluções para problemas – o que soma entre 333 a 651 horas de tempo perdidas por semana em uma equipe de 50 desenvolvedores. Uma pesquisa separada da Propeller Insights e Rollbar descobriu que mais de um terço dos desenvolvedores gastam cerca de um quarto do seu tempo corrigindo bugs, com pouco mais de um quarto (26%) reservando até metade do seu tempo corrigindo bugs.

A tendência frustrou William Zeng e Kevin Lu. Então, no início deste ano, eles – ambos veteranos do Roblox, o videogame que virou rede social – criaram uma plataforma chamada Sweep para lidar de forma autônoma com tarefas de desenvolvimento, como depuração de alto nível.

“Começamos o Sweep depois de trabalharmos juntos na Roblox e lidarmos constantemente com tarefas de software que sabíamos que poderiam ser automatizadas com IA”, disse Zeng, CEO do Sweep, ao TechCrunch em uma entrevista por e-mail. “O Sweep é como um desenvolvedor júnior com tecnologia de IA para equipes de software.”

O TechCrunch cobriu anteriormente o Sweep durante o Demo Day de verão de 2023 do Y Combinator. Mas, desde então, a startup fechou uma nova rodada de financiamento, levantando US$ 2 milhões da Goat Capital, do CEO da Replit, Amjad Masad, do vice-presidente da AI da Replit, Michele Catasta, e da Exceptional Capital, com uma avaliação pós-dinheiro de US$ 25 milhões.

O Sweep permite que os desenvolvedores descrevam uma solicitação em linguagem natural — por exemplo, “adicionar logs de depuração ao meu pipeline de dados” — fora de um IDE e gerem o código correspondente. A plataforma pode então enviar esse código para a base de código apropriada por meio de uma solicitação pull e abordar os comentários feitos na solicitação pull dos mantenedores ou proprietários do código – um pouco como o GitHub Copilot , mas mais autônomo.

“O Sweep permite que os engenheiros entreguem com mais rapidez”, disse Zeng. “Cuidaremos da dívida tecnológica acumulada com cada mudança de código, como melhorar logs de erros e adicionar testes unitários, além de refatorar códigos ineficientes.”

A Sweep, especializada em escrever código Python, utiliza uma combinação de modelos de IA para geração de código. Eles incluem o GPT-4 da OpenAI, mas também um “mecanismo de busca de código” personalizado – principalmente não treinado em dados de clientes do Sweep, diz Zeng – que ajuda a planejar e executar alterações de código em “todo o repositório”.

“Construímos nosso próprio mecanismo de busca de código para Python, que aproveita técnicas de busca lexical e vetorial”, acrescentou Zeng. A pesquisa lexical procura correspondências literais – ou pequenas variações – porções de código, enquanto a pesquisa vetorial pode encontrar códigos mais vagamente relacionados que compartilham certas características. “Temos uma das melhores capacidades de geração de testes unitários disponíveis e executaremos testes em tempo real”, continuou ele.

No futuro, a Sweep planeja reforçar os recursos de geração de código de sua plataforma com StarCoder , o modelo de geração de código de código aberto da Hugging Face e ServiceNow.

Dada a tendência da IA de cometer erros, sou um pouco cético quanto à confiabilidade do Sweep no longo prazo. Uma equipe de pesquisa afiliada a Stanford descobriu que os engenheiros que usam ferramentas de IA têm maior probabilidade de causar vulnerabilidades de segurança em seus aplicativos porque as ferramentas geralmente geram código que parece superficialmente correto, mas apresenta problemas de segurança.

Há também a questão dos direitos autorais. Alguns modelos de geração de código – não necessariamente os do próprio StarCoder ou Sweep, mas outros – são treinados em código protegido por direitos autorais ou sob uma licença restritiva, e esses modelos podem regurgitar esse código quando solicitado de uma determinada maneira. Especialistas jurídicos argumentaram que essas ferramentas poderiam colocar as empresas em risco se incorporassem inadvertidamente sugestões protegidas por direitos autorais das ferramentas em seu software de produção.

A solução do Sweep solicita que os usuários revisem e editem qualquer código gerado antes de enviar as alterações para a base de código mestre de destino.

“Os principais desafios que afetam as ferramentas de desenvolvedor de IA estão relacionados à confiabilidade e ao gerenciamento de grandes bases de código”, disse Zeng. “Estamos usando nosso conhecimento sobre métodos mais antigos e mais recentes para tornar o Sweep robusto.”

A Sweep cobra um bom dinheiro por seus serviços – US$ 480 por assento por mês. (Por outro lado, os níveis focados em negócios para GitHub Copilot e Amazon CodeWhisperer custam cerca de US$ 20 por usuário por mês.) Mas isso aparentemente não dissuadiu os clientes. Zeng afirma que a Sweep, com um orçamento de guerra bastante humilde totalizando US$ 2,8 milhões, tem capital suficiente vindo da clientela para “durar os anos da empresa”.

“O novo dinheiro será para expandir nossa equipe no próximo ano de dois para cinco funcionários”, continuou ele. “Continuaremos focando em Python e melhorando todas as áreas de dívida tecnológica, desde testes de unidade, refatoração e tratamento de tarefas restantes no código.”

Por techcrunch
Tradução por Paulo Boaventura

Share This Article
Leave a review

Leave a review

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *