Wikipédia:Robôs/Pedidos de aprovação/GoeBOThe/4

pedidoediçõescontadorlogsblock userblock logflag logflag botSUL util
Pedidos de tarefas: 1, 2, 3, 4

Operator: GoEThe

Automatic or manually assisted: Automatic

Programming language(s): Python

Function summary: Adicionar referência da Lista Vermelha da UICN a artigos de espécies.

Edit period(s) (e.g. continuous, daily, one time run): Rodar continuamente até ao fim da lista.

Edit rate requested: X edits per TIME Não há necessidade de ir rápido, 3 edições por minuto resolvem a situação em alguns dias.

Already has a bot flag (Y/N): Y

Function details: O script pega numa lista de artigos cruzando páginas com identificador IUCN no Wikidata e artigos marcados como sem fonte na Wikipédia em português. Usa então a API da iucnredlist para obter a classificação e a referência da avaliação, e adiciona-a ao texto dos artigos. O script está gravado num notebook no Paws. Eventualmente a função pode ser expandida para outros artigos de espécies ainda não marcados sem fontes, mas estes parecem-me ser os artigos prioritários. De notar que muitos dos artigos foram criados com base na lista do IUCN, mas sem apresentar a fonte explicitamente, apenas com o parâmetro estado na infocaixa. Nesses casos, o script actualiza (se necessário) o campo estado, e adiciona a referência. GoEThe (discussão) 15h03min de 29 de dezembro de 2021 (UTC)[responder]

Discussion

editar

@GoEThe: Tarefa interessante, é bom ver um robô que coloca referências em artigos. O link para o PAWS não está funcionando, mas não é necessário mostrar o script se não quiser. Pode rodar as edições de teste, faça até 50 edições. Danilo.mac(discussão) 17h16min de 12 de janeiro de 2022 (UTC)[responder]

@Danilo.mac obrigado pelos comentários. Fiz mais ou menos 50 edições para testar. Já detectei alguns erros. Por exemplo, se o artigo já tiver a predefinição {{referências}} ou a marcação <references/> o script não deveria adicionar a secção referências novamente. Por alguma razão adiciona na mesma. Eu usei a classe NoReferencesBot do pywikibot. Pensei que ele resolvia adequadamente esses casos, mas parece que não. Vou tentar perceber o que se passa. GoEThe (discussão) 09h59min de 13 de janeiro de 2022 (UTC)[responder]
Certo. Depois de corrigido pode usar a opção -simulate para ver se deu certo sem salvar. E também ficou faltando um sumário começando com "bot:" ou "robô:" e explicando o que o robô está fazendo. Quando tiver tudo certo pode rodar mais algumas edições. Danilo.mac(discussão) 00h44min de 14 de janeiro de 2022 (UTC)[responder]
@Danilo.mac, já corrigi alguns bugs que detectei. Corri em mais 20 páginas. Entretanto descobri um outro bug e corri novamente nessas para o corrigir. Acho que agora está ok. GoEThe (discussão) 18h35min de 14 de janeiro de 2022 (UTC)[responder]
@GoEThe: Tem alguns pequenos ajustes a serem feitos que eu não tinha percebido antes. Quando o robô retira a {sem fontes} ele deixa uma linha em branco, e quando remove também a {título em itálico} ele deixa duas, como nesta edição, essa linha em branco adiciona um espaço adicional no topo do artigo, provavelmente isso se resolve incluindo a quebra de linha no final da regex. Já com o <ref name="IUCN"/> está acontecendo o contrário, o robô está removendo a quebra de linha quando não deveria, na maioria dos casos isso não afeta em nada o artigo, mas quando tem uma parágrafo abaixo ele é unido com o anterior como nesta edição. E faltou também o "bot: " no inicio do sumário, que é um padrão dos sumários dos robôs. De resto parece estar tudo certo. Faça mais algumas edições com essas correções só para confirmar que está tudo certo. Danilo.mac(discussão) 01h41min de 15 de janeiro de 2022 (UTC)[responder]
E outra coisa, o robô está rodando a 6 edições por minuto, o pedido tinha sido para 3 por minuto, para reduzir coloque put_throttle = 20 dentro do user-config.py ou use "-put_throttle:20" nos argumentos do comando para rodar o robô. Danilo.mac(discussão) 04h03min de 15 de janeiro de 2022 (UTC)[responder]
Obrigado pelo olhar atento. Penso que corrigi todos os erros. Passei o bot por mais 20 artigos. GoEThe (discussão) 13h10min de 17 de janeiro de 2022 (UTC)[responder]
@Danilo.mac, esqueci-me de pingar. GoEThe (discussão) 14h45min de 17 de janeiro de 2022 (UTC)[responder]
@GoEThe: As edições estão corretas, só a taxa de edição que continua em 6 por minuto, mas se quiser manter essa taxa por mim tudo bem, se quiser reduzir pode fazer como expliquei acima.
  Aprovo o pedido. Lembre de olhar algumas edições aleatórias enquanto o robô estiver rodando para ter certeza que ele está fazendo tudo certo. Danilo.mac(discussão) 02h17min de 18 de janeiro de 2022 (UTC)[responder]
@Danilo.mac estranho. Incluí o put_throttle = 20 no user-config.py, deveria ter limitado a taxa. GoEThe (discussão) 10h39min de 18 de janeiro de 2022 (UTC)[responder]
De qualquer forma, obrigado pela aprovação. GoEThe (discussão) 10h39min de 18 de janeiro de 2022 (UTC)[responder]