Usuário:DarwIn/Limbo/AWB
Esta página é um arquivo de discussões passadas. Não edite seu conteúdo. Se quiser iniciar um novo tema de discussão ou retomar um tema abordado nesta página, por favor, faça-o na página de discussão. |
AWB
editarConsidere usar o código do Rjclaudio quando utilizar o AWB. Está em fase de testes, pelo que é necessária a revisão das edições, bem como o reporte dos erros encontrados (sempre com diffs, facilita).--Lépton ✉ 07h46min de 24 de fevereiro de 2010 (UTC)
- Vi q está usando como base o checkwiki/AWB. Tem mts erros naquele código. Ou tinha, pelo menos, não sei se já arrumaram todos. Tem como me passar o seu código? Assim vejo se posso aproveitar algo, ou se acho algum desses erros q não foram arrumados. E se já tiver tudo incorporado no meu código, vc usaria o meu? Ou continua com o seu mesmo?
- Todos os erros marcados com (BOT), (BOT 1/2), (AWB) e (AWB 1/2) no checkwiki
- Fazer um resumo do q tem no meu código é meio difícil. Vou tentar:
- Geral
- Trimming vertical e horizontal (espaçamento e quebra de linha)
- Tags (nome das tags, tag abre mas não fecha, tag desnecessária como <b>, ou <br /> em final de lista, small em ficheiro/ref/sup/sub
- correção de redirects, como Infobox para padrão de nome, {{AP}} -> {{Artigo principal}} e {{Anexo}}
- subst ou retirando elemento de programação (if, PAGENAME, CURRENTYEAR)
- Colchetes / Parênteses / Chaves erradas (atualmente só pelo número de colchetes/chaves/etc, tenho outras em teoria mas só mais pra frente)
- Datando e colocando assunto em predefs de manutenção
- Caracteres unicode, e arrow ⇒
- Parte superior
- Artigo começa direto com seção
- Aplicação da {{dni}}
- Tags q ficam em todo o campo de infobox devem ser retiradas e passadas para o código da predef em si
- Adiciona {{Wikificar}} se não tiver nenhuma ligação interna.
- {{Minidesambig}} e similares, qnd já tem o texto mas está como texto puro e não a predef
- Coloca título, em negrito, na introdução, caso não tenha o título (primeiro parágrafo começa com "é um" e variações.
- Parte central
- Retira alguns textos ocultos, como < ! -- Categorias - - >
- Transformação em código wiki de listas usando <li> <ol> <ul>
- Cria lista com * se o artigo usar • para criar lista. Erro de cópia de outra página. Tinha outras regras q retirei pq estavam mt instáveis
- Aplicando {{BRAb}} e similares.
- Ponto final em ficheiro.
- Aplicando AO - Trema e ditongo ei
- Retirando texto não enciclopédico: Número de telefone, Assinatura, Botão de edição
- Negrito/Itálico/Big em cabeçalho de seções. Tb : e . no final do cabeçalho
- Deixa seção invisível, se ela estiver vazia (algum erro do checkwiki)
- Arruma o nível das seções
- Parte inferior
- Padroniza REF/VT/LE de várias formas ({{Ligações externas}}, {{Referências}}, {{Link}}, {{Citar web}}, etc)
- Aplicaçao de {{MySpace}} {{imdb nome}} {{Imdb título}}, entre outras
- Adição de Defaultsort, com correção de espaço, maiúscula, retira se for igual ao título, ordem "sobrenome nome" para não lusófonos, etc
- Retira cats q começam com ! (cat interna, adicionada com subst indevido em predef)
- Ordem
- Ordem das predefs inferiores (correlatos - esboço - portal3 - predef manutenção)
- Ordem das seções inferiores (VT x LE, REF x Biblio)
- Ordem do final (defaultsort x cat x iw)
- Regras temáticas
- Aplicação (ainda parcial) do LE Futebol
- Maiusculite em seções (ex: == Breve Histórico ==)
- Correção de links para desambiguação
- Padronização da introdução
- Recategorização
- Preenchimento de alguns campos de infobox
- Etc. Chega né, tá um resumo bom. Vou colocar isso na minha página do awb, pra referências futuras. Rjclaudio msg 13h42min de 24 de fevereiro de 2010 (UTC)
Luxo? Nem me fale. O projeto ainda está bem longe de acabar. Veja Usuário:Rjclaudio/AWB/Futuro. Ainda não consegui chegar nem na versão 2.0 (utilizável pelos bots), e as próximas vão ficando cada vez mais difíceis. Meu sonho ainda é ter um bot pra wikificação (finalmente terminar a missão do projeto manutenção =), mas isso só na versão 6.0. Rjclaudio msg 16h57min de 24 de fevereiro de 2010 (UTC)
- Quer ir fazendo as regras de Portal3 para países/localidades? Falo com o Thiago para ele fazer a do resto. No momento a prioridade é pras localidades, q só usam as categorias e q dão mais falso-positivo. As de outros temas não dão tanto problema. Rjclaudio msg 00h23min de 25 de fevereiro de 2010 (UTC)
Pode ver pelas predefinições de lugares. Pela Categoria:!Predefinições sobre o Brasil temos uma lista de predefs q podem ser usadas. Pegar casos positivos é fácil, falso-positivo é o pior. Por isso q deixei essa parte de lado.
Talvez pegar os artigos da cat Geografia, incluindo todas as subcats (!!) e colocar em ordem alfabética, daria uma lista +- diversa dos subtópicos de geografia. Não é uma ideia mt boa, mas é alguma coisa. Pode fazer uma lista dessas com .python, e de olho pegar alguns artigos de exemplo
Os testes temáticos são os mais difíceis de pegar grupo de teste. Rjclaudio msg 00h32min de 25 de fevereiro de 2010 (UTC)
AWB: Lang-xx
editar- Alguma ajuda aqui? A regra do awb está pronta, só preciso q a predef do subst esteja completa.
- Por enquanto a regra aplicará a {{lang-xx}} sempre q encontrar
(em [[língua]]: '''palavra''')
. Se o "língua" na verdade não for língua o subst da predef vai resultar no mesmo texto anterior, sem alterações. - Rjclaudio msg 23h54min de 1 de março de 2010 (UTC)
- Aproveitando, vou precisar mt pro subst usando awb que encontre facilmente todas as predefs q fazem conversão. Pode procurar por aí predefs desse tipo q vc ache interessante e categorizar em Categoria:!Predefinições de Conversão? Ex: {{Iso2país}} q vc citou anteriormente, estou colocando na cat certa agora. Rjclaudio msg 23h56min de 1 de março de 2010 (UTC)
- Sua regra tem o problema de precisar do "if contain" para saber se aquela parte é língua mesmo. A que fiz (Usuário:Rjclaudio/AWB/Temp2 e Usuário:Rjclaudio/AWB/Temp3) a própria predef detecta se é língua ou não, mudando apenas se for língua. Assim o "if contain" do awb não precisa ficar com dezenas de casos. A vantagem é da manutenção, criação, simplicidade da regra, .
- Por outro lado, para não interferir nas outras regras o meu código precisa de uma boa restrição (como estar entre parênteses) e assim não vai pegar alguns casos.
- Bem, deixa quieto essa sua regra por enquanto, até eu lançar a próxima versão do awb, aí vc compara e ajuda a completar a Temp3 se formos mesmo usar a regra. Rjclaudio msg 00h25min de 2 de março de 2010 (UTC)
- Se a sua estava nos testes iniciais então está melhor que a minha, que só passei em 2 artigos até agora, ambos fizeram a correção que se esperava. Ainda estou para passar em outros lugares. Vc q está nos artigos de localidades que vai pegar mt essa regra.
- Não precisa da sua predef não, o principal é o esqueleto, o resto meu awb completa. Rjclaudio msg 00h36min de 2 de março de 2010 (UTC)
Não tem mts correções importantes, mas se quiser posso fazer a atualização. Rjclaudio msg 03h22min de 2 de março de 2010 (UTC)
- Ah é, sim, a lang, já ia esquecendo. Então é uma boa atualização.
- Para marcar o bot precisaria detectar que era língua. Se o bot conseguiu detectar não tem motivo nenhum para não ter aplicado a regra. Se a regra permite a detecção tb permite a correção.
- Vou fazer a atualização. Rjclaudio msg 03h30min de 2 de março de 2010 (UTC)
- Dá pra fazer uma regra bem simples (ou quase) para esses casos. Usando o itálico.
em [[língua]] xxx ''trecho''
. Nesse caso não aplicaria diretamente a {{lang-xx}}, e sim uma{{língua|iso}} xxx {{lang|iso|trecho}}
. Essa predef quase sempre vai dar pra aplicar. - Ele pode até colocar uma tagman de semlang se ele reconhecer o
em [[língua]] xxx
, mas assim teremos alguns falso-positivos: "xxx (em espanhol), yyy (em inglês)
". Ou um "xxx (em espanhol antigo)
". Fico meio com o pé atrás em relação a tagman mt sensível como essa. - Quem sabe mais pra frente. Deixe eu me concentrar nos casos que podemos arrumar pelo bot. Depois vemos as tagman.
- Rjclaudio msg 03h48min de 2 de março de 2010 (UTC)
Seu caso está resolvido. Vou deixar pra fazer alguns testes aqui pra só depois lançar a melhoria. Rjclaudio msg 14h16min de 2 de março de 2010 (UTC)
AWB Bots
editarPenso que o "modo bot" já está 100%. Sua opinião: posso liberar o código para todo mundo usar o "modo bot"? Assim os bots já poderão usar as regras do script, arrumar os vários afluentes de redirects de info e usar as regras no seu trabalho normal. O que acha, está pronto para o próximo nível? Assim q dermos o ok para os bots, vou tirar o awb da minha subpágina e criar uma página de projeto mesmo, já q vai aumentar a escala e dar um ar de aprovação para o script. Rjclaudio msg 17h13min de 18 de março de 2010 (UTC)
- Passei as páginas de AWB para Wikipedia:Projetos/AWB. Se estiver tudo certo com a versão 1.17, segunda lanço a 2.0 apenas com as regras estáveis e retirando todas as desabilitadas e em teste. A partir da 2.0 serão 2 links de download (em 2 páginas diferentes), um para a estável e outra para a testes. Qualquer ajuda no layout da página do projeto é bem-vinda. Rjclaudio msg 15h20min de 19 de março de 2010 (UTC)
Portal3
editarAcho que será preciso alguma alteração na organização das regras para melhorar o desempenho.
- esboço-geo, e outras de esboço
Pensei em um grupo só para detectar as predefs de esboço. com "if contains \{\{Esboço\-geo[a-z]+}}
", e colocar nesse grupo todas as regras q usam esboço-geo. Assim só faria esse teste se tiver alguma esboço-geo, e se tiver vai colocar o país.
Podemos fazer algum subst para detectando o esboço-geo([a-z][a-z])}}, colocar Portal3|{{subst:Predef1|$1}} }} . Assim só seria preciso um único teste pra esboço-geo.
- Infobox
Talvez fazer algo semelhante para as infoboxes. Um "if contain {{Info/
", para só tentar identificar a infobox se o artigo tiver infobox.
- Pular outras regras
Imagino que os artigos só terão um Portal de país (salvo raras exceções). Podemos colocar uma marcação como ╣ (outro símbolo sem ser esse) para mostrar q já está adicionado o Portal de país, e podemos pular as outras regras de portal país.
- Resultado
Fazendo assim, se o artigo tiver esboço-geo, faria 1 regra para adicionar o Portal, colocar a marca de portal-país, 1 teste para pular o grupo pro identificador Info/, e 1 teste pro uso de outras predefs. Seria apenas 3 testes, ao invés das centenas normais.
Se não tiver esboço-geo, mas tiver info, 1 teste pra pular esboço-geo, alguns vários testes pra identificar a info, e se achar, pularia o resto dos testes.
Entendeu a lógica né? Pular o grupo de regras se não tiver o identificador, ou já tiver portal-país, 1 teste ao invés de dezenas.
Rjclaudio msg 17h24min de 26 de fevereiro de 2010 (UTC)
- Os esboço-geoXXX precisam seguir alguma norma, a ISO não sei das quantas (a mesma q a das bandeiras). Se alguma não segue teremos q arrumar com o awb antes. E sim, podemos tb usar para bandeiras.
- Até agora só usei subst em 2 ocasiões, com {{ISO2}} para passar o nome do país para {{BRA}} (na {{Info/Futebolista}}) e qnd estava testando o awb para encerrar as PEs (usei umas 3 subpáginas para os códigos do subst).
- Como usamos sempre com subst, poderia ser qualquer nome, até uma subpágina de alguém. Pensei em juntar todas as predefs q serão usadas pelos bots em um mesmo local (tipo Predefinição:Bots/XXX), pra todo mundo saber q aquela predef é usada pelos bots, e ninguém deve editar sem avisar antes (talvez proteção total !?) senão pode dar erro em centenas de artigos (tive esse problema antes, editaram a predef q eu usava, e tive q corrigir mts artigos de novo).
- Enquanto não se decide o nome, pode criar em Usuário:Rjclaudio/AWB/Predef1.
- Cada vez mais penso em transformar essas minhas subpáginas de awb em um WikiProjeto de verdade, tá ficando cada vez mais complexo e completo.
- Pensei em deixar esse tipo de coisas pra depois da versão estável. Tem 2 novos recursos de códigos: as variáveis e o subst. Queria estabilizar nosso código primeiro, pra já liberar o uso pros bots irem arrumando algumas coisas q vão ajudar no desempenho do awb (como correções de redirects, principalmente de infobox sem o nome padronizado). Quero estabilizar logo, e deixar regras novas e mais complexas pra depois. Senão nunca teremos uma versão para bots, pq cada vez mais temos novas ideias.
- Rjclaudio msg 18h03min de 26 de fevereiro de 2010 (UTC)
É importante a gente ter logo uma versão inicial para bots (quase sem erros, mas sem garantias de 100% testado) para ampliar a quantidade de testes. Temos algum código para aplicar LE Futebol, usaríamos um bot para editar 100 artigos por dia, e uma pessoa interessada em futebol para revisar os 100 artigos. Como a pessoa não precisaria usar o awb, vai ser mt mais fácil conseguir ajuda para os testes. Já tenho interessados nesse esquema, 1 para cada tema, para Futebol, Televisão e Ginástica. Seriam 300 artigos por dia a mais testados sem atrapalhar nos nossos testes (desenvolvimento de novas regras, como essa). Entende meu ponto? O principal por agora deve ser acharmos os erros, as regras podemos ir implementando as simples, mas as complexas ou com novos recursos (subst e variável) deixar pra depois do uso dos bots. Concorda com a ideia? Rjclaudio msg 18h19min de 26 de fevereiro de 2010 (UTC)
- Só isso q dá erro? Tem coisa demais, e mt variada, dando erro, e q eu não queria arriscar. Veja Usuário Discussão:Rjclaudio#RE:Ficheiro:Flag of FR Yugoslavia.svg, Usuário Discussão:Rjclaudio#RE: AWB - JC e Usuário Discussão:Rjclaudio#E=MC² (álbum). Tem mt reporte de erro só do João Carvalho (ele está acostumado a fazer teste de programas, deve ser por isso q ele acha tanta coisa errada). Rjclaudio msg 18h23min de 26 de fevereiro de 2010 (UTC)
Acho que pra teste genérico, o ideal é o checkwiki (bem variado os assuntos, e que já tem algum erro) e artigos bem desenvolvidos (usando a Especial:páginas longas, por ter mais coisa pode ter coisas q só aparecem nesse tipo de artigo).
Ainda tenho q terminar os testes nos grupos de teste q coloquei lá na discussão. Pra mim aquela lista é a prioridade. Nem precisa de mts artigos, uns 50~100 por item já dou por encerrado o teste. Rjclaudio msg 18h36min de 26 de fevereiro de 2010 (UTC)
- Se quiser dividir o trabalho fica melhor. Pode ir fazendo o pedido. Sim, eu uso o próprio awb como bot. Aliás, atualmente só edito com awb pela minha conta de bot, já q só faço ajustes. Qnd preciso retirar conteúdo (VDA), copio o código pós-AWB e edito o artigo na wiki com minha conta normal. Antigamente ainda me dava ao luxo de ter copiado a pasta q tem os arquivos do awb, pra ficar os 2 rodando em paralelo, um para o bot, rodando direto, e um na minha conta, pra enquanto eu ficar mexendo nas regras o bot continuar trabalhando. Rjclaudio msg 21h03min de 26 de fevereiro de 2010 (UTC)
Resumo é a pior coisa q tem. Hoje só fiquei corrigindo as coisas q vcs falaram, e acabei nem anotando. Bem, vou seguir a sugestão e criar uma página para reportes de erros, assim sempre q tiver uma nova versão já tem uma lista dos erros corrigidos.
As principais correções de bugs foram na parte temática / Futebol. Mexi nos 4 grupos q coloquei lá: índice cat, defaultsort, título na introdução (reporte seu). Mexi algo sobre Portal3 (Literatura, exceção para cat "baseados em livros"). Retirei {{commons2}}
Todas as discussões lá do nosso projeto, exceto suas novas regras de portal (esqueci, fica pra próxima, tá anotado) nem a nova regra pra reflist dentro de seção REF.
Deixa novos reportes em Usuário:Rjclaudio/AWB/Bugs
Rjclaudio msg 01h23min de 27 de fevereiro de 2010 (UTC)
- Eu tinha feito sugestão de colocar a semimagem para artigos de localidades, coloquei na esplanada e só teve 1 comentários. Sim, concordo. Provavelmente expandir os temas tb, como para biografias de pessoas vivas. Alguma sugestão para o identificador de localidade? Usar info/(cidade|estado|bairro|etc)? Rjclaudio msg 12h34min de 27 de fevereiro de 2010 (UTC)
- Já deixei comentário na discussão da predef. Se puder manter o parâmetro opcional para colocar o nome da infobox q deve ser inserida, fica melhor pq já vai direto onde se quer chegar.
- Se é redirect, seria Padrão->Padronização->Predefs padrão->Predefs padronização->Redirect de predefs->Tag man. Se forem mts esboços a corrigir, ficaria um grupo dentro de "Tag man" só para "Redir esboço". Pq, alguma ideia? Tem tantos esboços assim?
- Rjclaudio msg 12h44min de 27 de fevereiro de 2010 (UTC)
- Concordo em mover {{sem-infobox}} -> {{sem infocaixa}}, estou arrumando aqui o script
- Melhor q colocar a {{sem imagem}} usando a infobox, seria colocar um código nas infocaixas de localidades para automaticamente colocar a sem-imagem caso o campo imagem esteja vazio. Aí o script só vai inserir a predef em localidades q tenham a sem-infocaixa. O mesmo para biografias, apenas se não tiver imagem, e se o campo morte não tiver sido preenchido.
- Rjclaudio msg 12h47min de 27 de fevereiro de 2010 (UTC)
Ok. São só os esboços q tem problema de ISO2 -> ISO3 ? Se forem outras podemos fazer uma regra mais genérica tipo (esboço|outra predef)\-xx Rjclaudio msg 12h49min de 27 de fevereiro de 2010 (UTC)
- Editei a {{Info/Condado urbano da Hungria}} pra usar a {{Info/Assentamento}}. Fiz sugestão para todas as infocaixas de localidades usarem a Info/Assentamentos, facilitando padronização e manutenção. Assim só precisa mesmo colocar a semimagem na assentamento, e com o tempo as outras tb terão ela. Rjclaudio msg 15h25min de 27 de fevereiro de 2010 (UTC)
Acho meio inútil colocar data nessa, e ainda mais criar as subcats. Isso é algo que o awb pode arrumar, então não deve ficar mt tempo. Só de início que a categoria deve encher, depois qnd finalmente criar as regras do awb (assim q tivermos a versão estável) a cat deve ficar quase sempre vazia. Ou ao menos algum bot passando 1 vez por mês. Rjclaudio msg 19h14min de 27 de fevereiro de 2010 (UTC)
- Sim, q bom q funciona. Essa é a tag de manutenção mais fácil de arrumar. Com o tempo os bots vão colocar infocaixa em bastante artigo, e o q sobrar o projeto manutenção arruma manualmente (espero).
- Ok, concordo. Só me esclarecendo uma dúvida: quando se usa a {{sem-notas}} ? É qnd tem ref mas não o suficiente? Posso deixar então a detecção de refs?
- Rjclaudio msg 02h55min de 28 de fevereiro de 2010 (UTC)
- Não tem como a imagem da {{sem infocaixa}} ficar no alto, que nem a {{sem imagem}}? Pq pelo menos aqui ela fica dentro do artigo. Rjclaudio msg 02h56min de 28 de fevereiro de 2010 (UTC)
- Sem notas agora mudei pra if contain "=(Bibliografia|Referências)", e if not contain "<ref name|<ref>". Não vou fazer ainda mais verificação (se é pequeno, ou se tem mts fontes diferentes, etc) pq é opcional e em modo revisado, qnd estiver editando a pessoa faz a verificação e desfaz se não achar necessário.
- Acho possível colocar o símbolo do lado. Se não me engano um artigo protegido fica com o cadeado, e se tiver {{artigo destacado}} ou {{sem imagem}} a imagem fica do lado do cadeado. Só pedir ajuda no café dos programadores. O problema q vejo é q deixa um espaço (quebra de linha dupla) antes do começo do artigo, fica estranho. Se arrumar isso, deixando a imagem na lateral sem atrapalhar no texto não vejo problema.
- Achei na parte de regras antigas minha regra antiga pra add {{sem imagem}} em localidades, usando "
\[\[Categoria:(Aldeia|Bailiado|Bairro|Borough|Cantão|Cidade|Circunscrição|Comuna|Condado|Concelho|Departamento|Distrito|Estado|Freguesia|Município|Periferia|Posto administrativo|Povoação|Povoado|Prefeitura|Província|Território|Unidade Residencial|Vila|Voivodia)s?
". Deve ter falso-positivos, mas isso só achamos usando.
- Achei na parte de regras antigas minha regra antiga pra add {{sem imagem}} em localidades, usando "
Devo lançar uma correção de hj pra amanhã. Vai querer que eu coloque suas regras de portal e etc? Rjclaudio msg 05h09min de 28 de fevereiro de 2010 (UTC)
- Erro meu. próx. versão já coloco no lugar certo. É q o nome estava Infocaixas, e achei q era edição na infocaixa, e não na Portal3. Mudei o nome para "Portal3 - usando Infocaixa", e passei pra parte inf. Mesmo para a via-esboço.
- Correção de índice de cat está em "Bot / Inf / Defaultsort 2 / - Indice = defaultsort". É uma q tinha feito, melhor q a sua, por pegar qualquer categoria e não apenas a primeira, como era a sua (eu acho), ao usar a marcação do final.
- {{Sem imagem}} deve ficar no início ou no final? Não inclui essa regra, vou colocar agora.
- Acredita que essa era a +- organização que eu usava no início da criação do script? Só q naquela época tinha tanta coisa em teste q não valia a pena.
- Tem a "+{{Sem imagem}}" em "Bot / Parte sup / Tags man sup". Está usando vários identificadores de localidades, baseada em {{Divisões administrativas}}.
- Estou passando as duas de sem imagem (+ e -) para a parte teste. Deve ter falso-positivo na + , e na - penso se não retiraria algo inadequado ao detectar "Ficheiro", pq pode ser um ficheiro de música/vídeo/etc e não uma imagem. Acha q devo retirar esse identificador, deixando apenas as extensões (.gif .jpe?g ...) ?
- Achei q tivesse posto, mas pelo visto não. Coloquei agora, fica pra próxima.
- Rjclaudio msg 18h32min de 28 de fevereiro de 2010 (UTC)
Nova versão =) tinha um bug importante. Coloquei tudo lá, menos a parte de Ficheiro:.*.jpeg . Ainda vou pensar nisso. Mas é algo menor por enquanto. Rjclaudio msg 19h17min de 28 de fevereiro de 2010 (UTC)
Re:
editarOlá, não é propriamente dificuldade. Só não sei se tem maneira de fazer as mudanças que estou a fazer de modo mais automatizado. Basicamente, só quero manter, em páginas de desambiguação, os links para as páginas realmente desambiguadas e retirar os piped links. GoEThe (discussão) 13h29min de 21 de abril de 2010 (UTC)
Aqui vão. Obrigado, GoEThe (discussão) 13h38min de 21 de abril de 2010 (UTC)
- Como é que faço para correr o script? Colo no ficheiro de definições do AWB? GoEThe (discussão) 15h31min de 21 de abril de 2010 (UTC)
Esta página é um arquivo de discussões passadas. Não edite seu conteúdo. Se quiser iniciar um novo tema de discussão ou retomar um tema abordado nesta página, por favor, faça-o na página de discussão. |