Privacy Policy Cookie Policy Terms and Conditions Discussioni Wikipedia:Bot - Wikipedia

Discussioni Wikipedia:Bot

Da Wikipedia, l'enciclopedia libera.

Dopo la crezione delle sottopagine, le precedenti discussioni sono state separate per argomento e spostate:


[[Image:{{{logo}}}|23px|Icona]] Bar dei Bot

Benvenuto al Bar dei Bot (nome provvisorio), punto d'incontro e discussione per wikipediani interessati allo sviluppo di strumenti automatici per la gestione di Wikipedia. (+/-)

Questa pagina raccoglie domande e comunicazioni, codice e strumenti informatici relativi alla gestione dei Bot.

  • Per argomenti di carattere più generale o differente considera il Bar di it.wiki.
  • Le discussioni archiviate si trovano "imballate" nell'Archivio.

Indice

[modifica] Bot su Wikiquote

Ciao! Avrei bisogno di un bot su Wikiquote per inserire interwiki, wikilink e correggere ortografia. Chi mi da una mano, magari spiegandomi come posso installarne uno mio? Grazie! --Dread83 20:49, 3 dic 2005 (CET)

Ti consiglio questa pagina. Ciao, -- PietroDn 09:47, 21 gen 2006 (CET)

[modifica] Lavoro da bot

cb La discussione proviene dalla pagina wikipedia:bar   
– il cambusiere --Twice25 00:10, 24 gen 2006 (CET)


Non so se ci sia un bot che lo fa, ma in alcuni articoli si possono trovare delle situazioni in cui le elisioni sono separate da spazi (es.: l'<spazio>ultimo). Può accadere che lo spazio produca dei daccapo sbagliati in quanto in italiano tra l'apostrofo e la parola ciò non è permesso. Non credo che ci sia un bot che lo faccia perché qui se ne trovano trovavano (--ArchEnzo 15:41, 19 gen 2006 (CET)) parecchi. -- Ilario (0-0) - msg 15:30, 19 gen 2006 (CET)

  • +1 --Paginazero - Ø 15:34, 19 gen 2006 (CET)
  • +1 È un compito difficile per un bot (grazie alla sfortunata idea di utilizzare '' e ''' per le formattazioni, ma forse si può fare. --paulatz° 16:14, 19 gen 2006 (CET)

Questa è porzione del codice che usavo io, che contempla qualche altro caso:

--Cosoleto 16:37, 19 gen 2006 (CET)

+1 --Guam->@ 16:49, 19 gen 2006 (CET)

Basta che non faccia correzioni tipo po' tardi -> po'tardi o simili. --Cruccone (msg) 20:05, 19 gen 2006 (CET)

siamo sicuri che non sia permesso andare a capo dopo l'apostrofo? di sicuro non è bello esteticamente, ma mi pareva di ricordare che da qualche annetto non veniva più considerato sbagliato ortograficamente... --lucha 20:06, 19 gen 2006 (CET)
Non lo so, so solo che a me lo consideravano errore grave nei compiti di liceo (e io ce li mettevo apposta). -- Ilario (0-0) - msg 21:17, 19 gen 2006 (CET)
Sembra un bot-lavoro da seguire con accuratezza... Quando si avvicina l'apostrofo ad una parola in grassetto o corsivo bisogna porre l'apostrofo entro i tag <nowiki>'</nowiki> in modo che non interferisca con gli apostrofi di formattazione 83.176.106.130 22:37, 19 gen 2006 (CET)
Non è affatto un errore andare a capo dopo l'apostrofo. È perfettamente lecito. Personalmente, lo trovo poco bello, ma non è scorretto. A scuola molti insegnanti lo segnano come errore, ma sono loro a sbagliare (chissà quanti insegnanti mi stanno leggendo?). È invece un errore la reintegrazione dell'apostrofo; fermo restanto che in molti casi l'apostrofo è opzionale e può esserci o non esserci. Ma dire lo <a capo> albero non va bene (ci sono casi peggiori, ma al momento non mi vengono in mente). Ah, è scorretto anche mettere lo spazio fra l'apostrofo e la parola seguente, per quanto ci sia ben di peggio, in circolazione. -- Laurentius 22:50, 19 gen 2006 (CET)
Ma a me alla scuola dell'obbligo avevano insegnato proprio che in caso di andata a capo in un punto di elisione, nei manoscritti, si doveva ricorrere alla reintegrazione: non "l'/ossatura" ma "la/ossatura"...
Comunque: 1) andare a capo dopo l'apostrofo su Wikipedia non è tanto un problema di ortografia, ma di regole tipografiche, e a quanto ne so queste lo proibiscono. 2) Il problema principale sollevato da Ilario non è chiedersi se si può andare a capo o meno, ma è segnalare che ci sono diversi articoli scritti sbagliati, perché contengono uno spazio tra la parola con apostrofo e la seguente: e questo è un errore in ogni caso (non si scrive «l' amo, l' esca, l' istmo, l' olmo, l' uva» ma «l'amo, l'esca, l'istmo, l'olmo, l'uva»). --Fede (msg) 23:25, 21 gen 2006 (CET)
PS. Ricordo che nei casi in cui invece tra due parole è previsto che ci sia uno spazio ma si vuole evitare la possibilità di un'andata a capo (p.es. 123 km oppure Art. 8), al posto dello spazio normale si può usare lo «spazio insecabile», ossia il carattere speciale &nbsp; (e quindi si scriverà 123&nbsp;km oppure Art.&nbsp;8)
PPS. Prima di pubblicare il famigerato wikiDVD bisognerà sottoporre le voci ad una bella revisione tipografica...

[modifica] Piccolo aiuto

Ehm non so dove scriverlo e lo metto qui..come posso fare che il mio pywikipediabot modifichi solo le pagine in un determinato namespace? --Helios 00:20, 24 apr 2006 (CEST)

[modifica] i sorgenti dei bot

cb La discussione proviene dalla pagina wikipedia:bar   
– il cambusiere --Twice25 22:47, 6 lug 2006 (CEST)


si possono sacricare? esistono tutorials? --Ulisse0 10:21, 1 lug 2006 (CEST)

vedi Wikipedia:Bot e le voci correlate; devi scaricare prima Python e poi Pywikipedia; una volta che apri uno degli script puoi modificarlo a piacimento, fare il debug etc., ma solo se sei molto bravo a programmare! ;) -- Lilja 11:10, 1 lug 2006 (CEST) PS: io conosco solo il Pywikipedia che è lo standard, ma ci sono bot scritti in altri linguaggi di programmazione; chiedi magari ai rispettivi proprietari che trovi su Wikipedia:Bot/Attivi.

Se vuoi un po di regex per il bot contatta filnik, lui ha delle sottopagine con molte regex per i bot. --Fabexplosive 17:55, 1 lug 2006 (CEST)

Vi ringrazio, ma non so cos'è un regex..:-) --Ulisse0 14:37, 2 lug 2006 (CEST)

significa espressione regolare --Iron

Ok grazie; quindi si usano comandi tipo bash per l'i/o testuale --Ulisse0 10:11, 3 lug 2006 (CEST)

Dipende, le espressioni regolari le usi dappertutto, in Javascript, in Java, in Python e dove altro vuoi. -- Ilario^_^ - msg 10:22, 3 lug 2006 (CEST)

Esiste la doc delle api della classe Wikipedia in Java? Si può scaricare ? --Ulisse0 09:53, 5 lug 2006 (CEST)

[modifica] Correzioni automatiche e alfabeti non latini

ciao a tutt*, qui[1] si vede che Filbot ha fatto una modifica discutibile: ha cambiato ar:%JE'C3 in ar:%JÈC3, il che non ha moltissimo senso.

in realtà, il problema del link non sembra essere quello: nella versione precedente il link era già sbagliato; non ho scavato nella cronologia per scoprire chi e quando ha modificato la versione corretta (se mai ce n'è stata una); invece sono andato su ar.wikipedia.org e ho cercato emacs, scoprendo che i link possibili sono due: ar:emacs (che è un redirect) e ar:إيماكس, che è la voce corretta (emacs traslitterato in arabo...). ho corretto il link di emacs, scegliendo la versione diretta (senza redirect).

non conosco il codice sorgente dei bot, ma credo che i problemi siano due:

  1. il bot non tiene conto dell'encoding utf;
  2. il bot non dovrebbe correggere le scritte che si trovano dentro doppie parentesi quadre a meno di non sapere esattamente cosa sta facendo.

Giorgian 13:33, 1 ago 2006 (CEST)

Il problema è più semplice. Si tratta di una sostituzione per il caso di «E'» da mutare in «È» scritta MOLTO male. Anche se in ogni caso, un bot che si applica in sostituzioni del genere, oltre a spiegare il più possibile nel campo oggetto cosa sta facendo, dovrebbe ignorare gli interwiki. --F. Cosoleto 14:32, 1 ago 2006 (CEST)
Concordo assolutamente con Cosoleto. Gac 09:58, 12 ago 2006 (CEST)

[modifica] Modifiche a pagine e sottopagine del namespace Utente:

Dal momento che sono sempre più numerosi i bot lasciati "liberi" di modificare le pagine e sottopagine utente, ricordo che questo tipo di modifiche su un namespace che ha caratteristiche diverse da quello principale, andrebbe controllato "a vista" dal momento che gli effetti collaterali sono difficilmente prevedibili e possono disturbare il lavoro altrui (es. tabelle di conversione, prove etc.) --M/ 15:28, 13 ago 2006 (CEST)

io ricordavo che per il pywikipediabot c'era un metodo per fargli ignorare certi namespace...però non ricordo esattamente Helios 15:58, 13 ago 2006 (CEST)

Spero di non dire una castroneria, ma il pywikipediabot considera soltanto il namespace principale se non viene indicato diversamente. --XXXLcàzziami 18:09, 13 ago 2006 (CEST)

se usi -ref: e -links: non fa distinzione, solo se usi -start piglia soli il namespace principale Helios 18:19, 13 ago 2006 (CEST)

Sperando che gli interessati dell'avvertimento si siano mostrati sensibili al richiamo di M/, segnalo che per evitare con -ref: e -links: gli altri namespace, basta indicare -namespace:0 (se si usa -start: viene considerato il namespace indicato, se viene indicato) Se non funziona ditemelo. --F. Cosoleto 16:07, 20 ago 2006 (CEST)

-namespace:0 mi sembra funzioni sono nei dump locali Helios 19:06, 20 ago 2006 (CEST)

Forse in una versione precedente. Per me adesso funziona, ho fatto alcune prove. --F. Cosoleto 01:02, 21 ago 2006 (CEST)

Meglio :) Helios 01:15, 21 ago 2006 (CEST)

[modifica] Ridotta affidabilità del diff di pywikipedia

Segnalo agli accorti gestori di bot che la funzione che evidenzia le differenze presenti fra il testo originale e quello corretto non è al 100% affidabile a causa di un bug di Python (anche riscontrato da un bel po' di tempo) che porta alle volte a non colorare qualche correzione. Come spiegato qui, si può temporanemanete sistemare la cosa, aumentando l'affidabilità, correggendo un file, /lib/python2.4/difflib.py, aggiungendo un 'if 0:' e anteponendo '#' o rimuovendo la riga if precedente.

                indices = b2j[elt]
                if 0:
                #if n >= 200 and len(indices) * 100 > n:
                    populardict[elt] = 1
                    del indices[:]
                else:

--F. Cosoleto 15:26, 21 ago 2006 (CEST)

[modifica] Nuovo bot delle cancellazioni in fase di test

Ciao a tutti,
vi segnalo che il nuovo bot delle cancellazioni, finalmente scritto in python, è in fase di test. Crea le pagine nel suo spazio utente, quindi Utente:Paulatz_bot/Conta/YYYY_mese_D (es. Utente:Paulatz_bot/Conta/2006_ottobre_20). Se potete dargli un'occhiata in cerca di errori, incongruenze sul numero di voti e cose simile ogni comento è più che ben accetto.

Per chi volesse il codice mi scriva, perchè il PC su cui gira non ha un server web e quindi mi è difficile tener sincronizzata la versione su internet e quella in uso. Ciao, paulatz XX 12:58, 20 ott 2006 (CEST)

[modifica] Regolamento sui bot

Giusto per evitare (futuri) equivoci, qualcuno (che si occupa della questione da un po', magari) potrebbe sostituire, nella pagina Wikipedia:Bot, la dicitura "i bot non autorizzati possono venire bloccati" con qualcosa di meno interpretabile/equivocabile? grazie --Toobaz rispondi 04:00, 22 ott 2006 (CEST)

intendi in seso più lassivo o più restrittivo? Perché in realtà i bot appena creati devono fare un po' di rodaggio (ovviamente sotto controllo) prima di venir autorizzati, e già così c'è il rischio di venir loccati da qualche admin troppo zelante (a me scrissero in due o tre minacciando il blocco). paulatz XX 21:14, 24 ott 2006 (CEST)
Non credo siano necessarie modifiche, è necessario capire cosa sta facendo chi gestisce il bot e di solito ci si chiarisce - appunto - scrivendosi in talk o in mailbox. Chi manovra un bot non flaggato, che si presume sia in fase di test, o adoperato per operazioni occasionali, è bene che eviti di operare troppo velocemente (più di un edit ogni trenta secondi), altrimenti viene bloccato. --M/ 21:44, 24 ott 2006 (CEST)
Concordo e ho ripristinato l'espressione precedente. Era anche scorretta perché il blocco non è necessariamente dato infinite, e chi meritasse un blocco infinite è inutile che vada a chiedere l'etichettatura come bot; ed anche perché "eccessive modifiche" significa bot "fuori controllo". Però più che ai secondi, penserei di non compromettere il funzionamento della pagina delle modifiche recenti. Diversi utenti si mettono a fare microedit (categorie, minuzie varie; nonostante converrebbe loro per comodità e chiarezza della pagina dei contributi lasciare fare agli automi) e ne scattano parecchi ogni pochi secondi. --F. Cosoleto 03:25, 26 ott 2006 (CEST)

[modifica] Apriamo lo spumante e pensiamo al nome

Bene bene, finalmente ho un posto dove stressarvi di domande! :-)

Olé! ... hic...
Ingrandisci
Olé! ... hic...

Però ora servono proposte per il bar, avanti prego! --piero tasso 20:19, 24 ott 2006 (CEST)

Proposte

[modifica] Correzioni ortografiche automatiche

cb La discussione proviene dalla pagina Wikipedia:Bot/Autorizzazioni
– il cambusiere Nemo 19:47, 30 ott 2006 (CET)


Vorrei far presente un problema che riguarda un po' tutti i bot correttori dell'ortografia della lingua italiana o, piuttosto, tutte le voci che trattano di lingue diverse da quella italiana e che ne includono citazioni. I bot - anche mossi dalle migliori intenzioni - potrebbero fare danni difficili se non (quasi) impossibili da notare e correggere tempestivamente. In effetti credo che quasi nessun utente vada a verificare nel dettaglio le modifiche apportate da un bot, specie se flaggato. Pertanto, anche se si ha la voce modificata in watchlist, si rischia che persino l'autore di una voce dia per buona la modifica senza correggerla. Qui abbiamo un esempio nel quale un autore di una voce ha notato la modifica errata di Paulatzbot e l'ha corretta, ma mi domando in quanti casi la cosa passi inosservata. A me, che pure ho contribuito a quello specifico testo "scorretto" dal bot, era sfuggita. In potenza il problema non si presenta certo solo con il còrso, ma anche con altre lingue romanze. Ad esempio in portoghese "merlo" si scrive "melro": chi si accorgerebbe mai della modifica se per caso a qualcuno venisse in mente di istruire un bot ordinandogli di modificare "lr" in "rl"? Sempre in portoghese, "è" voce del verbo essere si scrive "é": come posso verificare che nessun a bot salti in mente di andare a "scorregere" eventuali citazioni in portoghese? Questi sono solo alcuni esempi e potrei continuare: i false friends abbondano in diverse lingue. Forse dovremmo pensare a qualche sorta di meccanismo che prevenga l'azione dei bot - almeno quelli flaggati e ben intenzionati - su voci che includano citazioni in altre lingue. --Piero Montesacro 10:57, 30 ott 2006 (CET)
Preciso che una soluzione accettabile potrebbe essere quella di creare un template "trasparente" che possa essere aggiunto dagli utenti interessati a proteggere dei paragrafi di una voce contenente citazioni da non modificare ortograficamente in automatico. Tale template potrebbe essere riconosciuto dai bot ortografici e il suo contenuto saltato automaticamente. In tal modo si faciliterebbe il lavoro dei botolatori e la responsabilità delle protezione delle citazioni resterebbe nelle mani degli utenti-autori. --Piero Montesacro 13:44, 30 ott 2006 (CET)

(conflittato) Allora,

  1. Una soluzione (quella più barbosa ma più sicura) sarebbe quella che tutti quelli che usano il bot per sostituzioni tipo perché e robe varie (che forse possono avere errori) lancino il bot in modalità manuale, cosa che comunque di sicuro nessuno farà mai (tranne i newbie di bot che dovranno imparare...) quindi in pratica questa proposta è teoricamente fattibile ma in pratica non lo è.
  2. Si potrebbe stillare una lista (che diventerà chilometrica ma vabbé) di eventuali eccezioni che non bisogna cambiare (alle quali il regex maker farà attenzione magari usando [^] o il comando -except:) per tutte le sostituzioni più comuni. Questo è fattibile ma cmq ci saranno probabilità di errore.
  3. Mettere (come propone Piero) un template o qualcosa che il bot possa riconoscere e saltare (che basta mettere col comando except e che è quindi fattibile) in tutte le voci che si sa o che si presume possano essere cambiate erroneamente o che presentano citazioni da altre lingue (che confondono il botolo). Il problema è che il discorso sarebbe "per quelli che vogliono e sanno dell'esistenza del template" lo mettono gli altri no, inoltre tutte delle 224.770 voci già esistenti che non sono in watchlist che se ne fa?

Possibile soluzione: Si potrebbe fare la seconda (la più sensata secondo me e la più utile) sperando che gli eventuali errori siano segnalati al "regex maker" di turno. Eventualmente la terza soluzione si potrebbe aggiungere ma resterebbe cmq in una parte relativa di pagine (che potrebbe cmq aiutare...), che dite? Ciao, Filnik Filbot wants (work for) you! 13:50, 30 ott 2006 (CET)

La seconda soluzione proposta da Filnik sembrerebbe la migliore, ma credo vi siano alcuni casi nei quali non possa funzionare. Un esempio è quello di "è"/"é" voce del verbo essere che avevo già citato nel mio precedente intervento. La soluzione proposta da me tende a minimizzare il problema lato botolatori e a lasciare agli utenti che seguono le voci dei tipi che citavo (che rappresentino una infima minoranza di quelle che abbiamo) il compito di proteggerle. Non penso poi sia poi così improbabile che molti utenti che si occupano di queste voci vengano informati dell'opportunità di usare il template "protettivo": attraverso i progetti e il bar una buona parte di loro sicuramente ne avranno notiza. Tanto per cominciare, io escluderei da subito dall'azione dei bot ciò che è già ora incluso nei template di citazione. --Piero Montesacro 14:50, 30 ott 2006 (CET)

(conflittato) Niente di ciò... Ci sono già stati operatori che sono intervenuti in maniera semiautomatica in maniera estesa (Alfiobot, e, in misura minore, io, che non siamo certo dei newbie; tra l'altro quando si hanno migliaia di regex la cosa è pure meno noiosa), ma a parte questo, la soluzione fattibile su larga scala è saltare le citazioni, come ha fatto, credo prima di me, il bot che si dedica a questo tipo di sostituzioni su en.wiki, e come fanno tutti i bot che gestisco (con delle differenze per il modulo per le segnalazioni di copyright, che ha richiesto una soluzione ad hoc ed ha qualche limitazione). Il problema nel saltare tutte le citazioni e i titoli è che l'autore del testo può omettere o aggiungere un carattere di troppo, rovesciando la situazione, ma ci sono dei sistemi di rilevamento attuabili per queste evenienze. Oltre a questo sistema, per escludere errori, si può applicare una strategia d'intervento, intervenendo con modalità diverse su voci ad esempio che stanno nelle categorie d'informatica, riducendo così i casi di controllo manuale.

Relativamente al periodo citato in quel link da Piero Montesacro, posso assicurare una verifica per tutti gli interventi dei bot posteriori a quella data, avendomi preso cura di conservare il dump del database di un momento precedente, per proteggerlo da una serie di sostituzioni dubbie (di cui Nemobis e la sua temperanza sono stati più volte responsabili, andando a sollecitare interventi automatici ben sapendo che non ci fosse il minimo consenso e della possibilità di errori, ed ingannando i destinatari dei messaggi). E appunto applicando in maniera inversa il sistema di esclusione che ho scritto, mesi fa ho iniziato a verificare le sostituzioni effettuate. Purtroppo non ho avuto il tempo di andare oltre il 20%, ma prima o poi la situazione verra coperta (e inizieranno gli annullamenti delle modifiche). --F. Cosoleto 15:04, 30 ott 2006 (CET)

Cosoleto, non sto dicendo che tu e Alfio siete dei newbie (anzi, di sicuro come "botolatore" valete forse il doppio di me...) ma sto dicendo che il "botolatore comune" dopo un tot di modifiche (che varia da persona a persona) si stufi di dare sempre l'ok e vista la (presunta) validità della regex schiaccia il "malefico" carattere a (per i non botolatori: mette in automatico il bot) più che altro si potrebbe forse fare una "commissione regex" o qualcosa di simile per verificare la validità delle regex (invece che solo Cosoleto fornisca quelle ufficiali o invece di provocare eventuali errori come faccio io)... Filnik Filbot wants (work for) you! 15:11, 30 ott 2006 (CET)

Personalmente, metterei subito in pratica l'idea di aggiungere un testo nascosto alle pagine da non correggere ortograficamente in automatico e di escluderle sempre e comunque dalle correzioni in automatico. È un'idea che avevo avuto anch'io, ma non sapendo come funzionano i programmi non sapevo come tradurla. Bisogna però evitare che sembri un'autorizzazione a fare tutto in automatico.
In generale, comunque, le varie espressioni regolari vengono provate molto e corrette prima di essere mandate in automatico (ad esempio il problema di «e'» mi pare sia stato risolto, non ricordo come), perciò gli errori si riducono in ogni caso; è però vero che non si può mai escludere un errore, motivo per cui personalmente controllo tutte le modifiche fatte da automi sulle pagine che ho negli osservati speciali (pratica che si potrebbe consigliare, da qualche parte, a tutti gli utenti) e ho controllato buona parte di quelle fatte a suo tempo da paulatz (a partire dalle pagine piú a rischio): a proposito delle quali, posso dire che hanno causato qualche problema solo cosidetto e sopratutto (oltre a se stesso che ora è stato tolto), e ne potrebbe causare qualcuno anche areazione, oltre a le fila che ovviamente non è da fare in automatico. Purtroppo non potevo chiedere a paulatz di farle in semiautomatico, e Cosoleto non è mai stato disponibile. Naturalmente io sarei ben felice di occuparmene.
Quanto alla commissione, trovo piú utile sfruttare questo spazio per parlare assieme delle varie espressioni regolari, per condividerle, migliorarle assieme, concordarle ecc. --Nemo 20:11, 30 ott 2006 (CET)

Forse ci sono già, però penso possa essere utile avere due elenchi di regex, uno con quelle sicure, uno con quelle potenzialmente problematiche, da usare solo in modalità semiautomatica; eventualmente avere una pagina dove discutere le regex. Per quanto riguarda il template di protezione, è secondo me una cosa un po' troppo tecnica, che molti utenti non capirebbero; cercherei un'altra soluzione. Cruccone (msg) 22:28, 30 ott 2006 (CET)
il problema c'è, si possono escogitare numerosi stratagemmi che riducono il numero di errori ma richiedono di mettere mano al codice del bot (tra parentesi la difficoltà di implementazione, tenuto conto anche delle interazioni con altri compiti):
  • saltare tutto il testo che sta dentro i template (Cioè tra {{ e }}), in particolare {{quote}}(MAN) [facile]
  • saltare il testo scritto in corsivo e le parole con l'iniziale maiuscola [difficile]
  • saltare tutte le pagine che contengono le parole "lingua", "dialetto" e "idioma" nel titolo [facile, ma brutale]
  • saltare tutte le pagine che contengono un determinato testo nascosto [facilissimo, ma poco pratico]
  • saltare tutte le pagine da una determinata lista [facilissimo e già in uso]
personalmente preferirei tenermi alla larga dalle correzioni ortografiche ancora per qualche mese. Ciao, -- paulatz XX 23:01, 30 ott 2006 (CET)
Be', saltare le parole maiuscole non è difficile, come neppure quelle in corsivo (se usiamo lo script replace) basta usare il comando [^] o basta che invece di mettere [Pp]erché mettiamo perché e stop. Mi piacerebbe sapere invece come fai a saltare le pagina da una lista (questo potrebbe tornarmi proprio utile...) ciao, Filnik Filbot wants (work for) you! 15:03, 31 ott 2006 (CET)

Due brevi note. Su Wikipedia, come si evince dalle pagine legate al funzionamento dei bot, e quella di en.wiki è molto più dettagliata e precisa a riguardo, interventi che possono produrre errori incontrollati semplicemente non sono ammessi. Poi, forse sopra non sono stato abbastanza chiaro, ma il DevotoBot già riesce a escludere tutti i casi di citazioni e titoli che ho potuto immaginare (e senza fare grandi o difficili modifiche al codice). È da mostrare un elenco, così vediamo se me n'è sfuggio qualcuno. Terza nota: se Nemo Bis è interessato a qualche sostituzione, non è necessario che si avventuri ad adoperare personalmente un bot, me ne posso occupare io stesso, previa verifica della correttezza e della presenza di consenso della richiesta avanzata. Ciao, --F. Cosoleto 17:03, 31 ott 2006 (CET)

Cosoleto, direi che potresti mettere a disposizione degli altri questi tuoi codici: l'idea di questa pagina del resto credo che sia proprio quella di aumentare la collaborazione fra i manovratori di automi, e un tuo intervento sarebbe un ottimo inizio. Quanto alle sostituzioni, non è affatto vero che sei disponibile, perché hai (giustamente) impedito la sostituzione automatica di le fila dicendo che bisogna farla in semiautomatico, senza però mai occupartene (e lo stesso per sopratutto e cosidetto nonché areazione, e anche per [quasi] tutti gli altri "errori comuni" che a tuo parere sarebbero addirittura senza eccezioni da correggere in semiautomatico!); per non parlare poi dei trattini. Preferisco poter fare io invece di aspettare un tuo intervento munifico, cosí da poter limitare le mie richieste di intervento automatico solo ai casi privi di rischio ed evitare di scaricare il problema su persone già oberate di lavoro come paulatz o di intervenire a posteriori (come ho fatto finora, con un metodo che tu definisci mendace). Nemo 20:44, 31 ott 2006 (CET)

perché hai (giustamente) impedito la sostituzione automatica di le fila dicendo che bisogna farla in semiautomatico, senza però mai occupartene (e lo stesso per sopratutto e cosidetto nonché areazione, e anche per [quasi] tutti gli altri "errori comuni" che a tuo parere sarebbero addirittura senza eccezioni da correggere in semiautomatico!);. Non mi sono mai espresso riguardo a "le file". Mi sono occupato di "sopratutto" e di "cosidetto" nell'unico modo possibile dopo una recente sostituzione di massa. Non saprei sull'aver detto che "tutti" gli "errori comuni" sono da fare in semiautomatico, bisognerebbe vedere meglio a cosa mi riferissi. Se ti dico che posso essere d'aiuto a riguardo, per me ha un solo significato, poi, libero di non crederci. --F. Cosoleto 11:50, 5 nov 2006 (CET)
Per due o tre volte di fila quando ho chiesto a qualche manovratore di automi di correggere quegli errori (in automatico, perché non posso pretendere un lavoro simile in semiautomatico! Poi si sono disposti tanto meglio) sei immediatamente intervenuto avvertendoli che sono un mentitore, che non devono fidarsi di me, che le correzioni contenute in quella pagina non vanno fatte in automatico ma solo in semiautomatico, ecc. Ecco a cosa ti riferivi. --Nemo 23:30, 5 nov 2006 (CET)
mantenete la calma. Gli errori comuni sono una brutta bestia, lo so bene per averci sbattutot le corna io stesso più volte. So anche che alcuni utenti per il gusto della diatriba filologica creano ancora più problemi. Infine posso dire che fare le sostituzioni in modo semiautomatico è impensabile perché terribilmente alienante e perché spero nessuno di noi disponga di tanto tempo per premere [invio].
Propongo di compilare qui o altrove due liste: una di sostituzioni standard già in forma di regex scelte in modo da essere particolarmente sicure e l'altra di pagine che non devono essere corretet in alcun caso. Ciao, paulatz XX 10:10, 6 nov 2006 (CET)
Mi sono distratto ed è passato un mese. In ordine inverso: che "quelle correzioni" vanno fatte in semiautomatico non sono solo io a dirlo, ma è "quella pagina" stessa sin dalla sua prima versione (che, ovviamente, mi spiace dirlo, andrai certo subito a correggere, per portarla alla tua visione delle cose, come, devo dire, si è visto troppe volte), oltre alla consuetidine, non essendosi mai viste certe cose (spero tu sia l'unico a teorizzare le sostituzioni automatiche nonostante lo spargimento consapevole di errori); ti sei andato a cercare ripetutamente manovratori di bot indicando di fare sostituzioni senza che ci sia un consenso su queste, cosa inconfutabile, e generando pure casini (vedi reazione di Cloj, oltre alla mia). Che tu ti rendessi conto di ciò o meno, ha relativamente poca importanza e ti voglio risparmiare una mia valutazione in merito, anche se considero il comportamento in ogni caso una grave mancanza personale. --F. Cosoleto 17:37, 14 dic 2006 (CET)
Quella pagina forse è evoluta in maniera diversa dal previsto, e contiene errori che in massima parte possono essere corretti in automatico. Comunque continui scientemente a confondere le acque: i tentativi di trovare un manovratore di automa disponibile che tu hai fatto fallire sono successivi alla risoluzione del problema sé stesso (sostituzione che ha fatto solo il buon Paulatz, e solo al primo passaggio), che è l'unica sostituzione automatica proposta che non avesse pieno consenso (anche se quando paulatz cominciò nessuno aveva mai protestato), e anche l'unica cui siano seguiti (pochissimi) errori (o forse c'era un sopratutto da mantenere, non ricordo, adesso). Nemo 22:20, 16 dic 2006 (CET)

[modifica] Regex e richieste cercasi

Ciao a tutti, sto programmando una girata di bot per le regex da usare solo in modalità manuale per evitare errori. Dato che è una cosa abbastanza pallosa (e che vuole un bel po' di tempo) stavo pensando di raccogliere un po' di regex e integrandole nel replace.py farle girare contemporaneamente. Ovviamente nell'oggetto metterò un link ad una sottopagina di Filbot dove spiego i vari tipi di modifiche, ecc... Per quanti volessero postarmi una regex o una richiesta per la "girata bot in manuale" postate nella mia pagina discussione! Ciao, Filnik Filbot wants (work for) you! 09:57, 1 nov 2006 (CET)

Dimenticavo, ho già E' => È e ne' => né

Intanto ti rispondo a quello che mi dicevi chiedevi qui sopra sull'escludere le voci da una lista: era una modifica a wikipedia.py che ho perso per sbaglio durante un aggiornamento del bot da CVS, ma ci metto poco a rifarla se necessario. Per il resto vorrei chiederti come hai intenzione di impostare la regex perché mi pare fosse proprio il tuo bot che aveva incasinato gli interwiki in arabo con una sostituzione simile ;-). Ciao, paulatz XX 10:04, 6 nov 2006 (CET)
Mi interesserebbe... in effetti il mio botolo è un po' casinaro :) (cmq riesco quasi sempre a mettere tutto a posto :) ) Filnik Filbot wants (work for) you! 15:25, 14 dic 2006 (CET)

[modifica] lonelypages.py

Ho fatto un bellissimo script! Praticamente mette il {{Orfana}} sulle voci orfane non segnalate. Pietrodn · blaterami 19:00, 16 nov 2006 (CET)

E quello vecchio di script? :P Filnik Filbot wants (work for) you! 12:49, 18 nov 2006 (CET)

Ehm questo script ha un grave bug: non riconosce le disambigue... attenti! Pietrodn · blaterami 21:16, 13 dic 2006 (CET)

interwiki.py riconosce le disambigue, se non sbaglio ha un codice che riconosce le pagine contenenti template come {{disambigua}}. Non saprei come implementarlo, però. Cruccone (msg) 21:51, 13 dic 2006 (CET)

Classes:
Page: A MediaWiki page
[...]
isDisambig (*)        : True if the page is a disambiguation page

In teoria però mi sembra che dovrebbe evitare di porlo se è presente un qualsiasi template (ad esempio un "da aiutare" per una voce brevissima e che potrebbe essere cancellata), se un re.search("{{.*?}}", testo) non restituisce un risultato. Oppure, si potrebbero scartare le pagine recenti, beccando quindi solamente le orfane datata ad esempio un mese (a questo si può arrivare con .getVersionHistory() ). --F. Cosoleto 16:46, 14 dic 2006 (CET)

[modifica] Aggiorna!

Ciao, viste le nuove funzioni implementate dal nuovo pywikipedia, vi consiglio vivamente di aggiornare pywikipedia :) Per più informazioni, guardate qua Filnik Filbot wants (work for) you! 22:27, 16 dic 2006 (CET)

THIS WEB:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia 2006:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu