Qualquer um que tenha um blog com comentários dos usuários conhece o problema: spam de comentários. Este blog recebe centenas de comentários por dia sobre assuntos tão diversos quanto viagra ou tramadol, fotos de angelina jolie e britney spears nuas, encontros, jogos online e uma série de outras coisas que não tem absolutamente nada a ver com o assunto desse blog.
Quem usa WordPress certamente conhece o Akismet, um plugin com um filtro de spam, semelhante ao de Gmail, que acerta mais de 97% das vezes neste humilde blog. É fabuloso. Mas de vez em quando erra.
Se o Akismet deixa passar um comentário que deveria ter sido considerado spam, tudo bem, eu modero isso manualmente. Mas quando ele coloca na caixa de spam um comentário legítimo, o risco de que esse comentário se perca no meio das centenas de spam que recebo todos os dias é muito alto. Verificar a caixa de spams é um trabalho extremamente chato.
Foi pensando nisso que eu criei o Navalha do Spam, um pequeno script Python
Então o que o Navalha faz é ler uma lista de expressões, uma por linha, no arquivo keywords, e excluir todos os comentários que estiverem na caixa de spam e contiverem qualquer uma dessas palavras.
Para usá-lo, você vai precisar apenas de Python e MySQLdb. Coloque os dados de sua conexão no arquivo settings.py. Depois basta executar, dentro do diretório do script:
$ python spamkill.py
E pronto. Aqui para mim o resultado é que geralmente sobra meia dúzia de comentários. Dois ou três legítimos, que eu vou restaurar. Se ainda sobrar muito spam depois de rodar o script, é hora de olhar o que sobrou e incluir novas palavras chaves no arquivo de keywords.
View Comments (3)
Legal! Mas, qual é a extensão do arquivo "keywords" ?
Oi, Rodrigo,
Obrigado pela sugestão. Dificilmente o pessoal do Akismet se interessaria por isso, uma vez que desenvolvi em Python e o Akismet, assim como o Wordpress, é em PHP.
Mas, se alguém estiver afim de verter esse código para PHP, o que não deve ser difícil, e enviá-lo ao pessoal do Akismet, ou criar um outros plugin para Wordpress, fique à vontade.
Não seria mais interesse enviar um "patch" para o pessoal que escreve Akismet para que o produto fosse melhorado, e assim ajudando a todos, mesmo os que não acompanham esse blog?!