Generating a list of fake e-mail-addresses using bash, tr, sed and paste in Linux

(„Eine Liste falscher E-Mail-Adressen mit Linux generieren“)


All you need is a list of names (I’m using „census-dist-female-first.txt“ for this example, simply find that file using your favorite search engine), and a single bash command line on Linux:

cat census-dist-female-first.txt | tr "[:upper:]" "[:lower:]" | cut --delimiter=" " -f 1 | tr "\n" "," | sed 's/\,/\@freiwuppertal\.de\,/g' | tr "," "\n" | sort > output.txt ; paste --delimiter=";" output.txt output.txt | sed 's/\;/\"\>/g' | tr "\n" "," | sed 's/\,/\<\/a\>\,\<a\ href\=\"mailto\:/g' | tr "," "\n" | sed '$d' | sed '1d' > final-output.txt

This command line gives you two files, „output.txt“ and „final-output.txt“. The first file contains a simple text list of e-mail-addresses separated by newlines; the second file contains the same addresses as a list of HTML mailto: links.

It is probably a good idea to remove existing addresses (and any addresses which might be needed one day) from this list. Also, consider creating a redirection from one of these addresses to your personal address to see if somebody actually uses them. 😉

The result will look like this:
https://freiwuppertal.de/plone/sonstiges/contact-emails

(UPDATE 2015-08-05: Yes, I am actually receiving some SPAM e-mails sent to addresses in this list. Apparently, some bots are more stupid than I thought.)


German version:

Alles, was man dafür braucht, ist eine Namensliste (hier: “census-dist-female-first.txt”, einfach bei einer beliebigen Internetsuchmaschine eingeben), und eine einzige Befehlszeile in bash unter Linux:

cat census-dist-female-first.txt | tr "[:upper:]" "[:lower:]" | cut --delimiter=" " -f 1 | tr "\n" "," | sed 's/\,/\@freiwuppertal\.de\,/g' | tr "," "\n" | sort > output.txt ; paste --delimiter=";" output.txt output.txt | sed 's/\;/\"\>/g' | tr "\n" "," | sed 's/\,/\<\/a\>\,\<a\ href\=\"mailto\:/g' | tr "," "\n" | sed '$d' | sed '1d' > final-output.txt

Diese Befehlszeile erstellt zwei Dateien, „output.txt“ und „final-output.txt“. Die erste Datei enthält eine einfache Textliste von E-Mail-Adressen, die durch Zeilenumbrüche voneinander getrennt sind. Die zweite Datei enthält die gleichen Adressen als eine Liste von HTML-mailto:-Links.

Es macht Sinn, vorhandene und eventuell in der Zukunft benötigte Adressen aus dieser Liste zu entfernen, und eine der Adressen als Weiterleitung auf die persönliche E-Mail-Adresse einzurichten… um zu sehen, ob jemand die Liste tatsächlich nutzt.

Das Ergebnis sieht dann so aus:
https://freiwuppertal.de/plone/sonstiges/contact-emails

(UPDATE 2015-08-05: Ja, ich erhalte tatsächlich einige SPAM-E-Mails, die an diese Adressen gesendet wurden. Manche Bots scheinen dümmer zu sein, als ich dachte.)