MadCatERZ
Geoguru
Hallo,
ich habe mir für einen Cache ein kleines Tool geschrieben, das auf der Suche nach reverse md5-Hashes die einschlägigen Seiten crawlt und die Resultate lokal abspeichert. Daraus ist die Idee erwachsen, eine eigene md5-Datenbank anzulegen, zum Beispiel mit allen Hashes von Koordinaten in Deutschland.. Die Grundstruktur ist klar,
eine Tabelle bestehend aus PK, Hash(oder Hash als PK) und Langtext, nur: Reicht das, wenn irgendwann ein paar Millionen Einträge darinstehen? Oder wäre es sinnvoller, das ganze auf mehrere Tabellen zu verteilen, also
hash_begins_with_a,
hash_begins_with_b
etc...
Müsste ich das so machen oder reicht eine große Tabelle, vielleicht noch mit einer indizierten Spalte "first_char" ?
ich habe mir für einen Cache ein kleines Tool geschrieben, das auf der Suche nach reverse md5-Hashes die einschlägigen Seiten crawlt und die Resultate lokal abspeichert. Daraus ist die Idee erwachsen, eine eigene md5-Datenbank anzulegen, zum Beispiel mit allen Hashes von Koordinaten in Deutschland.. Die Grundstruktur ist klar,
eine Tabelle bestehend aus PK, Hash(oder Hash als PK) und Langtext, nur: Reicht das, wenn irgendwann ein paar Millionen Einträge darinstehen? Oder wäre es sinnvoller, das ganze auf mehrere Tabellen zu verteilen, also
hash_begins_with_a,
hash_begins_with_b
etc...
Müsste ich das so machen oder reicht eine große Tabelle, vielleicht noch mit einer indizierten Spalte "first_char" ?