Miklix

MurmurHash3C Hashcodecalculator

Gepubliceerd: 18 februari 2025 om 00:34:15 UTC

Hashcodecalculator die de MurmurHash3C-hashfunctie gebruikt om een hashcode te berekenen op basis van tekstinvoer of geüpload bestand.

Deze pagina is machinaal uit het Engels vertaald om hem voor zoveel mogelijk mensen toegankelijk te maken. Helaas is machinevertaling nog geen geperfectioneerde technologie, dus er kunnen fouten optreden. Als je dat liever hebt, kun je hier de originele Engelse versie bekijken:

MurmurHash3C Hash Code Calculator

MurmurHash3 is een niet-cryptografische hashfunctie die in 2008 door Austin Appleby is ontworpen. Het wordt veel gebruikt voor algemene hashing vanwege de snelheid, eenvoud en goede distributie-eigenschappen. MurmurHash-functies zijn met name effectief voor hash-gebaseerde datastructuren zoals hashtabellen, bloomfilters en datadeduplicatiesystemen.

De variant die op deze pagina wordt gepresenteerd is de 3C-variant, die is geoptimaliseerd voor 32-bits systemen, net als de 3A-variant. In tegenstelling tot de 3A-variant produceert deze echter 128-bits (16-bytes) hashcodes, die doorgaans worden weergegeven als een hexadecimaal getal van 32 cijfers.

Full disclosure: Ik heb de specifieke implementatie van de hashfunctie die op deze pagina wordt gebruikt niet geschreven. Het is een standaardfunctie die wordt meegeleverd met de programmeertaal PHP. Ik heb alleen de webinterface gemaakt om hem hier voor het gemak publiekelijk beschikbaar te maken.


Nieuwe Hashcode berekenen

Gegevens die via dit formulier worden verzonden of bestanden die via dit formulier worden geüpload, worden niet langer op de server bewaard dan nodig is om de gevraagde hashcode te genereren. Ze worden onmiddellijk verwijderd voordat het resultaat naar uw browser wordt teruggestuurd.

Invoergegevens:



De ingediende tekst is UTF-8 gecodeerd. Aangezien hashfuncties werken op binaire gegevens, zal het resultaat anders zijn dan wanneer de tekst in een andere codering zou zijn. Als je een hash moet berekenen van een tekst in een specifieke codering, moet je in plaats daarvan een bestand uploaden.



Over het MurmurHash3C-hashalgoritme

Ik ben geen wiskundige, maar ik zal proberen deze hashfunctie uit te leggen met behulp van een analogie die mijn mede-niet-wiskundigen kunnen begrijpen. Als u de voorkeur geeft aan een wetenschappelijk correcte, volledige wiskundige uitleg, dan weet ik zeker dat u die elders kunt vinden ;-)

Stel je nu voor dat je een grote doos met LEGO-stenen hebt. Elke keer dat je ze op een bepaalde manier rangschikt, maak je een foto. Hoe groot of kleurrijk de opstelling ook is, de camera geeft je altijd een kleine foto van een vast formaat. Die foto vertegenwoordigt jouw LEGO-creatie, maar dan in een compacte vorm.

MurmurHash3 doet iets soortgelijks met data. Het neemt elk soort data (tekst, getallen, bestanden) en krimpt het tot een kleine, vaste "vingerafdruk" of hashwaarde. Deze vingerafdruk helpt computers om data snel te identificeren, sorteren en vergelijken zonder naar het geheel te hoeven kijken.

Een andere analogie zou zijn als het bakken van een cake en MurmurHash3 is het recept om die cake om te toveren in een kleine cupcake (de hasj). Dit zou een proces van drie stappen zijn:

Stap 1: In stukken hakken (de gegevens opsplitsen)

  • Eerst verdeelt MurmurHash3 uw gegevens in gelijke stukken, alsof u een taart in gelijke vierkanten snijdt.

Stap 2: Meng als een gek (de stukken mengen)

  • Elk stuk ondergaat een wild mixproces:
    • Flipping: Net als bij het omdraaien van een pannenkoek worden de stukjes opnieuw gerangschikt.
    • Roeren: Voeg willekeurige ingrediënten toe (wiskundige bewerkingen) om de boel te mengen.
    • Squishing: De gegevens worden samengedrukt zodat geen enkel origineel stukje meer opvalt.

Stap 3: Laatste smaaktest (afronding)

  • Nadat alle stukjes zijn gemengd, roert MurmurHash3 het geheel nog een keer door om er zeker van te zijn dat zelfs de kleinste kruimel verandering in de oorspronkelijke gegevens de smaak (de hasj) compleet verandert.

Delen op BlueskyDelen op FacebookDelen op LinkedInDelen op TumblrDelen op XDelen op LinkedInPin op Pinterest

Mikkel Bang Christensen

Over de auteur

Mikkel Bang Christensen
Mikkel is de bedenker en eigenaar van miklix.com. Hij heeft meer dan 20 jaar ervaring als professioneel computerprogrammeur/softwareontwikkelaar en werkt momenteel fulltime voor een groot Europees IT-bedrijf. Als hij niet blogt, besteedt hij zijn vrije tijd aan een breed scala aan interesses, hobby's en activiteiten, die tot op zekere hoogte weerspiegeld kunnen worden in de verscheidenheid aan onderwerpen op deze website.