當前位置：首頁 > 科技 > 軟件

走進Python Hash函數(shù)的魔幻世界：解密哈希算法與防碰撞技術(shù)

來源：責編：時間：2023-09-18 21:40:59 421觀看

導(dǎo)讀在計算機科學中，Hash函數(shù)（散列函數(shù)）是一種將輸入數(shù)據(jù)映射到固定大小的散列值（哈希值）的函數(shù)。Python提供了強大而靈活的Hash函數(shù)，用于在各種應(yīng)用中實現(xiàn)數(shù)據(jù)存儲、數(shù)據(jù)校驗、加密等功能。本文將從入門到精通介紹Python中Hash

在計算機科學中，Hash函數(shù)（散列函數(shù)）是一種將輸入數(shù)據(jù)映射到固定大小的散列值（哈希值）的函數(shù)。Python提供了強大而靈活的Hash函數(shù)，用于在各種應(yīng)用中實現(xiàn)數(shù)據(jù)存儲、數(shù)據(jù)校驗、加密等功能。本文將從入門到精通介紹Python中Hash函數(shù)的使用。

1.什么是Hash函數(shù)?

Hash函數(shù)是一種將輸入(任意長度)映射到固定大小(通常較小)輸出的算法。輸出的固定長度稱為哈希值。Hash函數(shù)有以下特性：

對于相同的輸入，必須始終產(chǎn)生相同的哈希值。
不同的輸入應(yīng)該具有不同的哈希值（盡可能避免沖突）。
不可逆性：無法從哈希值推導(dǎo)出原始輸入數(shù)據(jù)。
任意長度的輸入應(yīng)該產(chǎn)生固定長度的哈希值。

2.Python中的內(nèi)置Hash函數(shù)

Python內(nèi)置了一個hash()函數(shù)，用于計算對象的哈希值。不同類型的對象（如整數(shù)、字符串、元組等）具有不同的哈希函數(shù)實現(xiàn)。

# 使用hash()函數(shù)計算哈希值hash_value1 = hash(42)hash_value2 = hash("Hello, Python!")hash_value3 = hash((1, 2, 3))print(f"Hash value of 42: {hash_value1}")print(f"Hash value of 'Hello, Python!': {hash_value2}")print(f"Hash value of (1, 2, 3): {hash_value3}")

3. 常見的Hash算法

Python中常見的Hash算法包括MD5(Message Digest Algorithm 5)、SHA-1(Secure Hash Algorithm 1)和SHA-256等。這些算法被廣泛用于數(shù)據(jù)校驗、數(shù)據(jù)完整性驗證和密碼學中。首先，我們需要導(dǎo)入Python的hashlib模塊：

import hashlib

(1) 使用MD5算法計算Hash值

MD5算法會將任意長度的輸入轉(zhuǎn)換為128位的哈希值。然而，由于MD5的安全性較差，不再推薦在安全敏感的場景中使用。

data = "Hello, MD5!"# 創(chuàng)建MD5對象md5_obj = hashlib.md5()# 更新哈希對象以使用字符串md5_obj.update(data.encode())# 獲取MD5哈希值md5_hash = md5_obj.hexdigest()print(f"MD5 Hash of '{data}': {md5_hash}")

(2) 使用SHA-256算法計算Hash值SHA-256算法會將任意長度的輸入轉(zhuǎn)換為256位的哈希值，提供了更高的安全性，因此更適合用于數(shù)據(jù)校驗和加密。

data = "Hello, SHA-256!"# 創(chuàng)建SHA-256對象sha256_obj = hashlib.sha256()# 更新哈希對象以使用字符串sha256_obj.update(data.encode())# 獲取SHA-256哈希值sha256_hash = sha256_obj.hexdigest()print(f"SHA-256 Hash of '{data}': {sha256_hash}")

4.Hash在數(shù)據(jù)結(jié)構(gòu)中的應(yīng)用

在數(shù)據(jù)結(jié)構(gòu)中，Hash函數(shù)常用于實現(xiàn)Hash表（散列表）。Hash表是一種用于存儲鍵值對的數(shù)據(jù)結(jié)構(gòu)，它能夠在常數(shù)時間復(fù)雜度內(nèi)執(zhí)行插入、查找和刪除操作。Python中，我們可以使用字典（Dictionary）來實現(xiàn)Hash表。字典是一種無序的鍵值對集合，鍵必須是可哈希的數(shù)據(jù)類型。

# 創(chuàng)建一個字典person = {    "name": "John Doe",    "age": 30,    "email": "john@example.com"}# 添加新的鍵值對person["city"] = "New York"# 獲取鍵對應(yīng)的值print("Name:", person["name"])print("Age:", person["age"])print("Email:", person["email"])print("City:", person.get("city", "City not found"))# 刪除鍵值對del person["email"]# 檢查鍵是否存在if "email" in person:    print("Email found.")else:    print("Email not found.")

5.使用Hash進行數(shù)據(jù)校驗

Hash函數(shù)常用于數(shù)據(jù)完整性驗證，即確認數(shù)據(jù)在傳輸或存儲過程中是否被篡改。在這種應(yīng)用中，我們先計算原始數(shù)據(jù)的哈希值，然后將其與接收到的數(shù)據(jù)的哈希值進行比較。

import hashlibdef calculate_hash(data):    # 創(chuàng)建SHA-256對象    sha256_obj = hashlib.sha256()    # 更新哈希對象以使用數(shù)據(jù)    sha256_obj.update(data)    # 獲取SHA-256哈希值    return sha256_obj.digest()    # 原始數(shù)據(jù)original_data = b"Hello, Hash!"# 計算原始數(shù)據(jù)的哈希值original_hash = calculate_hash(original_data)# 模擬數(shù)據(jù)傳輸或存儲過程中數(shù)據(jù)被篡改tampered_data = b"Hello, Tampered Hash!"# 計算篡改后數(shù)據(jù)的哈希值tampered_hash = calculate_hash(tampered_data)# 對比哈希值if original_hash == tampered_hash:    print("Data integrity verified: Data is unchanged.")else:    print("Data integrity compromised: Data has been tampered with.")

6.安全性和沖突

Hash函數(shù)的安全性是指對于給定的哈希值，很難找到與之對應(yīng)的原始輸入數(shù)據(jù)。如果不同的輸入數(shù)據(jù)產(chǎn)生了相同的哈希值，就稱為哈希沖突。通常情況下，Hash算法都被設(shè)計為抵抗預(yù)像攻擊（Preimage Attack）和第二像攻擊（Second Preimage Attack），即找到原始數(shù)據(jù)或找到與給定哈希值相同的其他數(shù)據(jù)。然而，完全避免哈希沖突是不可能的。好的Hash算法應(yīng)該使沖突發(fā)生的概率盡可能小。

7.Hash表的實現(xiàn)

在前面的例子中，我們已經(jīng)使用Python的字典來演示了Hash表的功能。現(xiàn)在，我們來簡單了解一下Hash表的實現(xiàn)原理。Hash表的基本思想是通過Hash函數(shù)將鍵映射為索引，然后將鍵值對存儲在對應(yīng)索引的位置上。當我們需要訪問某個鍵的值時，使用Hash函數(shù)找到對應(yīng)的索引，從而快速獲取值。Python的字典實現(xiàn)了Hash表的所有功能，它使用了開放定址法解決哈希沖突，并且根據(jù)需要動態(tài)調(diào)整表的大小以保持性能。

8.哈希集合和哈希映射

在Python中，除了字典（哈希映射），還有集合（哈希集合）這一數(shù)據(jù)類型。集合是一組無序且唯一的元素的集合。

# 創(chuàng)建一個哈希集合fruits = {"apple", "banana", "orange", "apple", "grape"}print("Fruits:", fruits)  # 輸出：{'orange', 'banana', 'grape', 'apple'}

哈希集合的底層實現(xiàn)與哈希映射類似，只不過哈希集合只存儲鍵而沒有對應(yīng)的值。

9.使用Hash進行加密

除了數(shù)據(jù)校驗，Hash函數(shù)還廣泛應(yīng)用于密碼學中的密碼哈希。在存儲用戶密碼時，我們通常不會直接存儲原始密碼，而是將其計算哈希值后存儲。這樣即使數(shù)據(jù)庫泄漏，攻擊者也無法輕易獲取用戶的真實密碼。

import hashlibdef hash_password(password):    # 創(chuàng)建SHA-256對象    sha256_obj = hashlib.sha256()    # 更新哈希對象以使用密碼    sha256_obj.update(password.encode())    # 獲取SHA-256哈希值    return sha256_obj.hexdigest()    # 用戶注冊時設(shè)置密碼user_password = "my_secret_password"hashed_password = hash_password(user_password)# 模擬登錄驗證input_password = input("Enter your password: ")input_hashed_password = hash_password(input_password)if input_hashed_password == hashed_password:    print("Login successful.")else:    print("Invalid password. Please try again.")

10.如何通過hash判斷用戶上傳的文本文件是否重復(fù)

通過Hash來判斷用戶上傳的文本文件是否重復(fù)，可以利用Hash值的唯一性特性。當用戶上傳一個文本文件時，我們首先計算該文件的Hash值，并將該Hash值與之前上傳文件的Hash值進行對比。如果兩個文件的Hash值相同，那么這兩個文件很有可能是相同的，即重復(fù)上傳。以下是一個簡單的Python示例代碼來實現(xiàn)這個功能：

import hashlibdef calculate_file_hash(file_path):    # 創(chuàng)建SHA-256對象    sha256_obj = hashlib.sha256()    # 以二進制方式讀取文件內(nèi)容，避免文本編碼問題    with open(file_path, "rb") as file:        while chunk := file.read(8192):  # 每次讀取8KB數(shù)據(jù)            sha256_obj.update(chunk)            # 獲取文件的SHA-256哈希值    return sha256_obj.hexdigest()def is_file_duplicate(file_path, known_hashes):    file_hash = calculate_file_hash(file_path)    return file_hash in known_hashes    # 已知的Hash值集合，用于存儲之前上傳文件的Hash值known_hashes = set()# 假設(shè)用戶上傳了兩個文本文件file1_path = "path/to/uploaded_file1.txt"file2_path = "path/to/uploaded_file2.txt"# 檢查文件1是否重復(fù)if is_file_duplicate(file1_path, known_hashes):    print("File 1 is a duplicate.")else:    print("File 1 is unique.")    known_hashes.add(calculate_file_hash(file1_path))    # 檢查文件2是否重復(fù)if is_file_duplicate(file2_path, known_hashes):    print("File 2 is a duplicate.")else:    print("File 2 is unique.")    known_hashes.add(calculate_file_hash(file2_path))

在上面的代碼中，calculate_file_hash()函數(shù)用于計算文件的SHA-256哈希值。is_file_duplicate()函數(shù)用于判斷文件是否重復(fù)，它會將文件的Hash值與之前已知的Hash值集合進行對比。請注意，如果用戶上傳大量文件，已知的Hash值集合可能會變得非常大。在實際應(yīng)用中，你可能需要將已知的Hash值存儲在數(shù)據(jù)庫中，以便更高效地進行查找和比較。

結(jié)論Python的Hash函數(shù)提供了廣泛的應(yīng)用，從數(shù)據(jù)結(jié)構(gòu)到數(shù)據(jù)校驗、密碼學等領(lǐng)域都有重要作用。了解和熟練掌握Hash函數(shù)的使用，對于每個Python開發(fā)工程師來說都是必備的技能。無論你是在構(gòu)建數(shù)據(jù)結(jié)構(gòu)，進行數(shù)據(jù)校驗，還是在處理密碼和加密方面，Hash函數(shù)都能幫助你實現(xiàn)高效、安全的解決方案。

本文鏈接：http://m.www897cc.com/showinfo-26-10440-0.html走進Python Hash函數(shù)的魔幻世界：解密哈希算法與防碰撞技術(shù)

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Go語言進化之路：泛型的崛起與復(fù)用的新篇章

下一篇： Netty Promise和JavaScript Promise對比

標簽：

熱門焦點

官方承諾：K60至尊版將會首批升級MIUI 15

全新的MIUI 15今天也有了消息，在官宣了K60至尊版將會搭載天璣9200+處理器和獨顯芯片X7的同時，Redmi給出了官方承諾，K60至尊重大更新首批升級，會首批推送MIUI 15。也就是說雖然
掘力計劃第 20 期：Flutter 混合開發(fā)的混亂之治

在掘力計劃系列活動第20場，《Flutter 開發(fā)實戰(zhàn)詳解》作者，掘金優(yōu)秀作者，Github GSY 系列目負責人戀貓的小郭分享了Flutter 混合開發(fā)的混亂之治。Flutter 基于自研的 Skia 引擎
CSS單標簽實現(xiàn)轉(zhuǎn)轉(zhuǎn)logo

轉(zhuǎn)轉(zhuǎn)品牌升級后更新了全新的Logo，今天我們用純CSS來實現(xiàn)轉(zhuǎn)轉(zhuǎn)的新Logo，為了有一定的挑戰(zhàn)性，這里我們只使用一個標簽實現(xiàn)，將最大化的使用CSS能力完成Logo的繪制與動畫效果。新logo
深度探索 Elasticsearch 8.X：function_score 參數(shù)解讀與實戰(zhàn)案例分析

在 Elasticsearch 中，function_score 可以讓我們在查詢的同時對搜索結(jié)果進行自定義評分。function_score 提供了一系列的參數(shù)和函數(shù)讓我們可以根據(jù)需求靈活地進行設(shè)置。近期
微軟邀請 Microsoft 365 商業(yè)用戶，測試視頻編輯器 Clipchamp

8 月 1 日消息，微軟近日宣布即將面向 Microsoft 365 商業(yè)用戶，開放 Clipchamp 應(yīng)用，邀請用戶通過該應(yīng)用來編輯視頻。微軟于 2021 年收購 Clipchamp，隨后開始逐步整合到 Microsof
ESG的面子與里子

來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之三伏大幕拉起，各地高溫預(yù)警不絕，但處于厄爾尼諾大“烤”之下的除了眾生，還有各大企業(yè)發(fā)布的ESG報告。ESG是“環(huán)境保
華為將推出盤古數(shù)字人大模型可幫助用戶12小時完成數(shù)字人生成

在今日舉行的2023年華為云數(shù)字文娛AI創(chuàng)新峰會上，華為云全球Marketing與銷售服務(wù)總裁石冀琳表示，華為云將在后續(xù)推出盤古數(shù)字人大模型，可幫助用戶12小
到手價3099元起！iQOO Neo8 Pro今日首銷：安卓性能最強旗艦

5月23日，iQOO如期舉行了新品發(fā)布會，全新的iQOO Neo8系列也正式與大家見面，包含iQOO Neo8和iQOO Neo8 Pro兩個版本，其中標準版搭載高通驍龍8+，而Pro版更
最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現(xiàn)在已經(jīng)可以購買了，這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

走進Python Hash函數(shù)的魔幻世界：解密哈希算法與防碰撞技術(shù)

1.什么是Hash函數(shù)?

2.Python中的內(nèi)置Hash函數(shù)

3. 常見的Hash算法

(1) 使用MD5算法計算Hash值

4.Hash在數(shù)據(jù)結(jié)構(gòu)中的應(yīng)用

5.使用Hash進行數(shù)據(jù)校驗

6.安全性和沖突

7.Hash表的實現(xiàn)

8.哈希集合和哈希映射

9.使用Hash進行加密

10.如何通過hash判斷用戶上傳的文本文件是否重復(fù)

官方承諾：K60至尊版將會首批升級MIUI 15

掘力計劃第 20 期：Flutter 混合開發(fā)的混亂之治

CSS單標簽實現(xiàn)轉(zhuǎn)轉(zhuǎn)logo

深度探索 Elasticsearch 8.X：function_score 參數(shù)解讀與實戰(zhàn)案例分析

微軟邀請 Microsoft 365 商業(yè)用戶，測試視頻編輯器 Clipchamp

ESG的面子與里子

華為將推出盤古數(shù)字人大模型可幫助用戶12小時完成數(shù)字人生成

到手價3099元起！iQOO Neo8 Pro今日首銷：安卓性能最強旗艦

最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊