在文件上傳到服務(wù)器的時(shí)候,我們希望能夠獲得文件的指紋以確定文件沒有被篡改過。
常用的算法最開始使用的是 MD5,隨后隨著技術(shù)的發(fā)展,MD5 算法已經(jīng)被確定是不安全的了。
目前可能使用更多的是 HSA3_256 哈希算法。
哈希算法通常有以下幾個(gè)特點(diǎn):
- 正像快速:原始數(shù)據(jù)可以快速計(jì)算出哈希值
- 逆向困難:通過哈希值基本不可能推導(dǎo)出原始數(shù)據(jù)
- 輸入敏感:原始數(shù)據(jù)只要有一點(diǎn)變動(dòng),得到的哈希值差別很大
- 沖突避免:很難找到不同的原始數(shù)據(jù)得到相同的哈希值
哈希算法主要有MD4、MD5、SHA。
- MD4 1990年 輸出128位 (已經(jīng)不安全)
- MD5 1991年 輸出128位 (已經(jīng)不安全)
- SHA-0 1993年 輸出160位 (發(fā)布之后很快就被NSA撤回,是SHA-1的前身)
- SHA-1 1995年 輸出160位 (已經(jīng)不安全)
- SHA-2包括SHA-224、SHA-256、SHA-384,和 SHA-512,分別輸出224、256、384、512位。 (目前安全)
在 Java 中,可以使用 Apache 提供的 Apache Commons Codec,非常容易的獲得文件的哈希字符串指紋。
方法也非常簡(jiǎn)單,第一步就是需要將文件讀取為 InputStream。
如果自己寫的話,可能這一步有點(diǎn)代碼。
你可以使用 Apache 提供的
FileUtils.openInputStream
就可以直接將文件讀取為 InputStream 了。
考察下面的代碼:
InputStream is = FileUtils.openInputStream(new
File(SCOConstants.PATH_DATA_EXCHANGE + "Estimated vs Original Manual
(JIRA) 10-23-20.csv"));
MD5 哈希

在文件讀取后,你只需要使用 Apache Commons Codec 提供的 DigestUtils 方法就可以了。
/**
* Test to get file's MD5 Hash
*
* @throws Exception
*/
@Test
public void fileMD5Test() throws Exception {
String md5 = StringUtils.EMPTY;
try {
InputStream is = FileUtils.openInputStream(new File(SCOConstants.PATH_DATA_EXCHANGE + "Estimated vs Original Manual (JIRA) 10-23-20.csv"));
md5 = DigestUtils.md5Hex(is);
} catch (Exception e) {
e.printStackTrace();
}
logger.debug("MD5 for File: {}", md5);
}
上面的代碼就可以直接獲得 InputStream 的 MD5 哈希。
程序的輸出為:
09:32:31.522 [main] DEBUG c.i.s.c.t.utilities.CodecUtilsTest - MD5
for File: 1ec6473fc1bd50a982767f555734af64
SHA3 256
與 MD5 哈希算法是一致的。

你需要首先也將文件讀取為 InputStream ,然后使用 Apache 提供的 DigestUtils.sha3_256Hex(is); 就可以了。
考察下面的代碼:
/**
* Test to get file's SHA3_256Hex Hash
*
* @throws Exception
*/
@Test
public void fileSHA3_256HexTest() throws Exception {
String sha3Hex256 = StringUtils.EMPTY;
try {
InputStream is = FileUtils.openInputStream(new File(SCOConstants.PATH_DATA_EXCHANGE + "Estimated vs Original Manual (JIRA) 10-23-20.csv"));
sha3Hex256 = DigestUtils.sha3_256Hex(is);
} catch (Exception e) {
e.printStackTrace();
}
logger.debug("SHA3_256Hex for File: {}", sha3Hex256);
}
運(yùn)行程序的輸出為:
09:35:48.093 [main] DEBUG c.i.s.c.t.utilities.CodecUtilsTest -
SHA3_256Hex for File:
47ec963787f3acf88747ca7a37ccac9e2cc9b05c87eda1852cb4bc3b0273a431