關(guān)于Java下奇怪的Base64詳解
下面這一段代碼中會(huì)報(bào)錯(cuò)。
package jiangbo.java.lang;import java.io.IOException;import java.nio.charset.Charset;import javax.xml.bind.DatatypeConverter;import sun.misc.BASE64Decoder;import sun.misc.BASE64Encoder;public class Base64Demo { public static void main(String[] args) throws IOException { String name = 'jiangbo'; Charset utf8 = Charset.forName('UTF-8'); BASE64Encoder base64Encoder = new sun.misc.BASE64Encoder(); String BASE64EncoderString = base64Encoder.encode(name.getBytes(utf8)); System.out.println(BASE64EncoderString); BASE64Decoder base64Decoder = new sun.misc.BASE64Decoder(); byte[] decodeBuffer = base64Decoder.decodeBuffer(BASE64EncoderString); System.out.println(new String(decodeBuffer, utf8)); String base64String = DatatypeConverter.printBase64Binary(name.getBytes(utf8)); System.out.println(base64String); byte[] base64Binary = DatatypeConverter.parseBase64Binary(base64String); System.out.println(new String(base64Binary, utf8)); }}
接下來(lái)我們分別查看一些這兩個(gè)代碼,我們發(fā)現(xiàn) BASE64Encoder().encode 在進(jìn)行base64編碼的時(shí)候進(jìn)行了換行,換行符的ascii編碼對(duì)應(yīng)的是 0x0a ,所以剛好命中這個(gè)報(bào)錯(cuò)。
代碼實(shí)現(xiàn)如下,進(jìn)行分別拆解。
public void decodeBuffer(InputStream var1, OutputStream var2) throws IOException { int var4 = 0; PushbackInputStream var5 = new PushbackInputStream(var1); this.decodeBufferPrefix(var5, var2); while(true) { try { int var6 = this.decodeLinePrefix(var5, var2); int var3; for(var3 = 0; var3 + this.bytesPerAtom() < var6; var3 += this.bytesPerAtom()) {this.decodeAtom(var5, var2, this.bytesPerAtom());var4 += this.bytesPerAtom(); } if (var3 + this.bytesPerAtom() == var6) {this.decodeAtom(var5, var2, this.bytesPerAtom());var4 += this.bytesPerAtom(); } else {this.decodeAtom(var5, var2, var6 - var3);var4 += var6 - var3; } this.decodeLineSuffix(var5, var2); } catch (CEStreamExhausted var8) { this.decodeBufferSuffix(var5, var2); return; } }}
首先 decodeLinePrefix 返回的是 bytesPerLine 定義的長(zhǎng)度72。
public void decodeBuffer(InputStream var1, OutputStream var2) throws IOException { int var4 = 0; PushbackInputStream var5 = new PushbackInputStream(var1); this.decodeBufferPrefix(var5, var2); while(true) { try { int var6 = this.decodeLinePrefix(var5, var2); protected int decodeLinePrefix(PushbackInputStream var1, OutputStream var2) throws IOException { return this.bytesPerLine(); } protected int bytesPerLine() { return 72; }
緊接著調(diào)用 decodeAtom 進(jìn)行處理,其中 bytesPerAtom 定義的數(shù)值是4。
int var3; for(var3 = 0; var3 + this.bytesPerAtom() < var6; var3 += this.bytesPerAtom()) {this.decodeAtom(var5, var2, this.bytesPerAtom());var4 += this.bytesPerAtom(); } protected int bytesPerAtom() { return 4;}
我們看看 decodeAtom 進(jìn)行處理,先看看 readFully 方法。
protected void decodeAtom(PushbackInputStream var1, OutputStream var2, int var3) throws IOException { byte var5 = -1; byte var6 = -1; byte var7 = -1; byte var8 = -1; if (var3 < 2) { throw new CEFormatException('BASE64Decoder: Not enough bytes for an atom.'); } else { int var4; do { var4 = var1.read(); if (var4 == -1) {throw new CEStreamExhausted(); } } while(var4 == 10 || var4 == 13); this.decode_buffer[0] = (byte)var4; var4 = this.readFully(var1, this.decode_buffer, 1, var3 - 1);
在 readFully 當(dāng)中,4個(gè)字節(jié)為一個(gè)單位組合,經(jīng)過(guò)處理之后,結(jié)果是 [89,87,70,104] 。
89,87,70,104,61
接著會(huì)繼續(xù)循環(huán),那我們知道,這玩意嗎會(huì)按照4個(gè)字節(jié)為一個(gè)list去處理,前四個(gè)數(shù)據(jù)處理完之后,接下來(lái)的list是[61,,,],也就是說(shuō)在readFully循環(huán)處理的過(guò)程中,返回結(jié)果是-1
當(dāng)返回結(jié)果是-1的時(shí)候會(huì)進(jìn)入 CEStreamExhausted 進(jìn)行處理。
if (var4 == -1) { throw new CEStreamExhausted();
處理經(jīng)過(guò)返回null,也就是說(shuō)在這個(gè)異常里面是不會(huì)報(bào)錯(cuò)退出的。
那我們繼續(xù)看看,假設(shè)我們把后面字節(jié)補(bǔ)齊,變成
89,87,70,104,61,61,61,61
可以看到經(jīng)過(guò)處理之后變成[61,61,61,61]
0x61在ascii編碼里面代表 = ,進(jìn)入到case 2進(jìn)行處理。
89,87,70,104,61,61,61,61
實(shí)際可以看到 decode 處理數(shù)據(jù)是[97,97,97,-1]
我們?cè)诳纯?java.util.base64.decode 這個(gè)decode詞法解析器,在這里面會(huì)進(jìn)行兩種base64判斷。
private int decode0(byte[] src, int sp, int sl, byte[] dst) { int[] base64 = isURL ? fromBase64URL : fromBase64; int dp = 0; int bits = 0; int shiftto = 18; // pos of first byte of 4-byte atom while (sp < sl) { int b = src[sp++] & 0xff; if ((b = base64[b]) < 0) { if (b == -2) { // padding byte ’=’// = shiftto==18 unnecessary padding// x= shiftto==12 a dangling single x// x to be handled together with non-padding case// xx= shiftto==6&&sp==sl missing last =// xx=y shiftto==6 last is not =if (shiftto == 6 && (sp == sl || src[sp++] != ’=’) || shiftto == 18) { throw new IllegalArgumentException( 'Input byte array has wrong 4-byte ending unit');}break; } if (isMIME) // skip if for rfc2045continue; elsethrow new IllegalArgumentException( 'Illegal base64 character ' + Integer.toString(src[sp - 1], 16)); }
一種是判斷 YWFh= 中最后的 = ,也就是說(shuō) [89,87,70,104,61] 這個(gè)list經(jīng)過(guò)運(yùn)算之后如果是 = ,就會(huì)進(jìn)行下面判斷,不符合規(guī)則就會(huì)報(bào)錯(cuò) Input byte array has wrong 4-byte ending unit 。
而下面 isMIME 判斷是來(lái)自 Decoder.RFC4648 ,默認(rèn)是 false 。
public static byte[] decode(byte[] src) { return src.length == 0 ? src : Base64.getDecoder().decode(src);}public static Decoder getDecoder() { return Decoder.RFC4648;} static final Decoder RFC4648 = new Decoder(false, false); static final Decoder RFC4648_URLSAFE = new Decoder(true, false); static final Decoder RFC2045 = new Decoder(false, true);結(jié)語(yǔ)
簡(jiǎn)單做個(gè)總結(jié),也就是說(shuō)用 sun.misc.BASE64Decoder 這個(gè)方法做 base64 解碼的時(shí)候,針對(duì) base64 的兼容性更高,你在base64的字符串后面無(wú)論加多少個(gè) = 都沒(méi)關(guān)系,但是在例如 java.util.base64.decode 這類型嚴(yán)格按照 base64 規(guī)范的進(jìn)行解碼的方法下,就會(huì)出現(xiàn)報(bào)錯(cuò)。
那有啥用呢,比如在一些base64編碼環(huán)境下,可能檢測(cè)用的是 java.util.base64.decode 方法,實(shí)際后面業(yè)務(wù)解碼用的是 sun.misc.BASE64Decoder 這樣在前后不一致的情況下,會(huì)出現(xiàn)繞過(guò)的問(wèn)題。
到此這篇關(guān)于Java下奇怪的Base64的文章就介紹到這了,更多相關(guān)Java奇怪的Base64內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. python:刪除離群值操作(每一行為一類數(shù)據(jù))2. 使用ProcessBuilder調(diào)用外部命令,并返回大量結(jié)果3. 詳解Vue中Axios封裝API接口的思路及方法4. JSP實(shí)現(xiàn)客戶信息管理系統(tǒng)5. python中if嵌套命令實(shí)例講解6. python 批量下載bilibili視頻的gui程序7. python 通過(guò)exifread讀取照片信息8. 使用css實(shí)現(xiàn)全兼容tooltip提示框9. CSS自定義滾動(dòng)條樣式案例詳解10. python中HTMLParser模塊知識(shí)點(diǎn)總結(jié)
