通过对java.util.ZipInputStream的输入进行检查,可以防止消耗过多的系统资源。当资源使用大大多于输入数据所使用的资源的时候,就会出现拒绝服务问题。当需要解压一个小文件,比如zip、gif或者gzip编码的HTTP内容,会消耗过多的资源时,并且在压缩率极高的情况下,Zip算法的实现本身就会导致zip炸弹(zip bomb)的出现。zip算法能产生很高的压缩比率?[Mahmoud 2002]。 图2-1显示了一个文件可以从148MB压缩到590KB,压缩比率高达200:1。这个文件包含了多次出现的重复数据,比如交替出现的字符a和b。如果输入数据符合压缩算法的要求,或者可以使用更多的输入数据,或者可以使用其他的压缩方法,甚至还能达到更高的压缩比例。
在zip文件中的任何数据,如果其解压后的文件大小超出了一个特定的限制,那么就不应该将它们解压。而这个限制实际上取决于平台的能力。这条规则是更普遍的规则MSC07-J的一个特例。
下面是一个不符合规则的代码示例,它不能检查解压一个文件时所消耗的资源。它会允许操作完成,或者直至本地资源耗尽为止。static final int BUFFER = 512;
// ... // external data source: filename BufferedOutputStream dest = null; FileInputStream fis = new FileInputStream(filename); ZipInputStream zis = new ZipInputStream(new BufferedInputStream(fis)); ZipEntry entry; while ((entry = zis.getNextEntry()) != null) { ??System.out.println("Extracting: " + entry); ??int count; ??byte data[] = new byte[BUFFER]; ??// write the files to the disk ??FileOutputStream fos = new FileOutputStream(entry.getName()); ??dest = new BufferedOutputStream(fos, BUFFER); ??while ((count = zis.read(data, 0, BUFFER)) != -1) { ????dest.write(data, 0, count); ??} ??dest.flush(); ??dest.close(); } zis.close();在这个方案中, while循环中的代码会通过使用ZipEntry.getSize()方法在解压之前,得到zip文档中需解压文件的大小。如果该解压文件过大,比如说超过100MB,那么抛出异常。
static final int TOOBIG = 0x6400000; // 100MB ??// ... ??// write the files to the disk, but only if file is not insanely big ??if (entry.getSize() > TOOBIG) { ????throw new IllegalStateException("File to be unzipped is huge."); ??} ??if (entry.getSize() == -1) { ????throw new IllegalStateException( ????????????????"File to be unzipped might be huge."); ??} ??FileOutputStream fos = new FileOutputStream(entry.getName()); ??dest = new BufferedOutputStream(fos, BUFFER); ??while ((count = zis.read(data, 0, BUFFER)) != -1) { ????dest.write(data, 0, count); ??}