PHP 实现base64编码文件上传出现问题详解

更新时间：2020年09月01日 10:57:52 作者：低调的码农

这篇文章主要介绍了PHP 实现base64编码文件上传出现问题详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

一、场景

领导：小A同学，我们要做一个样本上传进行分析的功能，你看下是否使用base64编码加进去，这样客户端的同学就不需要用form-data方式来上传了，直接使用json格式就可以上报，可以让格式上报统一。

小A：好的，领导，马上搞定！

咋看上面的对话没啥问题，很多公司团队内部为了一些标准化的问题，都会进行一些技术选型问题，但是噩梦也就从这个对话开始，功能实现当然都是很简单的，先来看简单流程图：

本身的流程是一个很简单的文件转换成base64上传，再服务端decode保存，在开发联调过程中没有问题，非常完美的走下去了。

二、问题来了

突然有一天终端同学误操作将一个37M文件上传，nginx与php-fpm文件上传限制均为（60M），但是在界面出现500错误，进入docker 日志查看有一条数据：

Allowed memory size of 8388608 bytes exhausted (tried to allocate 1298358 bytes)

玩php的基本都知道这是啥意思，就是代码运行过程中使用内存超过我们php.ini设置的memory_limit 的值，然后就屁颠屁颠进入php.ini找参数配置，很快找到：

memory_limit=128M

然后就转念一想，不应该出现这个问题，我们知道，php的内部变量使用cow（写时复制）机制来实现，那么内存申请只有在变量赋值变更才会进行

三、测验

接下来我们单独写一个程序来进行测试，将一个4.89M文件进行base64_encode 编码与base64_decode解码，查看各自占用内存以及过程中占用峰值内存

<?php
$mid = memory_get_usage();
$apk_content = file_get_contents(__DIR__ . '/4bc1c8a05b8505662be778b6dad23b55.apk');
var_dump('文件加载到内存：' . round((memory_get_usage() - $mid) / 1024 / 1024, 2) . 'M');
var_dump('过程中峰值使用的内存：' . round(memory_get_peak_usage() / 1024 / 1024, 2) . 'M');

unset($mid);
$mid = memory_get_usage();
$base64_encode = base64_encode($apk_content);unset($apk_content);
var_dump('base64_encode占用内存：' . round((memory_get_usage() - $mid) / 1024 / 1024, 2) . 'M');
var_dump('过程中峰值使用的内存：' . round(memory_get_peak_usage() / 1024 / 1024, 2) . 'M');

unset($mid);
$mid = memory_get_usage();
base64_decode($base64_encode);
var_dump('base64_decode占用内存：' . round((memory_get_usage() - $mid) / 1024 / 1024, 2) . 'M');
var_dump('过程中峰值使用的内存：' . round(memory_get_peak_usage() / 1024 / 1024, 2) . 'M');
unset($mid);

执行结果：

string(29) "文件加载到内存：4.89M"
string(38) "过程中峰值使用的内存：5.25M"
string(33) "base64_encode占用内存：1.63M"
string(39) "过程中峰值使用的内存：11.76M"
string(30) "base64_decode占用内存：0M"
string(38) "过程中峰值使用的内存：13.4M"

通过上面结果可以看出

加载文件使用内存没有太大问题，加载过程使用的峰值在5.25M，高出整体文件大小不多，这在文件加载过程有一些临时申请内存的问题
base64_encode占用内存，这个在使用的时候，就已经将内存差不多进行一个double，而这基本上也是在内核解析过程中，进行了内存申请，可以理解，文件本身占用内存+base64_encode 解析后的内存，两份内存同时存在的
base64_decode操作，这个操作就是解密了，解密过程中，这里直接就占用了3倍多的内存操作，问题就出在这里，在场景中出现的问题是一个37M的文件，为什么就把单个fpm的128M内存占满了呢

四、源码解析

base64_encode源码解析

首先找到对应的c文件 base64.c,找到里面php_base64_encode函数

PHPAPI zend_string *php_base64_encode(const unsigned char *str, size_t length) /* {{{ */
{
	const unsigned char *current = str;
	unsigned char *p;
	zend_string *result;

	result = zend_string_safe_alloc(((length + 2) / 3), 4 * sizeof(char), 0, 0);
	p = (unsigned char *)ZSTR_VAL(result);
    ...
}

我们先来分析这段代码，因为这里涉及到内存的问题，那么我们就看

result = zend_string_safe_alloc(((length + 2) / 3), 4 * sizeof(char), 0, 0);

这啥意思呢？

申请内存，最终调用的函数是：

safe_emalloc(size_t nmemb, size_t size, size_t offset)

在wiki上解释是：

void *safe_emalloc(size_t nmemb, size_t size, size_t offset)分配缓冲区来存放每块大小为 size 字节的 nmemb 块，并附加 offset 字节。类似于 emalloc(nmemb * size + offset)，但增加了针对溢出的特殊保护。

那么我可以简单的认为，就是在encode过程中，重新申请了内存，申请的内存大小是文件本身的 4/3 大小，加上原来的文件本身大小，那么峰值大小可以理解为

峰值内存= 7/3 *4.89 = 11.41

那么与我们实验过程中峰值大小基本是相符。

base64_decode操作

同样我们进行源码分析

PHPAPI zend_string *php_base64_decode_ex(const unsigned char *str, size_t length, zend_bool strict) /* {{{ */
{
	const unsigned char *current = str;
	int ch, i = 0, j = 0, padding = 0;
	zend_string *result;

	result = zend_string_alloc(length, 0);
	...
}

这里使用的zend_string_alloc来进行申请内存，那么底层使用的函数就是emalloc函数，来看下wiki的解释

void *emalloc(size_t size)分配 size 字节的内存。

这个就比较好理解了，传入参数内存再进行一个double拷贝就可以，

那么我们进行一个decode的内存峰值的计算：

峰值内存=(4/3+4/3) *4.89 =13.04

基本与我们测试的结果相差不多，因为精度关系，我们进行四舍五入的计算，测试代码是精准计算，所以会有小数点偏差。

五、总结

那这就可以理解为什么一个为什么在我们一个37M的文件，不能再128M内存进行base64_encode与base64_decode操作，当然这里有一些临时变量没有及时释放内存的情况，但是通过源码分析可以知道，要做一次这样场景来进行文件上传，单纯文件的内存损耗是2.6倍左右，所以为了节省内存，我们不要再用这个方式来进行操作了，很费内存的

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

php实现查看邮件是否已被阅读的方法
当你在发送邮件时，你或许很想知道该邮件是否被对方已阅读，下面有段不错的代码可以实现此需求，喜欢的朋友可以参考下
2013-12-12
php提供实现反射的方法和实例代码
在本篇文章里我们给各位分享了一篇关于php提供实现反射的方法和实例代码相关内容，有兴趣的朋友们参考下。
2019-09-09
PHP判断变量是否为0的方法
这篇文章主要介绍了PHP判断变量是否为0的方法,需要的朋友可以参考下
2014-02-02
php的POSIX 函数以及进程测试的深入分析
本篇文章是对php的POSIX函数以及进程测试进行了详细的分析介绍，需要的朋友参考下
2013-06-06
php常用字符函数实例小结
这篇文章主要介绍了php常用字符函数,结合实例形式总结分析了php常用字符函数substr、preg_match、strpos、dirname及str_split功能、用法与相关注意事项,需要的朋友可以参考下
2016-12-12
谨慎使用PHP的引用原因分析
PHP中也引入了引用类型，在对对象赋值传递上，基本可视为是同于Java/C#的引用传递（具体请见Objects and references）。但同时又支持在基础类型上通过引用运算符(&)来获得内容的引用。不过在实际的使用中，PHP的引用类型因为整个PHP设计结构而存在着许多的问题，使得在程序出现非预计的结果
2012-09-09
PHP封装类似thinkphp连贯操作数据库Db类与简单应用示例
这篇文章主要介绍了PHP封装类似thinkphp连贯操作数据库Db类与简单应用,涉及php基于mysqli的数据库连接、增删改查、异常处理等相关操作技巧,需要的朋友可以参考下
2019-05-05
UCenter中的一个可逆加密函数authcode函数代码
浏览UCenter源代码的时候发现这个函数，刚好有需要，就记录一下。
2010-07-07
PHP中CURL的CURLOPT_POSTFIELDS参数使用细节
CURL确实是一个不错的好工具，不仅在PHP中还是其他的操作系统中，都是一个非常好用的。但是如果你有些参数没有用好的话，那可能会得不到自己理想中的结果
2014-03-03
PHP操作MongoDB实现增删改查功能【附php7操作MongoDB方法】
这篇文章主要介绍了PHP操作MongoDB实现增删改查功能,结合实例形式总结分析了php操作MongoDB的常用技巧,并附带php7操作MongoDB方法,具有一定参考借鉴价值,需要的朋友可以参考下
2018-04-04

PHP 实现base64编码文件上传出现问题详解

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具