文件包含漏洞学习
文件包含漏洞学习
1.文件包含漏洞概述
和SQL注入等攻击方式一样,文件包含漏洞也是一种注入型漏洞,其本质就是输入一段用户能够控制的脚本或者代码,并让服务端执行。
什么叫包含呢?以PHP为例,我们常常把可重复使用的函数写入到单个文件中,在使用该函数时,直接调用此文件,而无需再次编写函数,这一过程叫做包含。
以PHP为例,常用的文件包含函数有以下四种
include(),require(),include_once(),require_once()
区别如下:
require():找不到被包含的文件会产生致命错误,并停止脚本运行
include():找不到被包含的文件只会产生警告,脚本继续执行
require_once()与require()类似:唯一的区别是如果该文件的代码已经被包含,则不会再次包含
include_once()与include()类似:唯一的区别是如果该文件的代码已经被包含,则不会再次包含
漏洞成因为:当利用这四个函数来包含文件时,不管文件是什么类型(图片、txt等等),都会直接作为php文件进行解析。
利用这个特性,我们可以读取包含敏感信息的文件。
2.本地文件包含LFI(Local File Inclusion)
本地文件包含漏洞,顾名思义,指的是能打开并包含本地文件的漏洞。大部分情况下遇到的文件包含漏洞都是LFI。
3.远程文件包含RFI(Remote File Inclusion)
远程文件包含漏洞。是指能够包含远程服务器上的文件并执行。由于远程服务器的文件是我们可控的,因此漏洞一旦存在危害性会很大。
但RFI的利用条件较为苛刻,需要php.ini中进行配置
- allow_url_fopen = On
- allow_url_include = On
两个配置选项均需要为On,才能远程包含文件成功。
在php.ini中,allow_url_fopen默认一直是On,而allow_url_include从php5.2之后就默认为Off。
4.包含姿势
file://协议
**file://**用于访问本地文件系统,在CTF中通常用来读取本地文件的且不受allow_url_fopen与allow_url_include的影响。
姿势:
1 | |
php://协议
php://input
php://input可以访问请求的原始数据的只读流, 将post请求中的数据作为PHP代码执行。当传入的参数作为文件名打开时,可以将参数设为php://input,同时post想设置的文件内容,php执行时会将post内容当作文件内容。从而导致任意代码执行。
利用条件:
- allow_url_include = On。
- 对allow_url_fopen不做要求。
姿势:
1 | |
php://filter
php://filter读取源代码并进行base64编码输出,不然会直接当做php代码执行就看不到源代码内容了。
利用条件:无甚
姿势:
1 | |
通过指定末尾的文件,可以读取经base64加密后的文件源码,之后再base64解码一下就行。
1 | |
其他姿势:
1 | |
效果跟前面一样,少了read等关键字。在绕过一些waf时也许有用。
phar://
phar就是php压缩文档。它可以把多个文件归档到同一个文件中,而且不经过解压就能被 php 访问并执行,与file:// php://等类似,也是一种流包装器。
使用Phar://伪协议流可以Bypass一些上传的waf,大多数情况下和文件包含一起使用,就类似于我们的压缩包(其实就是一个压缩包),只不过我们换了一种方式去执行而已
写一段小代码测试一下:
test.php
1 | |
然后将test.php压缩为test.zip,将压缩文件改后缀为.jpg
index.php
1 | |
成功包含

利用条件:
- php版本大于等于php5.3.0
姿势:
假设有个文件phpinfo.txt,其内容为<?php phpinfo(); ?>,打包成zip压缩包,如下:
指定绝对路径
1 | |
或者使用相对路径(这里test.zip就在当前目录下)
1 | |
zip://协议
利用条件:
- php版本大于等于php5.3.0
姿势:
构造zip包的方法同phar。
但使用zip协议,需要指定绝对路径,同时将#编码为%23,之后填上压缩包内的文件。
1 | |
date://协议
data:// 同样类似与php://input,可以让用户来控制输入流,当它与包含函数结合时,用户输入的data://流会被当作php文件执行。从而导致任意代码执行。
利用data:// 伪协议可以直接达到执行php代码的效果,例如执行phpinfo()函数:
利用条件:
php版本大于等于php5.2
allow_url_fopen :on
allow_url_include:on
姿势一:
1 | |
执行命令:
1 | |
姿势二:
1 | |
加号+的url编码为%2b,PD9waHAgcGhwaW5mbygpOz8+的base64解码为:<?php phpinfo();?>
执行命令:
1 | |
其中PD9waHAgc3lzdGVtKCd3aG9hbWknKTs/Pg==的base64解码为:<?php system('whoami');?>
session文件包含
利用条件:session文件路径已知,且其中内容部分可读写。
姿势:
php的session文件的保存路径可以在phpinfo的session.save_path看到
常见的php-session存放位置:
- /var/lib/php/sess_PHPSESSID
- /var/lib/php/sess_PHPSESSID
- /tmp/sess_PHPSESSID
- /tmp/sessions/sess_PHPSESSID
session的文件名格式为sess_[phpsessid]。而phpsessid在发送的请求的cookie字段中可以看到。
要包含并利用的话,需要能控制部分sesssion文件的内容。暂时没有通用的办法。有些时候,可以先包含进session文件,观察里面的内容,然后根据里面的字段来发现可控的变量,从而利用变量来写入payload,并之后再次包含从而执行php代码.
例题
首先用php://filter伪协议读取到代码,
题目涉及到登陆注册界面,先考虑sql注入,往往注册与登陆操作中会有与数据库交互的地方也是sql注入的常见引发点。
register.php源代码
1 | |
再看一下login.php源代码
1 | |
数据库连接部分使用了mysqli预处理。
只要用了 预处理语句(prepare + bind_param/execute),就能大幅降低 SQL 注入风险。
接着再看看,有哪些参数是可控的。
在login.php中:
1 | |
这里使用了session来保存用户会话
变量$username是我们可控的,并且被设置到了$_SESSION中,因此我们输入的数据未经过滤的就被写入到了对应的sessioin文件中。结合前面的php文件包含,可以推测这里可以包含session文件
要包含session文件,需要知道文件的路径。常见的php-session存放位置在前文已经列举过了。
能包含,并且控制session文件,但要写入可用的payload,还需要绕过:
1 | |
输入的用户名会被base64加密。如果直接用php伪协议来解密整个session文件,由于序列化的前缀,势必导致乱码。
考虑一下base64的编码过程。比如编码abc。
1 | |
PHP 在保存到 session 文件时会序列化成:
1 | |
username|s:12:"→ 这是 前缀,描述键名和字符串长度。QUJDREVGR0g=→ 这是 base64 编码后的内容。";→ 结束符。
考虑一下session的前缀:username|s:12:",中间的数字12表示后面base64串的长度。当base64串的长度小于100时,前缀的长度固定为15个字符,当base64串的长度大于100小于1000时,前缀的长度固定为16个字符。
由于16个字符,恰好满足一下条件:
1 | |
再解释一下上面的式子:
- 原始数据是按 8 位(1字节)存储的。
- Base64 编码时,把原始比特流切成 6 位一组。
- 每一组 6 位再映射成一个 Base64 字符。
所以,1 个 Base64 字符代表 6 位信息。
原始数据是按字节(8 位)存储的,但编码结果是按 6 位分组的。
为了不丢信息,Base64 要保证:
用 N 个 6 位分组拼起来时,能正好覆盖某个整数个字节(8 位一组)。
这就等价于:
$$
N×6≡0(mod8)N
$$
也就是说,当对session文件进行base64解密时,前16个字符固然被解密为乱码,但不会再影响从第17个字符后的部分也就是base64加密后的username。
Get Flag
注册一个账号,比如:
1 | |
其base64加密后的长度为128,大于100。
1 | |
包含日志
访问日志
利用条件: 需要知道服务器日志的存储路径,且日志文件可读。
姿势:
很多时候,web服务器会将请求写入到日志文件中,比如说apache。

在用户发起请求时,会将请求写入access.log,当发生错误时将错误写入error.log。默认情况下,日志保存路径在 /var/log/apache2/。
但如果是直接发起请求,会导致一些符号被编码使得包含无法正确解析。可以使用burp截包后修改。
正常的php代码已经写入了 /var/log/apache2/access.log。然后进行包含即可。
在一些场景中,log的地址是被修改掉的。你可以通过读取相应的配置文件后,再进行包含。
SSH log
利用条件:需要知道ssh-log的位置,且可读。默认情况下为 /var/log/auth.log
姿势:
用ssh连接:
1 | |
之后会提示输入密码等等,随便输入。
然后在remotehost的ssh-log中即可写入php代码:
之后进行文件包含即可。
包含fd
因为 Apache 的日志(比如错误日志)里会记录一些信息,比如请求头。
所以攻击者可以把一段 PHP 代码(比如 <?php ... ?>)塞进 Referer 请求头,这样日志文件里就会出现这段代码。
如果网站有 LFI 漏洞,可以让它“包含”日志文件,那么日志里的 PHP 代码就会被执行。
包含 Apache 错误日志信息 的 proc 文件会在 /proc/self/fd/ 下变化,例如 /proc/self/fd/2、**/proc/self/fd/10** 等。
包含environ
利用条件:
- php以cgi方式运行,这样environ才会保持UA头。
- environ文件存储位置已知,且environ文件可读。
姿势:
proc/self/environ中会保存user-agent头。如果在user-agent中插入php代码,则php代码会被写入到environ中。之后再包含它,即可。
包含临时文件
php中上传文件,会创建临时文件。在linux下使用/tmp目录,而在windows下使用c:\winsdows\temp目录。在临时文件被删除之前,利用竞争即可包含该临时文件。
由于包含需要知道包含的文件名。一种方法是进行暴力猜解,linux下使用的随机函数有缺陷,而window下只有65535中不同的文件名,所以这个方法是可行的。
另一种方法是配合phpinfo页面的php variables,可以直接获取到上传文件的存储路径和临时文件名,直接包含即可。
例题
XMAN夏令营-2017-babyweb-writeup | Chybeta
题目要求上传后缀为.gif或者.jpg的文件,它先将我们上传的文件保存到uploads文件夹下,然后sleep(2),接着调用imagecreatefromgif等一系列操作。如果我们上传一个包含php代码的图片木马,在经过imagecreatefromgif等一系列操作后,正常情况下其中的php代码会被去掉,也就是说操作过后的图片已经不是图片木马了。不过由于存在sleep(2),可以利用这个两秒的空隙,利用phar或者zip协议去包含我们上传的还未被删除的图片木马。

从上文中利用phar或者zip协议的方法,显然我们需要把一句话木马压缩为.zip。
上传时将其文件名改为k.jpg,类型改为image/jpeg。在上传后访问http://202.112.51.217:8199/uploads/,去获取最新的文件名,然后用协议去包含。如果手动的话时间肯定会超过2s,所以需要用脚本。
绕过姿势
平常碰到的情况肯定不会是简简单单的include $_GET['file'];这样直接把变量传入包含函数的。在很多时候包含的变量/文件不是完全可控的,比如下面这段代码指定了前缀和后缀:
1 | |
这样就很“难”直接去包含前面提到的种种文件。
指定前缀
先考虑一下指定了前缀的情况吧。测试代码:
1 | |
目录遍历
这个最简单了,简要的提一下。
现在在/var/log/test.txt文件中有php代码<?php phpinfo();?>,则利用../可以进行目录遍历,比如我们尝试访问:
1 | |
则服务器端实际拼接出来的路径为:/var/www/html/../../log/test.txt,也即/var/log/test.txt。从而包含成功。
编码绕过
服务器端常常会对于../等做一些过滤,可以用一些编码来进行绕过。
- 利用url编码
- ../
- %2e%2e%2f
- ..%2f
- %2e%2e/
- ..\
- %2e%2e%5c
- ..%5c
- %2e%2e\
- ../
- 二次编码
- ../
- %252e%252e%252f
- ..\
- %252e%252e%255c
- ../
- 容器/服务器的编码方式
- ../
- ..%c0%af
- %c0%ae%c0%ae/
- 注:java中会把”%c0%ae”解析为”\uC0AE”,最后转义为ASCCII字符的”.”(点)
- Apache Tomcat Directory Traversal
- ..\
- ..%c1%9c
- ../
指定后缀
接着考虑指定后缀的情况。测试代码:
1 | |
URL
url格式:
姿势一:query(?)
原理:浏览器或服务器会把 ?.php 当成“请求参数”,而不是文件名的一部分。
1 | |
姿势二:fragment(#)
原理:URL 里的 # 表示 片段定位符(fragment),浏览器只在本地解析,不会传给远程服务器。
1 | |
利用协议
前面有提到过利用zip协议和phar协议。
长度截断
利用条件: php版本 < php 5.2.8
目录字符串,在linux下4096字节时会达到最大值,在window下是256字节。只要不断的重复./
1 | |
则后缀/test/test.php,在达到最大值后会被直接丢弃掉。
0字节截断
利用条件: php版本 < php 5.3.4
1 | |
能利用00截断的场景现在应该很少了:)