XSS攻击介绍及防御方法

XSS攻击(Cross Site Script Attack),中文名为跨站脚本攻击,下面将以一个简单的例子讲解XSS攻击原理。
 
页面http://www.domain.com/demo.php的代码如下:
<?php
// 关闭所有错误报告
ini_set('display_errors', 'Off'); // 将display_errors设置为Off
error_reporting(0);               // 关闭所有错误报告
?><!doctype html>
<html>
<head>
    <meta charset="utf-8">
    <title>XSS攻击</title>
</head>
<body>
<form method="get">
    <input name="keyword" type="text" value="<?php echo $_GET['keyword']; ?>" placeholder="请输入搜索关键字……">
    <input name="submit" type="submit" value="提交">
</form>
</body>
</html>

如果正常输入关键字是没有问题的,但是如果输入的是以下文本

"><script type="text/javascript">alert('XSS');</script><link id="

那么提交表单后的网页源代码将是以下内容:
<!doctype html>
<html>
<head>
    <meta charset="utf-8">
    <title>XSS攻击</title>
</head>
<body>
<form method="get">
    <input name="keyword" type="text" value=""><script type="text/javascript">alert('XSS');</script><link id="" placeholder="请输入搜索关键字……">
    <input name="submit" type="submit" value="提交">
</form>
</body>
</html>

很明显,网页HTML代码被插入了一段JavaScript代码,这就是XSS攻击原理,如果插入更加复杂的JavaScript代码或直接引用远程JavaScript文件还可以做到植入广告、盗取/污染cookie等。

从上面的代码不难看出防御XSS攻击的方法之一就是把用户输入内容里的特殊字符(单引号、双引号、大于号、小于号等)替换成HTML实体,这样一来就无法构成合法JavaScript代码,也就无法执行了,下面是常见的防御XSS攻击函数:
<?php
/**
 * 过滤XSS攻击
 *
 * @param string $str 要过滤的内容
 * @return string 过滤后的内容
 */
function filter_xss($str)
{
    $str = str_replace("'", '&#39;', $str);  // 替换单引号
    $str = str_replace('"', '&#34;', $str);  // 替换双引号
    $str = str_replace('<', '&#60;', $str);  // 替换小于号
    $str = str_replace('>', '&#62;', $str);  // 替换大于号
    $str = str_replace(':', '&#58;', $str);  // 替换冒号
    $str = str_replace('/', '&#47;', $str);  // 替换斜杠
    $str = str_replace('\\', '&#92;', $str); // 替换反斜杠

    return $str;
}

/**
 * 修复浏览器XSS hack的函数(来源:DedeCMS)
 *
 * @param string $val 需要处理的内容
 * @return string
 */
function RemoveXSS($val)
{
    $val = preg_replace('/([\x00-\x08,\x0b-\x0c,\x0e-\x19])/', '', $val);
    $search = 'abcdefghijklmnopqrstuvwxyz';
    $search .= 'ABCDEFGHIJKLMNOPQRSTUVWXYZ';
    $search .= '1234567890!@#$%^&*()';
    $search .= '~`";:?+/={}[]-_|\'\\';
    for ($i = 0; $i < strlen($search); $i++) {
        $val = preg_replace('/(&#[xX]0{0,8}' . dechex(ord($search[$i])) . ';?)/i', $search[$i], $val); // with a ;
        $val = preg_replace('/(&#0{0,8}' . ord($search[$i]) . ';?)/', $search[$i], $val); // with a ;
    }

    $ra1 = array('javascript', 'vbscript', 'expression', 'applet', 'meta', 'xml', 'blink', 'link', 'style', 'script', 'embed', 'object', 'iframe', 'frame', 'frameset', 'ilayer', 'layer', 'bgsound', 'title', 'base');
    $ra2 = array('oninput', 'onabort', 'onactivate', 'onafterprint', 'onafterupdate', 'onbeforeactivate', 'onbeforecopy', 'onbeforecut', 'onbeforedeactivate', 'onbeforeeditfocus', 'onbeforepaste', 'onbeforeprint', 'onbeforeunload', 'onbeforeupdate', 'onblur', 'onbounce', 'oncellchange', 'onchange', 'onclick', 'oncontextmenu', 'oncontrolselect', 'oncopy', 'oncut', 'ondataavailable', 'ondatasetchanged', 'ondatasetcomplete', 'ondblclick', 'ondeactivate', 'ondrag', 'ondragend', 'ondragenter', 'ondragleave', 'ondragover', 'ondragstart', 'ondrop', 'onerror', 'onerrorupdate', 'onfilterchange', 'onfinish', 'onfocus', 'onfocusin', 'onfocusout', 'onhelp', 'onkeydown', 'onkeypress', 'onkeyup', 'onlayoutcomplete', 'onload', 'onlosecapture', 'onmousedown', 'onmouseenter', 'onmouseleave', 'onmousemove', 'onmouseout', 'onmouseover', 'onmouseup', 'onmousewheel', 'onmove', 'onmoveend', 'onmovestart', 'onpaste', 'onpropertychange', 'onreadystatechange', 'onreset', 'onresize', 'onresizeend', 'onresizestart', 'onrowenter', 'onrowexit', 'onrowsdelete', 'onrowsinserted', 'onscroll', 'onselect', 'onselectionchange', 'onselectstart', 'onstart', 'onstop', 'onsubmit', 'onunload');
    $ra = array_merge($ra1, $ra2);

    $found = true;
    while ($found == true) {
        $val_before = $val;
        for ($i = 0; $i < sizeof($ra); $i++) {
            $pattern = '/';
            for ($j = 0; $j < strlen($ra[$i]); $j++) {
                if ($j > 0) {
                    $pattern .= '(';
                    $pattern .= '(&#[xX]0{0,8}([9ab]);)';
                    $pattern .= '|';
                    $pattern .= '|(&#0{0,8}([9|10|13]);)';
                    $pattern .= ')*';
                }
                $pattern .= $ra[$i][$j];
            }
            $pattern .= '/i';
            $replacement = substr($ra[$i], 0, 2) . '<x>' . substr($ra[$i], 2);
            $val = preg_replace($pattern, $replacement, $val);
            if ($val_before == $val) {
                $found = false;
            }
        }
    }
    return $val;
}

Copyright © 2024 码农人生. All Rights Reserved