diff --git a/new/fuzzing-book-zh/1.md b/new/fuzzing-book-zh/1.md new file mode 100644 index 0000000000000000000000000000000000000000..99225c40938b6fbbe9d225bec3b58d1481a8c8b1 --- /dev/null +++ b/new/fuzzing-book-zh/1.md @@ -0,0 +1,3 @@ +# 生成软件测试 + +来源: [https://www.fuzzingbook.org/html/00_Table_of_Contents.html](https://www.fuzzingbook.org/html/00_Table_of_Contents.html) \ No newline at end of file diff --git a/new/fuzzing-book-zh/10.md b/new/fuzzing-book-zh/10.md new file mode 100644 index 0000000000000000000000000000000000000000..e1a7f948bc9834e43474627407c274507a7d3cd4 --- /dev/null +++ b/new/fuzzing-book-zh/10.md @@ -0,0 +1,1210 @@ +# 基于变异的模糊化 + +> 原文: [https://www.fuzzingbook.org/html/MutationFuzzer.html](https://www.fuzzingbook.org/html/MutationFuzzer.html) + +大多数[随机生成的输入](Fuzzer.html)在语法上都是*无效*,因此很快就被处理程序拒绝。 要行使输入处理之外的功能,我们必须增加获得有效输入的机会。 一种这样的方法就是所谓的*突变模糊测试*-也就是说,对现有输入进行小的更改,这些更改可能仍会保持输入有效,但会行使新的行为。 我们将展示如何创建此类突变,以及如何使用流行的AFL模糊器的中心概念来引导它们走向尚未发现的代码。 + +**前提条件** + +* 您应该知道基本的模糊测试是如何工作的。 例如,在[“模糊处理”](Fuzzer.html) 一章中。 + +## 内容提要 + +要使用本章中提供的代码来[,请编写](Importing.html) + +```py +>>> from [fuzzingbook.MutationFuzzer](MutationFuzzer.html) import + +``` + +然后利用以下功能。 + +本章介绍`MutationFuzzer`类,该类采用*种子输入*的列表,然后将其突变: + +```py +>>> seed_input = "http://www.google.com/search?q=fuzzing" +>>> mutation_fuzzer = MutationFuzzer(seed=[seed_input]) +>>> [mutation_fuzzer.fuzz() for i in range(10)] +['http://www.google.com/search?q=fuzzing', + 'http://www.g=oNogl.om/search?q=fuzzing/', + 'RttpX://w)ww.goo(gle.comq/sarc(q=fuzzng', + 'hdt8p://"wWw.goole.com/seDarb`*?q=fuzzing', + 'httop://www.CooglGe.om/s$arch?q=fuzzingY', + 'http://wwlw.google.c"om/secrch?yq=fuzzin', + 'hup://www.google.comC/search?q=fuzzing', + 'http://w7w.google.com/search?q=ufuzgzing', + 'http://www,google.com/sear4ch?.q=fuzzing', + 'http://w&ww.google.cKom/search7q=fuzzing'] + +``` + +`MutationCoverageFuzzer`保持输入的*种群*,然后对其进行演化以最大化覆盖范围。 + +```py +>>> mutation_fuzzer = MutationCoverageFuzzer(seed=[seed_input]) +>>> mutation_fuzzer.runs(http_runner, trials=10000) +>>> mutation_fuzzer.population[:5] +['http://www.google.com/search?q=fuzzing', + 'htTp://www.googld.cqom/searchq=fuzzIng', + 'htTp://www.gloogld.qom/|searchq=fuzzng', + 'htTp://www.googld.cqomo0searchq=fuzzIng', + 'htTp://www*goegld.cqoe/sa7#hq=fuzIng'] + +``` + +## 带有突变的 + +2013年11月,发布了 [American Fuzzy Lop](http://lcamtuf.coredump.cx/afl/) (AFL)的第一版。 从那时起,AFL已成为最成功的模糊测试工具之一,并具有许多特色,例如 [AFLFast](https://github.com/mboehme/aflfast) , [AFLGo](https://github.com/aflgo/aflgo) 和 [AFLSmart](https://github.com/aflsmart/aflsmart) (在 这本书)。 AFL使模糊测试成为自动漏洞检测的流行选择。 它是第一个证明可以在许多对安全性要求很高的实际应用程序中大规模自动检测漏洞的工具。 + +![American Fuzzy Lop Command Line User Interface](img/9b2f0f8d40bfc500d25dd91bdf3f77d3.jpg) + +
**Figure 1.** American Fuzzy Lop Command Line User Interface
+ +在本章中,我们将介绍突变模糊测试的基础。 接下来的下一章将进一步说明如何将模糊测试引导到特定的代码目标。 + +## 模糊化URL解析器 + +许多程序期望它们的输入以非常特定的格式输入,然后才能实际处理它们。 例如,考虑一个接受URL(Web地址)的程序。 该URL必须采用有效格式(即URL格式),以便程序能够对其进行处理。 当使用随机输入进行模糊测试时,我们实际产生有效URL的机会是多少? + +为了更深入地研究这个问题,让我们探索一下URL的组成。 URL由许多元素组成: + +```py +scheme://netloc/path?query#fragment +``` + +哪里 + +* `scheme`是要使用的协议,包括`http`,`https`,`ftp`,`file` ... +* `netloc`是要连接的主机的名称,例如`www.google.com` +* `path`是该主机上的路径,例如`search` +* `query`是键/值对的列表,例如`q=fuzzing` +* `fragment`是所检索文档中某个位置的标记,例如`#result` + +在Python中,我们可以使用`urlparse()`函数来解析URL并将其分解为各个部分。 + +```py +import [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) + +``` + +```py +try: + from [urlparse](https://docs.python.org/3/library/urlparse.html) import urlparse # Python 2 +except ImportError: + from [urllib.parse](https://docs.python.org/3/library/urllib.parse.html) import urlparse # Python 3 + +urlparse("http://www.google.com/search?q=fuzzing") + +``` + +```py +ParseResult(scheme='http', netloc='www.google.com', path='/search', params='', query='q=fuzzing', fragment='') + +``` + +我们将看到结果如何将URL的各个部分编码为不同的属性。 + +现在让我们假设我们有一个使用URL作为输入的程序。 为简化起见,我们不会让它做太多事情。 我们只是让它检查传递的URL的有效性。 如果URL有效,则返回True;否则返回True。 否则,将引发异常。 + +```py +def http_program(url): + supported_schemes = ["http", "https"] + result = urlparse(url) + if result.scheme not in supported_schemes: + raise ValueError("Scheme must be one of " + repr(supported_schemes)) + if result.netloc == '': + raise ValueError("Host must be non-empty") + + # Do something with the URL + return True + +``` + +现在让我们开始模糊`http_program()`。 为了模糊起见,我们使用了所有可打印的ASCII字符,包括`:`,`/`和小写字母。 + +```py +from [Fuzzer](Fuzzer.html) import fuzzer + +``` + +```py +fuzzer(char_start=32, char_range=96) + +``` + +```py +'"N&+slk%h\x7fyp5o\'@[3(rW*M5W]tMFPU4\\P@tz%[X?uo\\1?b4T;1bDeYtHx #UJ5w}pMmPodJM,_' + +``` + +让我们尝试对1000个随机输入进行模糊测试,看看我们是否取得了一些成功。 + +```py +for i in range(1000): + try: + url = fuzzer() + result = http_program(url) + print("Success!") + except ValueError: + pass + +``` + +实际获得有效URL的机会是什么? 我们需要以`"http://"`或`"https://"`开头的字符串。 让我们先来看`"http://"`案例。 这是我们需要开始的七个非常具体的字符。 随机产生这七个字符(字符范围为96个不同字符)的机会为$ 1:96 ^ 7 $,或者 + +```py +96 ** 7 + +``` + +```py +75144747810816 + +``` + +产生`"https://"`前缀的几率甚至更糟,为$ 1:96 ^ 8 $: + +```py +96 ** 8 + +``` + +```py +7213895789838336 + +``` + +这给了我们完全的机会 + +```py +likelihood = 1 / (96 ** 7) + 1 / (96 ** 8) +likelihood + +``` + +```py +1.344627131107667e-14 + +``` + +这是我们产生有效的URL方案所需的运行次数(平均): + +```py +1 / likelihood + +``` + +```py +74370059689055.02 + +``` + +让我们测量一下`http_program()`的运行时间: + +```py +from [Timer](Timer.html) import Timer + +``` + +```py +trials = 1000 +with Timer() as t: + for i in range(trials): + try: + url = fuzzer() + result = http_program(url) + print("Success!") + except ValueError: + pass + +duration_per_run_in_seconds = t.elapsed_time() / trials +duration_per_run_in_seconds + +``` + +```py +5.87425309995524e-05 + +``` + +那非常快,不是吗? 不幸的是,我们有很多需要解决的问题。 + +```py +seconds_until_success = duration_per_run_in_seconds * (1 / likelihood) +seconds_until_success + +``` + +```py +4368685536.722877 + +``` + +转化为 + +```py +hours_until_success = seconds_until_success / 3600 +days_until_success = hours_until_success / 24 +years_until_success = days_until_success / 365.25 +years_until_success + +``` + +```py +138.4352909195527 + +``` + +即使我们并行处理很多事情,我们仍需要等待数月至数年。 这是为了使*成功运行一次*,这将使`http_program()`更加深入。 + +基本的模糊测试会很好地进行测试`urlparse()`,如果此解析函数中有错误,则很有可能将其发现。 但是,只要我们无法产生有效的输入,我们就无法达到任何更深层次的功能。 + +## 突变输入 + +从头开始生成随机字符串的替代方法是从给定的*有效*输入开始,然后随后*对其进行*变异。 在此上下文中,*突变*是一种简单的字符串操作-例如,插入(随机)字符,删除字符或在字符表示中翻转一位。 这被称为*突变模糊测试*-与之前讨论的*世代模糊测试*技术相反。 + +以下是一些可以帮助您入门的变体: + +```py +import [random](https://docs.python.org/3/library/random.html) + +``` + +```py +def delete_random_character(s): + """Returns s with a random character deleted""" + if s == "": + return s + + pos = random.randint(0, len(s) - 1) + # print("Deleting", repr(s[pos]), "at", pos) + return s[:pos] + s[pos + 1:] + +``` + +```py +seed_input = "A quick brown fox" +for i in range(10): + x = delete_random_character(seed_input) + print(repr(x)) + +``` + +```py +'A uick brown fox' +'A quic brown fox' +'A quick brown fo' +'A quic brown fox' +'A quick bown fox' +'A quick bown fox' +'A quick brown fx' +'A quick brown ox' +'A quick brow fox' +'A quic brown fox' + +``` + +```py +def insert_random_character(s): + """Returns s with a random character inserted""" + pos = random.randint(0, len(s)) + random_character = chr(random.randrange(32, 127)) + # print("Inserting", repr(random_character), "at", pos) + return s[:pos] + random_character + s[pos:] + +``` + +```py +for i in range(10): + print(repr(insert_random_character(seed_input))) + +``` + +```py +'A quick brvown fox' +'A quwick brown fox' +'A qBuick brown fox' +'A quick broSwn fox' +'A quick brown fvox' +'A quick brown 3fox' +'A quick brNown fox' +'A quick brow4n fox' +'A quick brown fox8' +'A equick brown fox' + +``` + +```py +def flip_random_character(s): + """Returns s with a random bit flipped in a random position""" + if s == "": + return s + + pos = random.randint(0, len(s) - 1) + c = s[pos] + bit = 1 << random.randint(0, 6) + new_c = chr(ord(c) ^ bit) + # print("Flipping", bit, "in", repr(c) + ", giving", repr(new_c)) + return s[:pos] + new_c + s[pos + 1:] + +``` + +```py +for i in range(10): + print(repr(flip_random_character(seed_input))) + +``` + +```py +'A quick bRown fox' +'A quici brown fox' +'A"quick brown fox' +'A quick brown$fox' +'A quick bpown fox' +'A quick brown!fox' +'A 1uick brown fox' +'@ quick brown fox' +'A quic+ brown fox' +'A quick bsown fox' + +``` + +现在让我们创建一个随机变异器,它随机选择要应用的变异: + +```py +def mutate(s): + """Return s with a random mutation applied""" + mutators = [ + delete_random_character, + insert_random_character, + flip_random_character + ] + mutator = random.choice(mutators) + # print(mutator) + return mutator(s) + +``` + +```py +for i in range(10): + print(repr(mutate("A quick brown fox"))) + +``` + +```py +'A qzuick brown fox' +' quick brown fox' +'A quick Brown fox' +'A qMuick brown fox' +'A qu_ick brown fox' +'A quick bXrown fox' +'A quick brown fx' +'A quick!brown fox' +'A! quick brown fox' +'A quick brownfox' + +``` + +现在的想法是*如果*我们有一些有效的输入作为开始,那么我们可以通过应用上述突变之一来创建更多输入候选。 要了解其工作原理,让我们回到URL。 + +## 突变网址 + +现在让我们回到我们的URL解析问题。 让我们创建一个函数`is_valid_url()`,该函数检查`http_program()`是否接受输入。 + +```py +def is_valid_url(url): + try: + result = http_program(url) + return True + except ValueError: + return False + +``` + +```py +assert is_valid_url("http://www.google.com/search?q=fuzzing") +assert not is_valid_url("xyzzy") + +``` + +现在让我们在给定的URL上应用`mutate()`函数,并查看我们获得了多少有效输入。 + +```py +seed_input = "http://www.google.com/search?q=fuzzing" +valid_inputs = set() +trials = 20 + +for i in range(trials): + inp = mutate(seed_input) + if is_valid_url(inp): + valid_inputs.add(inp) + +``` + +现在我们可以观察到,通过*突变*原始输入,我们得到了很大一部分有效输入: + +```py +len(valid_inputs) / trials + +``` + +```py +0.8 + +``` + +通过突变`http:`样本种子输入来产生`https:`前缀的几率是多少? 我们必须在正确的位置($ 1:l $)中插入($ 1:3 $)右字符`'s'`($ 1:96 $),其中$ l $是种子输入的长度。 这意味着平均而言,我们需要进行多次运行: + +```py +trials = 3 * 96 * len(seed_input) +trials + +``` + +```py +10944 + +``` + +我们实际上可以负担得起。 我们试试吧: + +```py +from [Timer](Timer.html) import Timer + +``` + +```py +trials = 0 +with Timer() as t: + while True: + trials += 1 + inp = mutate(seed_input) + if inp.startswith("https://"): + print( + "Success after", + trials, + "trials in", + t.elapsed_time(), + "seconds") + break + +``` + +```py +Success after 3656 trials in 0.010670263999600138 seconds + +``` + +当然,如果我们想获得一个`"ftp://"`前缀,我们将需要更多的突变和更多的运行–但是,最重要的是,我们需要应用*多个*突变。 + +## 多个突变 + +到目前为止,我们仅对示例字符串应用了一个突变。 但是,我们也可以应用*多个*突变,以进一步对其进行更改。 例如,如果我们对样本字符串应用20个突变,会发生什么情况? + +```py +seed_input = "http://www.google.com/search?q=fuzzing" +mutations = 50 + +``` + +```py +inp = seed_input +for i in range(mutations): + if i % 5 == 0: + print(i, "mutations:", repr(inp)) + inp = mutate(inp) + +``` + +```py +0 mutations: 'http://www.google.com/search?q=fuzzing' +5 mutations: 'http:/L/www.googlej.com/seaRchq=fuz:ing' +10 mutations: 'http:/L/www.ggoWglej.com/seaRchqfu:in' +15 mutations: 'http:/L/wwggoWglej.com/seaR3hqf,u:in' +20 mutations: 'htt://wwggoVgle"j.som/seaR3hqf,u:in' +25 mutations: 'htt://fwggoVgle"j.som/eaRd3hqf,u^:in' +30 mutations: 'htv://>fwggoVgle"j.qom/ea0Rd3hqf,u^:i' +35 mutations: 'htv://>fwggozVle"Bj.qom/eapRd[3hqf,u^:i' +40 mutations: 'htv://>fwgeo6zTle"Bj.\'qom/eapRd[3hqf,tu^:i' +45 mutations: 'htv://>fwgeo]6zTle"BjM.\'qom/eaR[3hqf,tu^:i' + +``` + +如您所见,原始种子输入几乎无法识别。 通过一次又一次地改变输入,我们得到了更高的输入多样性。 + +为了在单个程序包中实现这样的多个突变,让我们介绍一个`MutationFuzzer`类。 它需要种子(字符串列表)以及最小和最大数量的突变。 + +```py +from [Fuzzer](Fuzzer.html) import Fuzzer + +``` + +```py +class MutationFuzzer(Fuzzer): + def __init__(self, seed, min_mutations=2, max_mutations=10): + self.seed = seed + self.min_mutations = min_mutations + self.max_mutations = max_mutations + self.reset() + + def reset(self): + self.population = self.seed + self.seed_index = 0 + +``` + +接下来,让我们通过添加更多方法来进一步开发`MutationFuzzer`。 Python语言要求我们使用所有方法将整个方法定义为单个连续单元; 但是,我们想介绍一种方法。 为了避免这个问题,我们使用了一种特殊的技巧:每当我们想向某个类`C`引入新方法时,我们都会使用 + +```py +class C(C): + def new_method(self, args): + pass + +``` + +这似乎将`C`定义为其自身的子类,这没有任何意义-但实际上,它引入了一个新的`C`类作为*旧* `C`类的子类,然后进行了阴影处理 旧的`C`定义。 这使我们得到的是`C`类,并以`new_method()`作为方法,这正是我们想要的。 (不过,较早定义的`C`对象将保留较早的`C`定义,因此必须重新构建。) + +使用此技巧,我们现在可以添加一个`mutate()`方法,该方法实际调用上述`mutate()`函数。 当我们以后要扩展`MutationFuzzer`时,将`mutate()`作为方法很有用。 + +```py +class MutationFuzzer(MutationFuzzer): + def mutate(self, inp): + return mutate(inp) + +``` + +让我们回到我们的策略,在我们的人群中最大化覆盖率。 首先,让我们创建一个方法`create_candidate()`,该方法从当前种群(`self.population`)中随机选择一些输入,然后在`min_mutations`和`max_mutations`突变步骤之间应用,返回最终结果: + +```py +class MutationFuzzer(MutationFuzzer): + def create_candidate(self): + candidate = random.choice(self.population) + trials = random.randint(self.min_mutations, self.max_mutations) + for i in range(trials): + candidate = self.mutate(candidate) + return candidate + +``` + +`fuzz()`方法设置为首先采摘种子; 当这些消失后,我们进行变异: + +```py +class MutationFuzzer(MutationFuzzer): + def fuzz(self): + if self.seed_index < len(self.seed): + # Still seeding + self.inp = self.seed[self.seed_index] + self.seed_index += 1 + else: + # Mutating + self.inp = self.create_candidate() + return self.inp + +``` + +```py +seed_input = "http://www.google.com/search?q=fuzzing" +mutation_fuzzer = MutationFuzzer(seed=[seed_input]) +mutation_fuzzer.fuzz() + +``` + +```py +'http://www.google.com/search?q=fuzzing' + +``` + +```py +mutation_fuzzer.fuzz() + +``` + +```py +'http://www.gogl9ecom/earch?qfuzzing' + +``` + +```py +mutation_fuzzer.fuzz() + +``` + +```py +'htotq:/www.googleom/yseach?q=fzzijg' + +``` + +每次`fuzz()`的新调用,我们都会得到另一个应用了多个突变的变体。 但是,输入的多样性较高,会增加输入无效的风险。 成功的关键在于*指导*这些突变的想法,也就是说*保留那些特别有价值的突变。* + +## 覆盖率指导 + +为了涵盖尽可能多的功能,可以依赖*指定的*或*实现的*功能,如[“覆盖”](Coverage.html) 一章中所述。 现在,我们不会假设程序行为是规范的(尽管*肯定是*会很好!)。 但是,我们*将假定*存在,并且我们可以利用其结构来指导测试的产生。 + +由于测试总是执行手头的程序,因此人们总是可以收集有关其执行的信息-最少是决定测试是否通过所需的信息。 由于也经常测量覆盖率以确定测试质量,因此我们还假设我们可以检索测试运行的覆盖率。 问题是:*我们如何利用覆盖率来指导测试的产生?* + +一种特别成功的想法是在名为 [American Fuzzy lop](http://lcamtuf.coredump.cx/afl/) 或简称为 *AFL* 的流行模糊器中实现的。 就像上面的示例一样,AFL会开发成功的测试用例-但是对于AFL,``成功''表示*通过程序执行*找到了新的路径。 这样,AFL可以继续变异到目前为止已经找到新路径的输入。 如果输入找到另一条路径,则也会保留该路径。 + +让我们制定这样的策略。 我们首先介绍一个`Runner`类,该类捕获给定功能的覆盖范围。 首先,一个`FunctionRunner`类: + +```py +from [Fuzzer](Fuzzer.html) import Runner + +``` + +```py +class FunctionRunner(Runner): + def __init__(self, function): + """Initialize. `function` is a function to be executed""" + self.function = function + + def run_function(self, inp): + return self.function(inp) + + def run(self, inp): + try: + result = self.run_function(inp) + outcome = self.PASS + except Exception: + result = None + outcome = self.FAIL + + return result, outcome + +``` + +```py +http_runner = FunctionRunner(http_program) +http_runner.run("https://foo.bar/") + +``` + +```py +(True, 'PASS') + +``` + +现在,我们可以扩展`FunctionRunner`类,以便它也可以测量覆盖范围。 调用`run()`之后,`coverage()`方法返回上次运行时获得的覆盖率。 + +```py +from [Coverage](Coverage.html) import Coverage, population_coverage + +``` + +```py +class FunctionCoverageRunner(FunctionRunner): + def run_function(self, inp): + with Coverage() as cov: + try: + result = super().run_function(inp) + except Exception as exc: + self._coverage = cov.coverage() + raise exc + + self._coverage = cov.coverage() + return result + + def coverage(self): + return self._coverage + +``` + +```py +http_runner = FunctionCoverageRunner(http_program) +http_runner.run("https://foo.bar/") + +``` + +```py +(True, 'PASS') + +``` + +以下是前五个位置: + +```py +print(list(http_runner.coverage())[:5]) + +``` + +```py +[('urlparse', 375), ('__exit__', 25), ('_coerce_args', 115), ('http_program', 10), ('http_program', 3)] + +``` + +现在是主要班级。 我们维持人口和已经实现的一系列覆盖率(`coverages_seen`)。 `fuzz()`辅助函数接受输入并在其上运行给定的`function()`。 如果其覆盖范围是新的(即`coverages_seen`中没有),则将输入添加到`population`并将覆盖范围添加到`coverages_seen`。 + +```py +class MutationCoverageFuzzer(MutationFuzzer): + def reset(self): + super().reset() + self.coverages_seen = set() + # Now empty; we fill this with seed in the first fuzz runs + self.population = [] + + def run(self, runner): + """Run function(inp) while tracking coverage. + If we reach new coverage, + add inp to population and its coverage to population_coverage + """ + result, outcome = super().run(runner) + new_coverage = frozenset(runner.coverage()) + if outcome == Runner.PASS and new_coverage not in self.coverages_seen: + # We have new coverage + self.population.append(self.inp) + self.coverages_seen.add(new_coverage) + + return result + +``` + +现在让我们使用它: + +```py +seed_input = "http://www.google.com/search?q=fuzzing" +mutation_fuzzer = MutationCoverageFuzzer(seed=[seed_input]) +mutation_fuzzer.runs(http_runner, trials=10000) +mutation_fuzzer.population + +``` + +```py +['http://www.google.com/search?q=fuzzing', + 'http://www.goog.com/search;q=fuzzilng', + 'http://ww.6goog\x0eoomosearch;/q=f}zzilng', + 'http://uv.Lboo.comoseakrch;q=fuzilng', + 'http://ww.6goog\x0eo/mosarch;/q=f}z{il~g', + 'Http://www.g/ogle.com/earchq=fuzzing', + 'http://www.goog.com/lsearkh;q=fuzzilng', + 'http://www.Ifnole.com/searchq=fzzing', + 'Http://ww.g/ogle.com/earchq=furzing', + 'Http://wwQw.g/oGle.ug/m/ear#hq=uzzGing', + 'Http://ww.g/ogle.cnom?earchq=fZrzing', + 'http://www.goog.co#m/lsearkh;q=fuzilng', + 'Http://wwQw.g/oGle.ug/m/ear#hqg=uzzGvi~g', + 'http://RuV.Lboo.comose`krch;q=ftzil~g', + "http://www.googco#_mx/lsa'rkhq=fuzilng", + 'htTp://w.6goog\x0eo/mosarch;/q=f}z{il~g', + 'http://www.google.com/sea[arch?q=fuzzGing', + 'Http://wwQ?w.g/oGle6.ug/m/ekar#hq=uzzGing', + 'httP://uv.Lboo.comoseakrch;q=fzilng', + 'http://ww.6goog\x0eo/mosarch;/?q=fz{il~g', + 'htTp://w.6eoog\x0eo/mosarch;?p=f}z{il~w', + 'http://www.goog\x0eom/sea7rch;#q=fuezzi-mog', + 'httP://uv.L"Noo.omosekrch;q=fziln', + 'htTp://w.6go7opg\x0eo/mosayrch;/ #q=b}z{il~g', + 'Http://wwQ?w.g/%oGle6.ug//ekar!hq=uzzGinc', + 'htTp://wS.6eoog\x0e/msarcah;?p=f}z{i~7,', + 'http://www.goog\x0eo}/qa5ch;Y#q=fuezzi-mog', + 'http://ww.W=6goxog\x0eo/mosarXch;+?q=fz{il~g', + 'htTp://w.6Foo\x0en/mosarch;q=fK}z{il~g', + 'htTp://7.6Gogo\x0e/iowarcj;q=fK}z{Il~gX', + 'http://ww.62gogo/m%/saRch;/q=fl}ziil~g', + 'http://www.go?og\x0eo}/qac`P;Y#eq=fuezzik-mog', + 'http://www.go?g\x0ek}/qa`P;Y#q=fuezzik-moga', + 'htTp://Hw.6g7`g\x0eo/mosayrc)h;/K #q=j}zyil~g', + 'htTp://Hw.6g`g\x0eo/moseyrc)h;OK(#q=j}zyil~g', + 'http://*ww.W=goxog\x0e/2RmosarXch;+?Cq=f{i2l~g', + 'htTp://.6,gokg\x0eo~/mosrch;/?f\\}z{il~g', + 'htTp://Hw.6g`g\x0eo/}oseyrc)h;OK(#p=j}zyil~g', + 'htTp://w.A6go7evopg\nFo/mosayvch;?R#q=b}z{il~g', + 'htTp://w.Ago7e%vopgV\nzFo/oayv=ch;?R6#q=b}z{il~g', + 'Http://wwQ?w.g/oGle6.ug/m/ka2#hq9=uzzGing', + 'http://wHw.67`g\x0eo/mosaygrc)h;/K #q=j}zyil~g', + 'htTp://w.g&o\x0eo/mocarh;/q=b}Mx{iBl~g', + 'http://w.Ago7e%vopoV\nzIFo/oayv=ch;?R6#q=b}z{il~+g=', + 'htTp://.6O,gokg\x0eo~/mTmsrc;h;/?f\\}Ez{il~g', + 'http://ww%.6goog\x0eo/mosach;/?q=fz{il~g', + 'http://wHw.67`g\x0eo/mosaygc)h;/K #q#`=j}zyilg'] + +``` + +成功! 在我们的总体中,*的每个输入*现在都是有效的,并且覆盖范围不同,来自方案,路径,查询和片段的各种组合。 + +```py +all_coverage, cumulative_coverage = population_coverage( + mutation_fuzzer.population, http_program) + +``` + +```py +import [matplotlib.pyplot](https://docs.python.org/3/library/matplotlib.pyplot.html) as [plt](https://docs.python.org/3/library/plt.html) + +``` + +```py +plt.plot(cumulative_coverage) +plt.title('Coverage of urlparse() with random inputs') +plt.xlabel('# of inputs') +plt.ylabel('lines covered'); + +``` + +![]( +) + +这种策略的好处是,应用于较大的程序时,它将很乐于探索另一条路径–涵盖功能与功能之间的关系。 所需要的只是捕获覆盖范围的一种方法。 + +## 经验教训 + +* 随机生成的输入通常是无效的-因此主要行使输入处理功能。 +* 来自现有有效输入的变异具有较高的有效机会,因此可以行使输入处理以外的功能。 + +## 后续步骤 + +在有关[灰箱模糊](GreyboxFuzzer.html)的下一章中,我们进一步扩展了基于突变的测试的概念,其中包含*功率调度表*,可以为执行“不太可能”路径和种子运行的种子提供更多能量 与目标位置“更近”。 + +## 练习 + +### 练习1:对带有突变的CGI解码进行模糊处理 + +将上述*指导的基于*突变的模糊技术应用于[“封面”](Coverage.html) 一章的`cgi_decode()`。 在涵盖`+`,`%`(有效和无效)和常规字符的所有变体之前,您需要进行几次试验? + +```py +from [Coverage](Coverage.html) import cgi_decode + +``` + +```py +seed = ["Hello World"] +cgi_runner = FunctionCoverageRunner(cgi_decode) +m = MutationCoverageFuzzer(seed) +results = m.runs(cgi_runner, 10000) + +``` + +```py +m.population + +``` + +```py +['Hello World', 'he_<+llo(or libmath.h +/Applications/Xcode.app/Contents/Developer/usr/bin/make global.o +gcc -DHAVE_CONFIG_H -I. -I.. -I. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT global.o -MD -MP -MF .deps/global.Tpo -c -o global.o global.c +mv -f .deps/global.Tpo .deps/global.Po +gcc -g -O2 -Wall -funsigned-char --coverage -o libmath.h -o fbc main.o bc.o scan.o execute.o load.o storage.o util.o warranty.o global.o ../lib/libbc.a -ll +./fbc -c ./libmath.b libmath.h +./fix-libmath_h +2655 +2793 +rm -f ./fbc ./global.o +gcc -DHAVE_CONFIG_H -I. -I.. -I. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT global.o -MD -MP -MF .deps/global.Tpo -c -o global.o global.c +mv -f .deps/global.Tpo .deps/global.Po +gcc -g -O2 -Wall -funsigned-char --coverage -o bc main.o bc.o scan.o execute.o load.o storage.o util.o global.o warranty.o ../lib/libbc.a -ll +Making all in dc +gcc -DHAVE_CONFIG_H -I. -I.. -I./.. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT dc.o -MD -MP -MF .deps/dc.Tpo -c -o dc.o dc.c +mv -f .deps/dc.Tpo .deps/dc.Po +gcc -DHAVE_CONFIG_H -I. -I.. -I./.. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT misc.o -MD -MP -MF .deps/misc.Tpo -c -o misc.o misc.c +mv -f .deps/misc.Tpo .deps/misc.Po +gcc -DHAVE_CONFIG_H -I. -I.. -I./.. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT eval.o -MD -MP -MF .deps/eval.Tpo -c -o eval.o eval.c +mv -f .deps/eval.Tpo .deps/eval.Po +gcc -DHAVE_CONFIG_H -I. -I.. -I./.. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT stack.o -MD -MP -MF .deps/stack.Tpo -c -o stack.o stack.c +mv -f .deps/stack.Tpo .deps/stack.Po +gcc -DHAVE_CONFIG_H -I. -I.. -I./.. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT array.o -MD -MP -MF .deps/array.Tpo -c -o array.o array.c +mv -f .deps/array.Tpo .deps/array.Po +gcc -DHAVE_CONFIG_H -I. -I.. -I./.. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT numeric.o -MD -MP -MF .deps/numeric.Tpo -c -o numeric.o numeric.c +mv -f .deps/numeric.Tpo .deps/numeric.Po +gcc -DHAVE_CONFIG_H -I. -I.. -I./.. -I./../h -g -O2 -Wall -funsigned-char --coverage -MT string.o -MD -MP -MF .deps/string.Tpo -c -o string.o string.c +mv -f .deps/string.Tpo .deps/string.Po +gcc -g -O2 -Wall -funsigned-char --coverage -o dc dc.o misc.o eval.o stack.o array.o numeric.o string.o ../lib/libbc.a +Making all in doc +restore=: && backupdir=".am$$" && \ + am__cwd=`pwd` && CDPATH="${ZSH_VERSION+.}:" && cd . && \ + rm -rf $backupdir && mkdir $backupdir && \ + if (makeinfo --no-split --version) >/dev/null 2>&1; then \ + for f in bc.info bc.info-[0-9] bc.info-[0-9][0-9] bc.i[0-9] bc.i[0-9][0-9]; do \ + if test -f $f; then mv $f $backupdir; restore=mv; else :; fi; \ + done; \ + else :; fi && \ + cd "$am__cwd"; \ + if makeinfo --no-split -I . \ + -o bc.info bc.texi; \ + then \ + rc=0; \ + CDPATH="${ZSH_VERSION+.}:" && cd .; \ + else \ + rc=$?; \ + CDPATH="${ZSH_VERSION+.}:" && cd . && \ + $restore $backupdir/* `echo "./bc.info" | sed 's|[^/]*$||'`; \ + fi; \ + rm -rf $backupdir; exit $rc +restore=: && backupdir=".am$$" && \ + am__cwd=`pwd` && CDPATH="${ZSH_VERSION+.}:" && cd . && \ + rm -rf $backupdir && mkdir $backupdir && \ + if (makeinfo --no-split --version) >/dev/null 2>&1; then \ + for f in dc.info dc.info-[0-9] dc.info-[0-9][0-9] dc.i[0-9] dc.i[0-9][0-9]; do \ + if test -f $f; then mv $f $backupdir; restore=mv; else :; fi; \ + done; \ + else :; fi && \ + cd "$am__cwd"; \ + if makeinfo --no-split -I . \ + -o dc.info dc.texi; \ + then \ + rc=0; \ + CDPATH="${ZSH_VERSION+.}:" && cd .; \ + else \ + rc=$?; \ + CDPATH="${ZSH_VERSION+.}:" && cd . && \ + $restore $backupdir/* `echo "./dc.info" | sed 's|[^/]*$||'`; \ + fi; \ + rm -rf $backupdir; exit $rc +make[4]: Nothing to be done for `all-am'. + +``` + +文件`bc/bc`现在应该是可执行的... + +```py +!cd bc-1.07.1/bc; echo 2 + 2 | ./bc + +``` + +```py +4 + +``` + +...并且您应该能够运行`gcov`程序来检索覆盖率信息。 + +```py +!cd bc-1.07.1/bc; gcov main.c + +``` + +```py +File 'main.c' +Lines executed:51.69% of 118 +main.c:creating 'main.c.gcov' + +``` + +如[“覆盖率”一章](Coverage.html)中所述,文件 [bc-1.07.1 / bc / main.c.gcov](bc-1.07.1/bc/main.c.gcov) 现在保存`bc.c`的覆盖范围信息。 每行都以执行次数为前缀。 `#####`表示零倍; `-`表示不可执行的行。 + +像`FunctionCoverageRunner`一样,为`bc`解析GCOV文件并创建`coverage`集。 将其设置为`ProgramCoverageRunner`类,将使用一系列源文件(`bc.c`,`main.c`和`load.c`)构建该类以运行`gcov`。 + +完成后,请不要忘记清理: + +```py +!rm -fr bc-1.07.1 bc-1.07.1.tar.gz + +``` + +### 练习3 + +在[博客文章](https://lcamtuf.blogspot.com/2014/08/binary-fuzzing-strategies-what-works.html)中, *American Fuzzy Lop* (AFL)的作者,一个非常流行的基于变异的模糊器,讨论了各种变异算子的效率。 如上例所示,实施其中四个并评估其效率。 + +### 练习4 + +将新元素添加到候选列表时,AFL实际上并不比较*覆盖率*,但如果它行使新的*分支*则添加元素。 使用[“覆盖率”](Coverage.html) 一章的练习中的分支覆盖率,实施此“分支”策略,并将其与上述“覆盖率”策略进行比较。 + +### 练习5 + +设计并实现一个系统,该系统将从Web收集大量URL。 您可以使用这些样本获得更高的覆盖率吗? 如果将它们用作进一步突变的初始种群怎么办? \ No newline at end of file diff --git a/new/fuzzing-book-zh/11.md b/new/fuzzing-book-zh/11.md new file mode 100644 index 0000000000000000000000000000000000000000..342f5e53d59ba9501e4614a254549b83ca9dc756 --- /dev/null +++ b/new/fuzzing-book-zh/11.md @@ -0,0 +1,1340 @@ +# Greybox模糊测试 + +> 原文: [https://www.fuzzingbook.org/html/GreyboxFuzzer.html](https://www.fuzzingbook.org/html/GreyboxFuzzer.html) + +在[的前一章](MutationFuzzer.html)中,我们介绍了*基于突变的模糊化*,该技术通过将小的突变应用于给定输入来生成模糊输入。 在本章中,我们将说明*如何将*这些突变导向特定目标,例如覆盖范围。 本书中的算法源于流行的 [American Fuzzy Lop](http://lcamtuf.coredump.cx/afl/) (AFL)模糊测试器,尤其是其 [AFLFast](https://github.com/mboehme/aflfast) 和 [AFLGo](https://github.com/aflgo/aflgo) 口味。 我们将探索AFL背后的灰箱模糊测试算法,以及如何利用它来解决各种漏洞自动检测功能。 + +**前提条件** + +* 建议阅读有关基于[突变的模糊测试](MutationFuzzer.html)的介绍。 + +```py +import [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) + +``` + +## Greybox模糊测试的成分 + +我们首先讨论突变测试和目标指导所需的最重要部分。 + +### 背景 + +AFL是基于*突变的模糊器*。 意思是,AFL通过稍微修改种子输入(即,突变)或通过将一个输入的前半部分与另一个输入的后半部分(即拼接)相结合来生成新的输入。 + +AFL还是*灰盒模糊器*(不是黑盒或白盒)。 意思是,AFL利用覆盖率反馈来学习如何更深入地了解该计划。 这并非完全是黑盒,因为AFL至少利用了*和某些*程序分析功能。 这也不是完全白盒,因为AFL并非建立在重量级程序分析或约束解决上。 取而代之的是,AFL使用轻量级程序工具收集有关生成的输入的(分支)覆盖率的一些信息。 如果生成的输入增加覆盖范围,则将其添加到种子语料库以进一步进行模糊测试。 + +为了检测程序,AFL在每条条件跳转指令之后立即插入一段代码。 当执行时,此所谓的蹦床会为锻炼的分支分配唯一的标识符,并递增与此分支关联的计数器。 为了提高效率,仅保留粗略的分支命中计数。 换句话说,对于每个输入,模糊器都知道哪个分支以及大概多久执行一次。 通常在编译时即在程序源代码被编译为可执行二进制文件时进行检测。 但是,可以使用诸如虚拟机(例如 [QEMU](https://github.com/mirrorer/afl/blob/master/qemu_mode) )或动态检测工具(例如 [Intel PinTool](https://github.com/vanhauser-thc/afl-pin) )之类的工具在非仪表二进制文件上运行AFL。 对于Python程序,我们无需任何检测即可收集覆盖率信息(请参阅[收集覆盖率](Coverage.html#Coverage-of-Basic-Fuzzing)的章节)。 + +### 突变体和种子 + +我们介绍了用于使种子变异的特定类。 + +```py +import [random](https://docs.python.org/3/library/random.html) +from [Coverage](Coverage.html) import Coverage, population_coverage + +``` + +首先,我们将介绍`Mutator`类。 给定种子输入`inp`,mutator返回`inp`的略微修改版本。 在灰盒子语法模糊的[一章中,我们扩展了此类,以考虑智能灰盒子模糊检测的输入语法。](GreyboxGrammarFuzzer.html) + +```py +class Mutator(object): + def __init__(self): + self.mutators = [ + self.delete_random_character, + self.insert_random_character, + self.flip_random_character + ] + +``` + +对于插入,我们在随机位置添加一个随机字符。 + +```py +class Mutator(Mutator): + def insert_random_character(self,s): + """Returns s with a random character inserted""" + pos = random.randint(0, len(s)) + random_character = chr(random.randrange(32, 127)) + return s[:pos] + random_character + s[pos:] + +``` + +对于删除,如果字符串非空,请选择一个随机位置并删除字符。 否则,请使用插入操作。 + +```py +class Mutator(Mutator): + def delete_random_character(self,s): + """Returns s with a random character deleted""" + if s == "": + return self.insert_random_character(s) + + pos = random.randint(0, len(s) - 1) + return s[:pos] + s[pos + 1:] + +``` + +对于替换,如果字符串非空,则选择一个随机位置并翻转字符中的随机位。 否则,请使用插入操作。 + +```py +class Mutator(Mutator): + def flip_random_character(self,s): + """Returns s with a random bit flipped in a random position""" + if s == "": + return self.insert_random_character(s) + + pos = random.randint(0, len(s) - 1) + c = s[pos] + bit = 1 << random.randint(0, 6) + new_c = chr(ord(c) ^ bit) + return s[:pos] + new_c + s[pos + 1:] + +``` + +主要方法是`mutate`,它从运算符列表中选择一个随机突变运算符。 + +```py +class Mutator(Mutator): + def mutate(self, inp): + """Return s with a random mutation applied""" + mutator = random.choice(self.mutators) + return mutator(inp) + +``` + +让我们尝试增变器。 您实际上可以与此类“单元”进行交互,并通过将本章加载为Jupyter笔记本来尝试其他输入。 打开后,使用“内核->重新启动&全部运行”来运行笔记本中的所有单元。 + +```py +Mutator().mutate("good") + +``` + +```py +'cood' + +``` + +### 电源表 + +现在我们介绍一个新概念; *功率表*。 功率计划表将宝贵的模糊时间分配到种群中的各个种子之间。 我们的目标是最大程度地花时间模糊那些(最进步的)种子,从而在更短的时间内提高覆盖率。 + +我们将从种群中选择种子的可能性称为种子的*能量*。 在整个测试过程中,我们希望优先考虑更有前途的种子。 简而言之,我们不想浪费能源消耗非渐进种子。 我们将确定种子能量的程序称为模糊器的*功率计划*。 例如,AFL的日程安排将更多的能量分配给较短的种子,执行速度更快的种子,并且产量覆盖率增加的频率更高。 + +首先,除了种子数据外,我们还需要附加一些信息到每个种子。 因此,我们定义以下`Seed`类。 + +```py +class Seed(object): + def __init__(self, data): + """Set seed data""" + self.data = data + + def __str__(self): + """Returns data as string representation of the seed""" + return self.data + __repr__ = __str__ + +``` + +以下实施的功率计划为每个种子分配相同的能量。 一旦种子进入种群,它就会像种群中的任何其他种子一样被频繁地起毛。 + +在Python中,我们可以将长的for循环压缩为更小的语句。 + +* `lambda x: ...`返回以`x`作为输入的函数。 Lambda允许快速定义未命名的函数。 +* `map(f, l)`返回一个列表,其中功能`f`应用于列表`l`中的每个元素。 +* `np.random.choice(l,p)`以`p[i]`中的概率返回元素`l[i]`。 + +```py +import [numpy](https://docs.python.org/3/library/numpy.html) as [np](https://docs.python.org/3/library/np.html) + +``` + +```py +class PowerSchedule(object): + def assignEnergy(self, population): + """Assigns each seed the same energy""" + for seed in population: + seed.energy = 1 + + def normalizedEnergy(self, population): + """Normalize energy""" + energy = list(map(lambda seed: seed.energy, population)) + sum_energy = sum(energy) # Add up all values in energy + norm_energy = list(map(lambda nrg: nrg/sum_energy, energy)) + return norm_energy + + def choose(self, population): + """Choose weighted by normalized energy.""" + import [numpy](https://docs.python.org/3/library/numpy.html) as [np](https://docs.python.org/3/library/np.html) + + self.assignEnergy(population) + norm_energy = self.normalizedEnergy(population) + seed = np.random.choice(population, p=norm_energy) + return seed + +``` + +让我们看看此功率调度是否随机地均匀选择种子。 我们要求时间表10k次从三颗种子(A,B,C)的种群中选择一颗种子,并跟踪我们看到每颗种子的次数。 我们应该看到每个种子大约3.3k次。 + +```py +population = [Seed("A"), Seed("B"), Seed("C")] +schedule = PowerSchedule() +hits = { + "A" : 0, + "B" : 0, + "C" : 0 +} + +for i in range(10000): + seed = schedule.choose(population) + hits[seed.data] += 1 + +hits + +``` + +```py +{'A': 3372, 'B': 3319, 'C': 3309} + +``` + +看起来不错。 每粒种子的选择率约为三分之一。 + +### 流道和示例程序 + +我们将从一个六行的小示例程序开始。 为了在执行期间收集覆盖率信息,我们从基于基于突变的[的模糊](MutationFuzzer.html#Guiding-by-Coverage)一章中导入了`FunctionCoverageRunner`类。 + +`FunctionCoverageRunner`构造函数使用Python `function`执行。 函数`run`接受输入,将其传递给Python `function`,并收集此执行的覆盖率信息。 函数`coverage()`为Python `function`中涵盖的每个语句返回元组`(function name, line number)`的列表。 + +```py +from [MutationFuzzer](MutationFuzzer.html) import FunctionCoverageRunner + +``` + +`crashme()`函数引发输入“ bad!”的异常。 让我们看看输入“ good”涵盖了哪些语句。 + +```py +def crashme (s): + if len(s) > 0 and s[0] == 'b': + if len(s) > 1 and s[1] == 'a': + if len(s) > 2 and s[2] == 'd': + if len(s) > 3 and s[3] == '!': + raise Exception() + +crashme_runner = FunctionCoverageRunner(crashme) +crashme_runner.run("good") +list(crashme_runner.coverage()) + +``` + +```py +[('__exit__', 25), ('crashme', 2), ('run_function', 7)] + +``` + +在`crashme`中,输入“ good”仅覆盖第2行中的if语句。分支条件`len(s) > 0 and s[0] == 'b'`的计算结果为False。 + +## 黑盒,灰盒和增强型灰盒模糊化 + +### 基于黑盒变异的模糊器 + +让我们将增幅器和功率计划集成到模糊器中。 我们将从黑匣子模糊器开始-它不会*而不是*利用任何覆盖率信息。 + +我们的`MutationFuzzer`类继承自 [Fuzzer](Fuzzer.html#Fuzzer-Classes) 类。 现在,我们只需要知道函数`fuzz`返回生成的输入,以及函数`runs`执行指定次数的`fuzz`。 对于我们的`MutationFuzzer`类,我们覆盖了`fuzz`函数。 + +```py +from [Fuzzer](Fuzzer.html) import Fuzzer + +``` + +`MutationFuzzer`由一组初始种子,一个变量和一个功率计划构成。 在整个模糊测试过程中,它维护着一个称为`population`的种子主体。 函数`fuzz`从初始种子返回未模糊的种子,或者对总体中的种子进行模糊处理的结果。 函数`create_candidate`处理后者。 它从总体中随机选择一个输入,并应用许多突变。 + +```py +class MutationFuzzer(Fuzzer): + + def __init__(self, seeds, mutator, schedule): + self.seeds = seeds + self.mutator = mutator + self.schedule = schedule + self.inputs = [] + self.reset() + + def reset(self): + """Reset the initial population and seed index""" + self.population = list(map(lambda x: Seed(x), self.seeds)) + self.seed_index = 0 + + def create_candidate(self): + """Returns an input generated by fuzzing a seed in the population""" + seed = self.schedule.choose(self.population) + + # Stacking: Apply multiple mutations to generate the candidate + candidate = seed.data + trials = min(len(candidate), 1 << random.randint(1,5)) + for i in range(trials): + candidate = self.mutator.mutate(candidate) + return candidate + + def fuzz(self): + """Returns first each seed once and then generates new inputs""" + if self.seed_index < len(self.seeds): + # Still seeding + self.inp = self.seeds[self.seed_index] + self.seed_index += 1 + else: + # Mutating + self.inp = self.create_candidate() + + self.inputs.append(self.inp) + return self.inp + +``` + +好吧,让我们旋转一下变异模糊器。 给定一个种子,我们要求它生成三个输入。 + +```py +seed_input = "good" +mutation_fuzzer = MutationFuzzer([seed_input], Mutator(), PowerSchedule()) +print(mutation_fuzzer.fuzz()) +print(mutation_fuzzer.fuzz()) +print(mutation_fuzzer.fuzz()) + +``` + +```py +good +ooD +cW(ond + +``` + +让我们看看在n = 30k输入的广告活动中,基于变异的黑盒模糊器包含多少条语句。 + +模糊器功能`runs(crashme_runner, trials=n)`生成`n`输入,并通过`crashme_runner`在`crashme`功能上执行它们。 如前所述,`crashme_runner`还收集覆盖信息。 + +```py +import [time](https://docs.python.org/3/library/time.html) +n = 30000 + +``` + +```py +blackbox_fuzzer = MutationFuzzer([seed_input], Mutator(), PowerSchedule()) + +start = time.time() +blackbox_fuzzer.runs(FunctionCoverageRunner(crashme), trials=n) +end = time.time() + +"It took the blackbox mutation-based fuzzer %0.2f seconds to generate and execute %d inputs." % (end - start, n) + +``` + +```py +'It took the blackbox mutation-based fuzzer 1.41 seconds to generate and execute 30000 inputs.' + +``` + +为了衡量覆盖率,我们导入了 [Population_coverage](Coverage.html#Coverage-of-Basic-Fuzzing) 函数。 它接受一组输入和一个Python函数,在该函数上执行输入并收集coverage信息。 具体来说,它返回一个元组`(all_coverage, cumulative_coverage)`,其中`all_coverage`是所有输入覆盖的语句集,`cumulative_coverage`是随着执行的输入数量增加而覆盖的语句数。 我们只是对后者感兴趣,以便随着时间的推移绘制覆盖范围。 + +```py +from [Coverage](Coverage.html) import population_coverage + +``` + +我们从黑匣子模糊器中提取生成的输入,并随着输入数量的增加来测量覆盖率。 + +```py +_, blackbox_coverage = population_coverage(blackbox_fuzzer.inputs, crashme) +bb_max_coverage = max(blackbox_coverage) + +"The blackbox mutation-based fuzzer achieved a maximum coverage of %d statements." % bb_max_coverage + +``` + +```py +'The blackbox mutation-based fuzzer achieved a maximum coverage of 3 statements.' + +``` + +以下生成的输入增加了`crashme` [示例](#Runner-and-Sample-Program)的覆盖范围。 + +```py +[seed_input] + \ +[blackbox_fuzzer.inputs[idx] for idx in range(len(blackbox_coverage)) + if blackbox_coverage[idx] > blackbox_coverage[idx - 1] +] + +``` + +```py +['good', 'bgod'] + +``` + +***摘要*** 。 这是基于黑盒突变的模糊器的工作方式。 我们集成了*变异子*,以通过模糊提供的一组初始种子和*功率调度*来决定下一步选择哪个种子来生成输入。 + +### 基于Greybox变异的Fuzzer + +与黑箱模糊器相比,像 [AFL](http://lcamtuf.coredump.cx/afl/) *这样的灰箱模糊器确实会*利用覆盖信息。 具体来说,灰盒模糊器会在种子种群中添加生成的输入,从而增加代码覆盖率。 + +方法`run()`继承自 [Fuzzer](Fuzzer.html#Fuzzer-Classes) 类。 调用它可以生成并执行一个输入。 我们重写此功能可向`population`添加输入以增加覆盖范围。 灰盒模糊器属性`coverages_seen`维护先前已涵盖的语句集。 + +```py +class GreyboxFuzzer(MutationFuzzer): + def reset(self): + """Reset the initial population, seed index, coverage information""" + super().reset() + self.coverages_seen = set() + self.population = [] # population is filled during greybox fuzzing + + def run(self, runner): + """Run function(inp) while tracking coverage. + If we reach new coverage, + add inp to population and its coverage to population_coverage + """ + result, outcome = super().run(runner) + new_coverage = frozenset(runner.coverage()) + if new_coverage not in self.coverages_seen: + # We have new coverage + seed = Seed(self.inp) + seed.coverage = runner.coverage() + self.coverages_seen.add(new_coverage) + self.population.append(seed) + + return (result, outcome) + +``` + +让我们将灰盒模糊器旋转一下。 + +```py +seed_input = "good" +greybox_fuzzer = GreyboxFuzzer([seed_input], Mutator(), PowerSchedule()) + +start = time.time() +greybox_fuzzer.runs(FunctionCoverageRunner(crashme), trials=n) +end = time.time() + +"It took the greybox mutation-based fuzzer %0.2f seconds to generate and execute %d inputs." % (end - start, n) + +``` + +```py +'It took the greybox mutation-based fuzzer 1.67 seconds to generate and execute 30000 inputs.' + +``` + +在生成相同数量的测试输入后,灰盒模糊器会覆盖更多语句吗? + +```py +_, greybox_coverage = population_coverage(greybox_fuzzer.inputs, crashme) +gb_max_coverage = max(greybox_coverage) + +"Our greybox mutation-based fuzzer covers %d more statements" % (gb_max_coverage - bb_max_coverage) + +``` + +```py +'Our greybox mutation-based fuzzer covers 2 more statements' + +``` + +[示例](#Runner-and-Sample-Program)的种子种群现在包含以下种子。 + +```py +greybox_fuzzer.population + +``` + +```py +[good, bood, ba,oo`, bad + oo1] + +``` + +覆盖反馈确实有帮助。 这些新种子就像面包屑或里程碑一样,它们指导模糊器更快地进入更深的代码区域。 以下是一个简单的图表,显示了在我们的简单[示例](#Runner-and-Sample-Program)上两个模糊器随时间推移所实现的覆盖范围。 + +```py +%matplotlib inline + +``` + +```py +import [matplotlib.pyplot](https://docs.python.org/3/library/matplotlib.pyplot.html) as [plt](https://docs.python.org/3/library/plt.html) + +``` + +```py +line_bb, = plt.plot(blackbox_coverage, label="Blackbox") +line_gb, = plt.plot(greybox_coverage, label="Greybox") +plt.legend(handles=[line_bb, line_gb]) +plt.title('Coverage over time') +plt.xlabel('# of inputs') +plt.ylabel('lines covered'); + +``` + +![]( +) + +***摘要*** 。 我们已经看到了灰匣子模糊器如何“发现”有趣的种子,这些种子可以带来更多的进步。 从输入`good`,我们的灰盒模糊器已经慢慢学习了如何生成输入`bad!`,该输入引发了异常。 现在,我们如何才能更快地做到这一点? + +***尝试*** 。 使用基于黑箱*的一代*模糊测试器,随着时间的推移将实现多少覆盖? 尝试绘制所有三个模糊器的覆盖范围。 您可以如下定义基于黑盒生成的模糊器。 + +```py +from [Fuzzer](Fuzzer.html) import RandomFuzzer +blackbox_gen_fuzzer = RandomFuzzer(min_length=4, max_length=4, char_start=32, char_range=96) + +``` + +您可以通过以Jupyter笔记本打开本章来执行自己的代码。 + +***读取*** 。 这是最成功的漏洞检测工具之一AFL的工作原理的高层视图。 如果您对技术细节感兴趣,请查看: [https://github.com/mirrorer/afl/blob/master/docs/technical_details.txt](https://github.com/mirrorer/afl/blob/master/docs/technical_details.txt) + +### 增强型Greybox Fuzzer + +我们增强的灰箱模糊器为有望实现更大覆盖率的种子分配了更多能量。 我们更改功率计划,使行使“非常规”路径的种子拥有更多能量。 对于*异常路径*,我们指的是生成的输入不经常使用的路径。 + +为了识别输入所执行的路径,我们利用了[迹线覆盖范围](WhenIsEnough.html#Trace-Coverage)中的功能`getPathID`。 + +```py +import [pickle](https://docs.python.org/3/library/pickle.html) # serializes an object by producing a byte array from all the information in the object +import [hashlib](https://docs.python.org/3/library/hashlib.html) # produces a 128-bit hash value from a byte array + +``` + +函数`getPathID`返回coverage集的唯一哈希。 + +```py +def getPathID(coverage): + """Returns a unique hash for the covered statements""" + pickled = pickle.dumps(coverage) + return hashlib.md5(pickled).hexdigest() + +``` + +有几种方法可以根据锻炼路径的异常程度分配能量。 在这种情况下,我们实现了指数功率调度,该算法计算种子$ s $的能量$ e(s)$,如下所示$$ e(s)= \ frac {1} {f(p(s))^ a } $$其中 + +* $ p(s)$返回$ s $行使的路径的ID, +* $ f(p)$返回生成的输入行使路径$ p $的次数,并且 +* $ a $是给定的指数。 + +```py +class AFLFastSchedule(PowerSchedule): + def __init__(self, exponent): + self.exponent = exponent + + def assignEnergy(self, population): + """Assign exponential energy inversely proportional to path frequency""" + for seed in population: + seed.energy = 1 / (self.path_frequency[getPathID(seed.coverage)] ** self.exponent) + +``` + +在灰箱模糊器中,跟踪每个路径$ p $行使$ f(p)$的次数,并更新电源计划。 + +```py +class CountingGreyboxFuzzer(GreyboxFuzzer): + def reset(self): + """Reset path frequency""" + super().reset() + self.schedule.path_frequency = {} + + def run(self, runner): + """Inform scheduler about path frequency""" + result, outcome = super().run(runner) + + path_id = getPathID(runner.coverage()) + if not path_id in self.schedule.path_frequency: + self.schedule.path_frequency[path_id] = 1 + else: + self.schedule.path_frequency[path_id] += 1 + + return(result, outcome) + +``` + +好的,让我们在简单的[示例](#Runner-and-Sample-Program)上运行增强型灰箱模糊器$ n = 10,000k次。 我们将指数功效表的指数设置为$ a = 5 $。 + +```py +n = 10000 +seed_input = "good" +fast_schedule = AFLFastSchedule(5) +fast_fuzzer = CountingGreyboxFuzzer([seed_input], Mutator(), fast_schedule) +start = time.time() +fast_fuzzer.runs(FunctionCoverageRunner(crashme), trials=n) +end = time.time() + +"It took the fuzzer w/ exponential schedule %0.2f seconds to generate and execute %d inputs." % (end - start, n) + +``` + +```py +'It took the fuzzer w/ exponential schedule 1.08 seconds to generate and execute 10000 inputs.' + +``` + +```py +x_axis = np.arange(len(fast_schedule.path_frequency)) +y_axis = list(fast_schedule.path_frequency.values()) + +plt.bar(x_axis, y_axis) +plt.xticks(x_axis) +plt.ylim(0, n) +#plt.yscale("log") +#plt.yticks([10,100,1000,10000]) +plt; + +``` + +![]( +) + +```py +print(" path id 'p' : path frequency 'f(p)'") +fast_schedule.path_frequency + +``` + +```py + path id 'p' : path frequency 'f(p)' + +``` + +```py +{'f2e66f5447cf94afc06f4aff3d7cf349': 5684, + '3e55dc120b76995e04fdeb76ef790af8': 2629, + 'e11bfcc84cfe5320d36a03abff4d8135': 1121, + 'ccab8793361783ff88e8cafc58ed178b': 442, + 'd5b7040bdd60ea92a98a0d715bdb7ced': 124} + +``` + +它与带有经典功率计划的灰盒模糊器相比如何? + +```py +seed_input = "good" +orig_schedule = PowerSchedule() +orig_fuzzer = CountingGreyboxFuzzer([seed_input], Mutator(), orig_schedule) +start = time.time() +orig_fuzzer.runs(FunctionCoverageRunner(crashme), trials=n) +end = time.time() + +"It took the fuzzer w/ original schedule %0.2f seconds to generate and execute %d inputs." % (end - start, n) + +``` + +```py +'It took the fuzzer w/ original schedule 0.76 seconds to generate and execute 10000 inputs.' + +``` + +```py +x_axis = np.arange(len(orig_schedule.path_frequency)) +y_axis = list(orig_schedule.path_frequency.values()) + +plt.bar(x_axis, y_axis) +plt.xticks(x_axis) +plt.ylim(0, n) +#plt.yscale("log") +#plt.yticks([10,100,1000,10000]) +plt; + +``` + +![]( +) + +```py +print(" path id 'p' : path frequency 'f(p)'") +orig_schedule.path_frequency + +``` + +```py + path id 'p' : path frequency 'f(p)' + +``` + +```py +{'f2e66f5447cf94afc06f4aff3d7cf349': 6799, + '3e55dc120b76995e04fdeb76ef790af8': 2164, + 'e11bfcc84cfe5320d36a03abff4d8135': 743, + 'ccab8793361783ff88e8cafc58ed178b': 294} + +``` + +指数功率调度可以消除“高频路径”的某些执行,并将它们添加到低频路径。 最不经常执行的路径要么根本不使用传统的功率计划表执行,要么不那么频繁地执行。 + +让我们看一下分配给发现的种子的能量。 + +```py +orig_energy = orig_schedule.normalizedEnergy(orig_fuzzer.population) + +for (seed, norm_energy) in zip(orig_fuzzer.population, orig_energy): + print("'%s', %0.5f, %s" % (getPathID(seed.coverage), norm_energy, repr(seed.data))) + +``` + +```py +'f2e66f5447cf94afc06f4aff3d7cf349', 0.25000, 'good' +'3e55dc120b76995e04fdeb76ef790af8', 0.25000, 'bgko?' +'e11bfcc84cfe5320d36a03abff4d8135', 0.25000, 'bao|oD?' +'ccab8793361783ff88e8cafc58ed178b', 0.25000, 'bado}oiD\x7f' + +``` + +```py +fast_energy = fast_schedule.normalizedEnergy(fast_fuzzer.population) + +for (seed, norm_energy) in zip(fast_fuzzer.population, fast_energy): + print("'%s', %0.5f, %s" % (getPathID(seed.coverage), norm_energy, repr(seed.data))) + +``` + +```py +'f2e66f5447cf94afc06f4aff3d7cf349', 0.00000, 'good' +'3e55dc120b76995e04fdeb76ef790af8', 0.00000, 'bood/' +'e11bfcc84cfe5320d36a03abff4d8135', 0.00002, 'ba^noD\x0f' +'ccab8793361783ff88e8cafc58ed178b', 0.00173, 'bad\x0f' +'d5b7040bdd60ea92a98a0d715bdb7ced', 0.99825, 'bad!\x0e' + +``` + +究竟。 我们新的指数式功率计划将最多能量分配给行使最低频率路径的种子。 + +让我们根据简单的[示例](#Runner-and-Sample-Program)随时间推移实现的覆盖率进行比较。 + +```py +_, orig_coverage = population_coverage(orig_fuzzer.inputs, crashme) +_, fast_coverage = population_coverage(fast_fuzzer.inputs, crashme) +line_orig, = plt.plot(orig_coverage, label="Original Greybox Fuzzer") +line_fast, = plt.plot(fast_coverage, label="Boosted Greybox Fuzzer") +plt.legend(handles=[line_orig, line_fast]) +plt.title('Coverage over time') +plt.xlabel('# of inputs') +plt.ylabel('lines covered'); + +``` + +![]( +) + +不出所料,增强型灰箱模糊器(具有指数功率表)可以更快地实现覆盖。 + +***摘要*** 。 通过更频繁地对行使低频路径的种子进行模糊处理,我们可以以更有效的方式探索程序路径。 + +***尝试*** 。 您可以尝试其他指数以实现快速用电计划,或者完全改变电源消耗。 请注意,较大的指数可能导致浮点运算中的溢出和不精确,从而产生意外结果。 您可以通过以Jupyter笔记本打开本章来执行自己的代码。 + +***读取*** 。 您可以在论文“ [基于覆盖的Greybox Fuzzing as Markov Chain](https://mboehme.github.io/paper/CCS16.pdf) ” [[Böhme*等人*,2018\.](https://mboehme.github.io/paper/CCS16.pdf) ]中找到有关模糊器增强的更多信息。 在[ [http://github.com/mboehme/aflfast](http://github.com/mboehme/aflfast) ]处将其实施到AFL中。 + +### 复杂示例:XMLParser + +让我们在一个更现实的示例(Python [HTML解析器](https://docs.python.org/3/library/html.parser.html))中比较这三个模糊器。 我们从“空”种子开始在HTMLParser上运行所有三个模糊器$ n = 5k $次。 + +```py +from [html.parser](https://docs.python.org/3/library/html.parser.html) import HTMLParser +import [traceback](https://docs.python.org/3/library/traceback.html) + +``` + +```py +# create wrapper function +def my_parser(inp): + parser = HTMLParser() # resets the HTMLParser object for every fuzz input + parser.feed(inp) + +n = 5000 +seed_input = " " # empty seed +blackbox_fuzzer = MutationFuzzer([seed_input], Mutator(), PowerSchedule()) +greybox_fuzzer = GreyboxFuzzer([seed_input], Mutator(), PowerSchedule()) +boosted_fuzzer = CountingGreyboxFuzzer([seed_input], Mutator(), AFLFastSchedule(5)) + +``` + +```py +start = time.time() +blackbox_fuzzer.runs(FunctionCoverageRunner(my_parser), trials=n) +greybox_fuzzer.runs(FunctionCoverageRunner(my_parser), trials=n) +boosted_fuzzer.runs(FunctionCoverageRunner(my_parser), trials=n) +end = time.time() + +"It took all three fuzzers %0.2f seconds to generate and execute %d inputs." % (end - start, n) + +``` + +```py +'It took all three fuzzers 15.90 seconds to generate and execute 5000 inputs.' + +``` + +覆盖范围随时间变化的模糊测试如何比较? + +```py +_, black_coverage = population_coverage(blackbox_fuzzer.inputs, my_parser) +_, grey_coverage = population_coverage(greybox_fuzzer.inputs, my_parser) +_, boost_coverage = population_coverage(boosted_fuzzer.inputs, my_parser) +line_black, = plt.plot(black_coverage, label="Blackbox Fuzzer") +line_grey, = plt.plot(grey_coverage, label="Greybox Fuzzer") +line_boost, = plt.plot(boost_coverage, label="Boosted Greybox Fuzzer") +plt.legend(handles=[line_boost, line_grey, line_black]) +plt.title('Coverage over time') +plt.xlabel('# of inputs') +plt.ylabel('lines covered'); + +``` + +![]( +) + +两个灰盒模糊器明显优于灰盒模糊器。 原因是灰盒模糊器在此过程中“发现”了有趣的输入。 让我们看一下灰盒子和黑盒子模糊器生成的最后10个输入。 + +```py +blackbox_fuzzer.inputs[-10:] + +``` + +```py +['0', '', '$', '0', ' u', ' |', ' L', '!', '', 'x '] + +``` + +```py +greybox_fuzzer.inputs[-10:] + +``` + +```py +['wq e#kHy|jgQob16{4R', + '<\n92h#Z?8- &<', + 'L?', + '8\x1380S&<', + '., [, ]`)。 但是,仍然缺少许多重要的关键字,例如``。 + +要向模糊测试者告知这些重要的关键字,我们需要[语法](Grammars.html); 在[智能灰盒模糊](LangFuzzer.html)的部分中,我们将它们与上述技术结合在一起。 + +***尝试*** 。 您可以重新运行这些实验以了解模糊实验的差异。 有时,我们声称是高级的模糊器似乎并不胜过劣质的模糊器。 为此,您只需要以Jupyter笔记本打开本章。 + +## 定向灰盒模糊检测 + +有时,您只希望模糊器到达源代码中的某个危险位置。 这可能是您期望缓冲区溢出的位置。 或者您想测试代码库中的最新更改。 我们如何将模糊器引向这些位置? + +在本章中,我们将有向灰箱模糊作为优化问题进行介绍。 + +### 解决迷宫 + +为了提供一个有意义的示例,您可以在其中轻松更改代码的复杂性和目标位置,我们从作为字符串提供的迷宫中生成了迷宫源代码。 本示例基于Felipe Andres Manzano的旧版[博客文章](https://feliam.wordpress.com/2010/10/07/the-symbolic-maze/)(快速大喊大叫!)。 + +您只需将迷宫指定​​为字符串即可。 像这样 + +```py +maze_string = """ ++-+-----+ +|X| | +| | --+ | +| | | | +| +-- | | +| |#| ++-----+-+ +""" + +``` + +使用功能`generate_maze_code`生成代码。 我们将隐藏实现,而是解释其作用。 如果您对编码感兴趣,请在处转到[。](ControlFlow.html#Example:-Maze) + +```py +from [ControlFlow](ControlFlow.html) import generate_maze_code + +``` + +```py +maze_code = generate_maze_code(maze_string) +exec(maze_code) + +``` + +目的是通过提供输入`D`表示向下,`U`表示向上,`L`表示左侧,`R`表示输入,将“ X”变为“#”。 + +```py +print(maze("DDDDRRRRUULLUURRRRDDDD")) # Appending one more 'D', you have reached the target. + +``` + +```py +SOLVED + ++-+-----+ +| | | +| | --+ | +| | | | +| +-- | | +| |X| ++-----+-+ + +``` + +`maze_string`中的每个字符代表一个图块。 对于每个图块,生成图块功能。 + +* 如果当前图块为“良性”(),则调用与下一个输入字符(D,U,L,R)相对应的图块功能。 意外的输入字符将被忽略。 如果没有剩余的输入字符,它将返回“ VALID”和当前的迷宫状态。 +* 如果当前图块是“陷阱”(`+`,`|`和`-`),则返回“ INVALID”和当前迷宫状态。 +* 如果当前图块是“目标”(`#`),则它返回“已解决”和当前迷宫状态。 + +***尝试*** 。 您可以测试其他输入字符序列,甚至完全改变迷宫。 为了执行自己的代码,您只需要以Jupyter笔记本的形式打开本章。 + +为了了解生成的代码,让我们看一下静态[调用图](https://en.wikipedia.org/wiki/Call_graph)。 调用图显示了可以执行功能的顺序。 + +```py +from [ControlFlow](ControlFlow.html) import callgraph + +``` + +```py +callgraph(maze_code) + +``` + +G cluster_G cluster_callgraphX callgraph callgraphX callgraph callgraphX__maze maze (callgraph.py:84) callgraphX->callgraphX__maze callgraphX__print_maze print_maze (callgraph.py:2) callgraphX->callgraphX__print_maze callgraphX__target_tile target_tile (callgraph.py:358) callgraphX->callgraphX__target_tile callgraphX__tile_1_0 tile_1_0 (callgraph.py:26) callgraphX->callgraphX__tile_1_0 callgraphX__tile_1_1 tile_1_1 (callgraph.py:31) callgraphX->callgraphX__tile_1_1 callgraphX__tile_1_2 tile_1_2 (callgraph.py:36) callgraphX->callgraphX__tile_1_2 callgraphX__tile_1_3 tile_1_3 (callgraph.py:41) callgraphX->callgraphX__tile_1_3 callgraphX__tile_1_4 tile_1_4 (callgraph.py:46) callgraphX->callgraphX__tile_1_4 callgraphX__tile_1_5 tile_1_5 (callgraph.py:51) callgraphX->callgraphX__tile_1_5 callgraphX__tile_1_6 tile_1_6 (callgraph.py:56) callgraphX->callgraphX__tile_1_6 callgraphX__tile_1_7 tile_1_7 (callgraph.py:61) callgraphX->callgraphX__tile_1_7 callgraphX__tile_1_8 tile_1_8 (callgraph.py:66) callgraphX->callgraphX__tile_1_8 callgraphX__tile_2_0 tile_2_0 (callgraph.py:71) callgraphX->callgraphX__tile_2_0 callgraphX__tile_2_1 tile_2_1 (callgraph.py:76) callgraphX->callgraphX__tile_2_1 callgraphX__tile_2_2 tile_2_2 (callgraph.py:87) callgraphX->callgraphX__tile_2_2 callgraphX__tile_2_3 tile_2_3 (callgraph.py:92) callgraphX->callgraphX__tile_2_3 callgraphX__tile_2_4 tile_2_4 (callgraph.py:100) callgraphX->callgraphX__tile_2_4 callgraphX__tile_2_5 tile_2_5 (callgraph.py:108) callgraphX->callgraphX__tile_2_5 callgraphX__tile_2_6 tile_2_6 (callgraph.py:116) callgraphX->callgraphX__tile_2_6 callgraphX__tile_2_7 tile_2_7 (callgraph.py:124) callgraphX->callgraphX__tile_2_7 callgraphX__tile_2_8 tile_2_8 (callgraph.py:132) callgraphX->callgraphX__tile_2_8 callgraphX__tile_3_0 tile_3_0 (callgraph.py:137) callgraphX->callgraphX__tile_3_0 callgraphX__tile_3_1 tile_3_1 (callgraph.py:142) callgraphX->callgraphX__tile_3_1 callgraphX__tile_3_2 tile_3_2 (callgraph.py:150) callgraphX->callgraphX__tile_3_2 callgraphX__tile_3_3 tile_3_3 (callgraph.py:155) callgraphX->callgraphX__tile_3_3 callgraphX__tile_3_4 tile_3_4 (callgraph.py:163) callgraphX->callgraphX__tile_3_4 callgraphX__tile_3_5 tile_3_5 (callgraph.py:168) callgraphX->callgraphX__tile_3_5 callgraphX__tile_3_6 tile_3_6 (callgraph.py:173) callgraphX->callgraphX__tile_3_6 callgraphX__tile_3_7 tile_3_7 (callgraph.py:178) callgraphX->callgraphX__tile_3_7 callgraphX__tile_3_8 tile_3_8 (callgraph.py:186) callgraphX->callgraphX__tile_3_8 callgraphX__tile_4_0 tile_4_0 (callgraph.py:191) callgraphX->callgraphX__tile_4_0 callgraphX__tile_4_1 tile_4_1 (callgraph.py:196) callgraphX->callgraphX__tile_4_1 callgraphX__tile_4_2 tile_4_2 (callgraph.py:204) callgraphX->callgraphX__tile_4_2 callgraphX__tile_4_3 tile_4_3 (callgraph.py:209) callgraphX->callgraphX__tile_4_3 callgraphX__tile_4_4 tile_4_4 (callgraph.py:217) callgraphX->callgraphX__tile_4_4 callgraphX__tile_4_5 tile_4_5 (callgraph.py:225) callgraphX->callgraphX__tile_4_5 callgraphX__tile_4_6 tile_4_6 (callgraph.py:233) callgraphX->callgraphX__tile_4_6 callgraphX__tile_4_7 tile_4_7 (callgraph.py:238) callgraphX->callgraphX__tile_4_7 callgraphX__tile_4_8 tile_4_8 (callgraph.py:246) callgraphX->callgraphX__tile_4_8 callgraphX__tile_5_0 tile_5_0 (callgraph.py:251) callgraphX->callgraphX__tile_5_0 callgraphX__tile_5_1 tile_5_1 (callgraph.py:256) callgraphX->callgraphX__tile_5_1 callgraphX__tile_5_2 tile_5_2 (callgraph.py:264) callgraphX->callgraphX__tile_5_2 callgraphX__tile_5_3 tile_5_3 (callgraph.py:269) callgraphX->callgraphX__tile_5_3 callgraphX__tile_5_4 tile_5_4 (callgraph.py:274) callgraphX->callgraphX__tile_5_4 callgraphX__tile_5_5 tile_5_5 (callgraph.py:279) callgraphX->callgraphX__tile_5_5 callgraphX__tile_5_6 tile_5_6 (callgraph.py:287) callgraphX->callgraphX__tile_5_6 callgraphX__tile_5_7 tile_5_7 (callgraph.py:292) callgraphX->callgraphX__tile_5_7 callgraphX__tile_5_8 tile_5_8 (callgraph.py:300) callgraphX->callgraphX__tile_5_8 callgraphX__tile_6_0 tile_6_0 (callgraph.py:305) callgraphX->callgraphX__tile_6_0 callgraphX__tile_6_1 tile_6_1 (callgraph.py:310) callgraphX->callgraphX__tile_6_1 callgraphX__tile_6_2 tile_6_2 (callgraph.py:318) callgraphX->callgraphX__tile_6_2 callgraphX__tile_6_3 tile_6_3 (callgraph.py:326) callgraphX->callgraphX__tile_6_3 callgraphX__tile_6_4 tile_6_4 (callgraph.py:334) callgraphX->callgraphX__tile_6_4 callgraphX__tile_6_5 tile_6_5 (callgraph.py:342) callgraphX->callgraphX__tile_6_5 callgraphX__tile_6_6 tile_6_6 (callgraph.py:350) callgraphX->callgraphX__tile_6_6 callgraphX__tile_6_7 tile_6_7 (callgraph.py:355) callgraphX->callgraphX__tile_6_7 callgraphX__tile_6_8 tile_6_8 (callgraph.py:361) callgraphX->callgraphX__tile_6_8 callgraphX__tile_7_0 tile_7_0 (callgraph.py:366) callgraphX->callgraphX__tile_7_0 callgraphX__tile_7_1 tile_7_1 (callgraph.py:371) callgraphX->callgraphX__tile_7_1 callgraphX__tile_7_2 tile_7_2 (callgraph.py:376) callgraphX->callgraphX__tile_7_2 callgraphX__tile_7_3 tile_7_3 (callgraph.py:381) callgraphX->callgraphX__tile_7_3 callgraphX__tile_7_4 tile_7_4 (callgraph.py:386) callgraphX->callgraphX__tile_7_4 callgraphX__tile_7_5 tile_7_5 (callgraph.py:391) callgraphX->callgraphX__tile_7_5 callgraphX__tile_7_6 tile_7_6 (callgraph.py:396) callgraphX->callgraphX__tile_7_6 callgraphX__tile_7_7 tile_7_7 (callgraph.py:401) callgraphX->callgraphX__tile_7_7 callgraphX__tile_7_8 tile_7_8 (callgraph.py:406) callgraphX->callgraphX__tile_7_8 callgraphX__maze->callgraphX__tile_2_1 callgraphX__tile_1_0->callgraphX__print_maze callgraphX__tile_1_1->callgraphX__print_maze callgraphX__tile_1_2->callgraphX__print_maze callgraphX__tile_1_3->callgraphX__print_maze callgraphX__tile_1_4->callgraphX__print_maze callgraphX__tile_1_5->callgraphX__print_maze callgraphX__tile_1_6->callgraphX__print_maze callgraphX__tile_1_7->callgraphX__print_maze callgraphX__tile_1_8->callgraphX__print_maze callgraphX__tile_2_0->callgraphX__print_maze callgraphX__tile_2_1->callgraphX__print_maze callgraphX__tile_2_1->callgraphX__tile_1_1 callgraphX__tile_2_1->callgraphX__tile_2_0 callgraphX__tile_2_1->callgraphX__tile_2_1 callgraphX__tile_2_1->callgraphX__tile_2_2 callgraphX__tile_2_1->callgraphX__tile_3_1 callgraphX__tile_2_2->callgraphX__print_maze callgraphX__tile_2_3->callgraphX__print_maze callgraphX__tile_2_3->callgraphX__tile_1_3 callgraphX__tile_2_3->callgraphX__tile_2_2 callgraphX__tile_2_3->callgraphX__tile_2_3 callgraphX__tile_2_3->callgraphX__tile_2_4 callgraphX__tile_2_3->callgraphX__tile_3_3 callgraphX__tile_2_4->callgraphX__print_maze callgraphX__tile_2_4->callgraphX__tile_1_4 callgraphX__tile_2_4->callgraphX__tile_2_3 callgraphX__tile_2_4->callgraphX__tile_2_4 callgraphX__tile_2_4->callgraphX__tile_2_5 callgraphX__tile_2_4->callgraphX__tile_3_4 callgraphX__tile_2_5->callgraphX__print_maze callgraphX__tile_2_5->callgraphX__tile_1_5 callgraphX__tile_2_5->callgraphX__tile_2_4 callgraphX__tile_2_5->callgraphX__tile_2_5 callgraphX__tile_2_5->callgraphX__tile_2_6 callgraphX__tile_2_5->callgraphX__tile_3_5 callgraphX__tile_2_6->callgraphX__print_maze callgraphX__tile_2_6->callgraphX__tile_1_6 callgraphX__tile_2_6->callgraphX__tile_2_5 callgraphX__tile_2_6->callgraphX__tile_2_6 callgraphX__tile_2_6->callgraphX__tile_2_7 callgraphX__tile_2_6->callgraphX__tile_3_6 callgraphX__tile_2_7->callgraphX__print_maze callgraphX__tile_2_7->callgraphX__tile_1_7 callgraphX__tile_2_7->callgraphX__tile_2_6 callgraphX__tile_2_7->callgraphX__tile_2_7 callgraphX__tile_2_7->callgraphX__tile_2_8 callgraphX__tile_2_7->callgraphX__tile_3_7 callgraphX__tile_2_8->callgraphX__print_maze callgraphX__tile_3_0->callgraphX__print_maze callgraphX__tile_3_1->callgraphX__print_maze callgraphX__tile_3_1->callgraphX__tile_2_1 callgraphX__tile_3_1->callgraphX__tile_3_0 callgraphX__tile_3_1->callgraphX__tile_3_1 callgraphX__tile_3_1->callgraphX__tile_3_2 callgraphX__tile_3_1->callgraphX__tile_4_1 callgraphX__tile_3_2->callgraphX__print_maze callgraphX__tile_3_3->callgraphX__print_maze callgraphX__tile_3_3->callgraphX__tile_2_3 callgraphX__tile_3_3->callgraphX__tile_3_2 callgraphX__tile_3_3->callgraphX__tile_3_3 callgraphX__tile_3_3->callgraphX__tile_3_4 callgraphX__tile_3_3->callgraphX__tile_4_3 callgraphX__tile_3_4->callgraphX__print_maze callgraphX__tile_3_5->callgraphX__print_maze callgraphX__tile_3_6->callgraphX__print_maze callgraphX__tile_3_7->callgraphX__print_maze callgraphX__tile_3_7->callgraphX__tile_2_7 callgraphX__tile_3_7->callgraphX__tile_3_6 callgraphX__tile_3_7->callgraphX__tile_3_7 callgraphX__tile_3_7->callgraphX__tile_3_8 callgraphX__tile_3_7->callgraphX__tile_4_7 callgraphX__tile_3_8->callgraphX__print_maze callgraphX__tile_4_0->callgraphX__print_maze callgraphX__tile_4_1->callgraphX__print_maze callgraphX__tile_4_1->callgraphX__tile_3_1 callgraphX__tile_4_1->callgraphX__tile_4_0 callgraphX__tile_4_1->callgraphX__tile_4_1 callgraphX__tile_4_1->callgraphX__tile_4_2 callgraphX__tile_4_1->callgraphX__tile_5_1 callgraphX__tile_4_2->callgraphX__print_maze callgraphX__tile_4_3->callgraphX__print_maze callgraphX__tile_4_3->callgraphX__tile_3_3 callgraphX__tile_4_3->callgraphX__tile_4_2 callgraphX__tile_4_3->callgraphX__tile_4_3 callgraphX__tile_4_3->callgraphX__tile_4_4 callgraphX__tile_4_3->callgraphX__tile_5_3 callgraphX__tile_4_4->callgraphX__print_maze callgraphX__tile_4_4->callgraphX__tile_3_4 callgraphX__tile_4_4->callgraphX__tile_4_3 callgraphX__tile_4_4->callgraphX__tile_4_4 callgraphX__tile_4_4->callgraphX__tile_4_5 callgraphX__tile_4_4->callgraphX__tile_5_4 callgraphX__tile_4_5->callgraphX__print_maze callgraphX__tile_4_5->callgraphX__tile_3_5 callgraphX__tile_4_5->callgraphX__tile_4_4 callgraphX__tile_4_5->callgraphX__tile_4_5 callgraphX__tile_4_5->callgraphX__tile_4_6 callgraphX__tile_4_5->callgraphX__tile_5_5 callgraphX__tile_4_6->callgraphX__print_maze callgraphX__tile_4_7->callgraphX__print_maze callgraphX__tile_4_7->callgraphX__tile_3_7 callgraphX__tile_4_7->callgraphX__tile_4_6 callgraphX__tile_4_7->callgraphX__tile_4_7 callgraphX__tile_4_7->callgraphX__tile_4_8 callgraphX__tile_4_7->callgraphX__tile_5_7 callgraphX__tile_4_8->callgraphX__print_maze callgraphX__tile_5_0->callgraphX__print_maze callgraphX__tile_5_1->callgraphX__print_maze callgraphX__tile_5_1->callgraphX__tile_4_1 callgraphX__tile_5_1->callgraphX__tile_5_0 callgraphX__tile_5_1->callgraphX__tile_5_1 callgraphX__tile_5_1->callgraphX__tile_5_2 callgraphX__tile_5_1->callgraphX__tile_6_1 callgraphX__tile_5_2->callgraphX__print_maze callgraphX__tile_5_3->callgraphX__print_maze callgraphX__tile_5_4->callgraphX__print_maze callgraphX__tile_5_5->callgraphX__print_maze callgraphX__tile_5_5->callgraphX__tile_4_5 callgraphX__tile_5_5->callgraphX__tile_5_4 callgraphX__tile_5_5->callgraphX__tile_5_5 callgraphX__tile_5_5->callgraphX__tile_5_6 callgraphX__tile_5_5->callgraphX__tile_6_5 callgraphX__tile_5_6->callgraphX__print_maze callgraphX__tile_5_7->callgraphX__print_maze callgraphX__tile_5_7->callgraphX__tile_4_7 callgraphX__tile_5_7->callgraphX__tile_5_6 callgraphX__tile_5_7->callgraphX__tile_5_7 callgraphX__tile_5_7->callgraphX__tile_5_8 callgraphX__tile_5_7->callgraphX__tile_6_7 callgraphX__tile_5_8->callgraphX__print_maze callgraphX__tile_6_0->callgraphX__print_maze callgraphX__tile_6_1->callgraphX__print_maze callgraphX__tile_6_1->callgraphX__tile_5_1 callgraphX__tile_6_1->callgraphX__tile_6_0 callgraphX__tile_6_1->callgraphX__tile_6_1 callgraphX__tile_6_1->callgraphX__tile_6_2 callgraphX__tile_6_1->callgraphX__tile_7_1 callgraphX__tile_6_2->callgraphX__print_maze callgraphX__tile_6_2->callgraphX__tile_5_2 callgraphX__tile_6_2->callgraphX__tile_6_1 callgraphX__tile_6_2->callgraphX__tile_6_2 callgraphX__tile_6_2->callgraphX__tile_6_3 callgraphX__tile_6_2->callgraphX__tile_7_2 callgraphX__tile_6_3->callgraphX__print_maze callgraphX__tile_6_3->callgraphX__tile_5_3 callgraphX__tile_6_3->callgraphX__tile_6_2 callgraphX__tile_6_3->callgraphX__tile_6_3 callgraphX__tile_6_3->callgraphX__tile_6_4 callgraphX__tile_6_3->callgraphX__tile_7_3 callgraphX__tile_6_4->callgraphX__print_maze callgraphX__tile_6_4->callgraphX__tile_5_4 callgraphX__tile_6_4->callgraphX__tile_6_3 callgraphX__tile_6_4->callgraphX__tile_6_4 callgraphX__tile_6_4->callgraphX__tile_6_5 callgraphX__tile_6_4->callgraphX__tile_7_4 callgraphX__tile_6_5->callgraphX__print_maze callgraphX__tile_6_5->callgraphX__tile_5_5 callgraphX__tile_6_5->callgraphX__tile_6_4 callgraphX__tile_6_5->callgraphX__tile_6_5 callgraphX__tile_6_5->callgraphX__tile_6_6 callgraphX__tile_6_5->callgraphX__tile_7_5 callgraphX__tile_6_6->callgraphX__print_maze callgraphX__tile_6_7->callgraphX__print_maze callgraphX__tile_6_8->callgraphX__print_maze callgraphX__tile_7_0->callgraphX__print_maze callgraphX__tile_7_1->callgraphX__print_maze callgraphX__tile_7_2->callgraphX__print_maze callgraphX__tile_7_3->callgraphX__print_maze callgraphX__tile_7_4->callgraphX__print_maze callgraphX__tile_7_5->callgraphX__print_maze callgraphX__tile_7_6->callgraphX__print_maze callgraphX__tile_7_7->callgraphX__print_maze callgraphX__tile_7_8->callgraphX__print_maze + +### 第一次尝试 + +我们引入了`DictMutator`类,该类通过插入给定字典中的关键字来使字符串发生变异: + +```py +class DictMutator(Mutator): + def __init__(self, dictionary): + super().__init__() + self.dictionary = dictionary + self.mutators.append(self.insert_from_dictionary) + + def insert_from_dictionary(self, s): + """Returns s with a keyword from the dictionary inserted""" + pos = random.randint(0, len(s)) + random_keyword = random.choice(self.dictionary) + return s[:pos] + random_keyword + s[pos:] + +``` + +为了模糊迷宫,我们扩展了`DictMutator`类,以将字典关键字附加到种子的末尾并从种子的末尾删除字符。 + +```py +class MazeMutator(DictMutator): + def __init__(self, dictionary): + super().__init__(dictionary) + self.mutators.append(self.delete_last_character) + self.mutators.append(self.append_from_dictionary) + + def append_from_dictionary(self,s): + """Returns s with a keyword from the dictionary appended""" + random_keyword = random.choice(self.dictionary) + return s + random_keyword + + def delete_last_character(self,s): + """Returns s without the last character""" + if (len(s) > 0): + return s[:-1] + +``` + +让我们尝试一个标准的灰盒模糊器,它具有经典的功率计划和扩展的迷宫突变器(n = 10k)。 + +```py +n = 10000 +seed_input = " " # empty seed + +maze_mutator = MazeMutator(["L","R","U","D"]) +maze_schedule = PowerSchedule() +maze_fuzzer = GreyboxFuzzer([seed_input], maze_mutator, maze_schedule) + +start = time.time() +maze_fuzzer.runs(FunctionCoverageRunner(maze), trials=n) +end = time.time() + +"It took the fuzzer %0.2f seconds to generate and execute %d inputs." % (end - start, n) + +``` + +```py +'It took the fuzzer 10.89 seconds to generate and execute 10000 inputs.' + +``` + +我们将需要打印一些模糊器的统计信息。 我们为什么不为此定义一个函数? + +```py +def print_stats(fuzzer): + total = len(fuzzer.population) + solved = 0 + invalid = 0 + valid = 0 + for seed in fuzzer.population: + s = maze(str(seed.data)) + if "INVALID" in s: invalid += 1 + elif "VALID" in s: valid += 1 + elif "SOLVED" in s: + solved += 1 + if solved == 1: + print("First solution: %s" % repr(seed)) + else: print("??") + + print("""Out of %d seeds, +* %4d solved the maze, +* %4d were valid but did not solve the maze, and +* %4d were invalid""" % (total, solved, valid, invalid)) + +``` + +我们的老式灰箱模糊测试器的性能如何? + +```py +print_stats(maze_fuzzer) + +``` + +```py +Out of 844 seeds, +* 0 solved the maze, +* 204 were valid but did not solve the maze, and +* 640 were invalid + +``` + +它可能一次都无法解决迷宫问题。 我们如何使模糊测试者知道种子离目标有多远? 如果我们知道这一点,就可以为该种子分配更多的能量。 + +***试试*** 。 使用`AFLFastSchedule`和`CountingGreyboxFuzzer`打印增强型模糊器的统计信息。 它的性能可能比未增强的灰箱模糊器要好得多:最低概率路径也​​恰好是到达目标的路径。 您可以通过以Jupyter笔记本打开本章来执行自己的代码。 + +### 计算功能级距离 + +使用迷宫代码和目标函数的静态调用图,我们可以计算每个函数$ f $到目标$ t $的距离,作为$ f $和$ t $之间的最短路径的长度。 + +幸运的是,生成的迷宫代码包含一个名为`target_tile`的函数,该函数返回目标函数的名称。 + +```py +target = target_tile() +target + +``` + +```py +'tile_6_7' + +``` + +现在,我们需要在调用图中找到相应的函数。 函数`get_callgraph`将迷宫代码的调用图作为[网络x](https://networkx.github.io/) 图返回。 Networkx为图形分析提供了一些有用的功能。 + +```py +import [networkx](https://docs.python.org/3/library/networkx.html) as [nx](https://docs.python.org/3/library/nx.html) +from [ControlFlow](ControlFlow.html) import get_callgraph + +``` + +```py +cg = get_callgraph(maze_code) +for node in cg.nodes(): + if target in node: + target_node = node + break +target_node + +``` + +```py +'callgraphX__tile_6_7' + +``` + +现在,我们可以生成函数级距离。 字典`distance`包含每个功能到目标功能的距离。 如果没有到目标的路径,我们指定最大距离(`0xFFFF`)。 + +函数`nx.shortest_path_length(CG, node, target_node)`返回调用图`CG`中从函数`node`到函数`target_node`的最短路径的长度。 + +```py +distance = {} +for node in cg.nodes(): + if "__" in node: + name = node.split("__")[-1] + else: + name = node + try: + distance[name] = nx.shortest_path_length(cg, node, target_node) + except: + distance[name] = 0xFFFF + +``` + +这些是目标功能路径上所有图块功能的距离值。 + +```py +{k: distance[k] for k in list(distance) if distance[k] < 0xFFFF} + +``` + +```py +{'callgraphX': 1, + 'tile_2_1': 22, + 'maze': 23, + 'tile_6_3': 16, + 'tile_6_4': 15, + 'tile_2_3': 8, + 'tile_6_5': 14, + 'tile_5_1': 19, + 'tile_2_4': 7, + 'tile_3_7': 3, + 'tile_2_5': 6, + 'tile_6_7': 0, + 'tile_2_6': 5, + 'tile_2_7': 4, + 'tile_4_1': 20, + 'tile_5_5': 13, + 'tile_4_3': 10, + 'tile_4_4': 11, + 'tile_5_7': 1, + 'tile_3_1': 21, + 'tile_4_5': 12, + 'tile_6_2': 17, + 'tile_4_7': 2, + 'tile_6_1': 18, + 'tile_3_3': 9} + +``` + +***摘要*** 。 使用静态调用图和目标函数$ t $,我们演示了如何计算每个函数$ f $到目标$ t $的函数级距离。 + +***尝试*** 。 您可以通过以Jupyter笔记本打开本章来尝试执行自己的代码。 + +* 如果有多个目标,我们如何计算距离? (提示:[几何平均值](https://en.wikipedia.org/wiki/Geometric_mean))。 +* 给定每个函数$ f $的调用图(CG)和控制流图(CFG $ _f $),我们如何计算基本块(BB)级距离? (提示:在CFG $ _f $中,测量到目标函数路径上函数的*调用*的BB级距离。请记住,功能级距离较高的函数中BB级距离较高, 太。) + +***读取*** 。 如果您对搜索的其他方面感兴趣,可以通过阅读[基于搜索的模糊化](SearchBasedFuzzer.html)一章进行跟进。 如果您有兴趣,如何解决以上问题,可以查看我们的论文“ [定向灰盒模糊化](https://mboehme.github.io/paper/CCS17.pdf)”。 + +### 定向功率表 + +现在我们知道了如何计算功能级别的距离,让我们尝试实现一个功率调度,该功率调度将*的更多能量分配给目标函数的平均距离*较低的种子。 注意,距离值都是*预先计算的*。 这些值被注入到程序二进制文件中,就像coverage工具一样。 实际上,这使得平均距离*的计算极为有效*。 + +如果您真的想知道。 给定调用图中$ CG $中函数$ s $到函数$ t $的函数级距离$ d_f(s,t)$,我们的有向功率调度将计算以下项的种子距离$ d(i,t)$ 种子$ i $以$ t $作为$ d(i,t)= \ sum_ {s \ in CG} \ dfrac {d_f(s,t)} {| CG |} $的功能,其中$ | CG | $是 调用图中$ CG $中的节点数。 + +```py +class DirectedSchedule(PowerSchedule): + def __init__(self, distance, exponent): + self.distance = distance + self.exponent = exponent + + def __getFunctions__(self, coverage): + functions = set() + for f, _ in set(coverage): + functions.add(f) + return functions + + def assignEnergy(self, population): + """Assigns each seed energy inversely proportional + to the average function-level distance to target.""" + for seed in population: + if not hasattr(seed, 'distance'): + num_dist = 0 + sum_dist = 0 + for f in self.__getFunctions__(seed.coverage): + if f in list(distance): + sum_dist += distance[f] + num_dist += 1 + seed.distance = sum_dist / num_dist + seed.energy = (1 / seed.distance) ** self.exponent + +``` + +让我们看看有针对性的时间表如何针对旧的灰盒模糊测试器执行。 + +```py +directed_schedule = DirectedSchedule(distance, 3) +directed_fuzzer = GreyboxFuzzer([seed_input], maze_mutator, directed_schedule) + +start = time.time() +directed_fuzzer.runs(FunctionCoverageRunner(maze), trials=n) +end = time.time() + +"It took the fuzzer %0.2f seconds to generate and execute %d inputs." % (end - start, n) + +``` + +```py +'It took the fuzzer 14.61 seconds to generate and execute 10000 inputs.' + +``` + +```py +print_stats(directed_fuzzer) + +``` + +```py +Out of 1441 seeds, +* 0 solved the maze, +* 542 were valid but did not solve the maze, and +* 899 were invalid + +``` + +它可能也不能解决单个迷宫问题,但是我们有更多有效的解决方案。 因此,肯定有进步。 + +让我们看一下每个种子的距离值。 + +```py +y = [seed.distance for seed in directed_fuzzer.population] +x = range(len(y)) +plt.scatter(x, y) +plt.ylim(0,max(y)) +plt.xlabel("Seed ID") +plt.ylabel("Distance"); + +``` + +![]( +) + +让我们标准化y轴并提高小距离种子的重要性。 + +### 改进的有向功率计划 + +改进的有向进度计划将最小距离和最大距离之间的种子距离标准化。 同样,如果您真的想知道。 给定种子$ i $与函数$ t $的种子距离$ d(i,t)$,我们改进的功率调度将新的种子距离$ d'(i,t)$计算为$$ d'(i ,t)= \ begin {cases} 1 & \ text {if} d(i,t)= \ text {minD} = \ text {maxD} \\ \ text {maxD}-\ text {minD} & \ text {if} d(i,t)= \ text {minD} \ neq \ text {maxD} \\ \ frac {d(i,t)-\ text {minD}} {\ text {maxD} -\ text {minD}} & \ text {否则} \ end {cases} $$,其中$$ \ text {minD} = \ min_ {i \ in T} [d(i,t)] $$和 $$ \ text {maxD} = \ max_ {i \ in T} [d(i,t)] $$其中$ T $是种子集(即种群)。 + +```py +class AFLGoSchedule(DirectedSchedule): + def assignEnergy(self, population): + """Assigns each seed energy inversely proportional + to the average function-level distance to target.""" + min_dist = 0xFFFF + max_dist = 0 + for seed in population: + if not hasattr(seed, 'distance'): + num_dist = 0 + sum_dist = 0 + for f in self.__getFunctions__(seed.coverage): + if f in list(distance): + sum_dist += distance[f] + num_dist += 1 + seed.distance = sum_dist / num_dist + if seed.distance < min_dist: min_dist = seed.distance + if seed.distance > max_dist: max_dist = seed.distance + + for seed in population: + if (seed.distance == min_dist): + if min_dist == max_dist: + seed.energy = 1 + else: + seed.energy = max_dist - min_dist + else: + seed.energy = ((max_dist - min_dist) / (seed.distance - min_dist)) + +``` + +让我们看看改进的电源调度表如何执行。 + +```py +aflgo_schedule = AFLGoSchedule(distance, 3) +aflgo_fuzzer = GreyboxFuzzer([seed_input], maze_mutator, aflgo_schedule) + +start = time.time() +aflgo_fuzzer.runs(FunctionCoverageRunner(maze), trials=n) +end = time.time() + +"It took the fuzzer %0.2f seconds to generate and execute %d inputs." % (end - start, n) + +``` + +```py +'It took the fuzzer 22.91 seconds to generate and execute 10000 inputs.' + +``` + +```py +print_stats(aflgo_fuzzer) + +``` + +```py +First solution: &.@9DWDx$SD:qD?R5RX1RRsU0ULLUCU&R~RRRDDFDDDm +Out of 1987 seeds, +* 332 solved the maze, +* 192 were valid but did not solve the maze, and +* 1463 were invalid + +``` + +与以前的所有电源计划相反,该计划产生了数百种解决方案。 它产生了许多解决方案。 + +让我们从第一个解决方案中过滤掉所有被忽略的输入字符。 函数`filter(f, seed.data)`返回`seed.data`中元素`e`的列表,其中应用于`e`的函数`f`返回True。 + +```py +for seed in aflgo_fuzzer.population: + s = maze(str(seed.data)) + if "SOLVED" in s: + filtered = "".join(list(filter(lambda c: c in "UDLR", seed.data))) + print(filtered) + break + +``` + +```py +DDDDRRRRUULLUURRRRDDDDD + +``` + +绝对是开头指定的迷宫的解决方案! + +***摘要*** 。 在预先计算出到目标的功能级距离后,我们可以制定一个功率调度表,将更多的能量分配给具有到目标的平均功能级距离较小的种子。 通过标准化最小和最大种子距离之间的种子距离值,我们可以进一步提高定向功率调度。 + +***尝试*** 。 实现和评估使用最小(而不是平均)功能级距离的更简单的定向电源。 使用最小距离的缺点是什么? 为了执行您的代码,您只需要以Jupyter笔记本打开本章。 + +***读取*** 。 您可以在同名论文“ [定向灰箱模糊化](https://mboehme.github.io/paper/CCS17.pdf)” [[Böhme*等人*,2017年。](https://mboehme.github.io/paper/CCS17.pdf)中找到有关定向灰箱模糊的更多信息。 在 [http://github.com/aflgo/aflgo](http://github.com/aflgo/aflgo) 上将其实施到AFL中。 + +## 经验教训 + +* *灰盒模糊器*每秒生成数千个输入。 预处理和轻量级仪器 + * 允许在模糊测试期间维持*的效率,以及* + * 仍然提供了足够的信息来控制进度并稍微控制模糊器。 +* *功率计划表*可以控制/控制模糊器。 例如, + * 我们的[增强型灰箱模糊测试器](#Fuzzer-Boosting)在执行“不太可能”路径的种子上花费了更多能量。 希望生成的输入使用的路径更不可能。 这反过来增加了单位时间内探索路径的数量。 + * 我们的[定向灰箱模糊器](#Directed-Greybox-Fuzzing)在“更接近”目标位置的种子上花费了更多能量。 希望生成的输入甚至更接近目标。 +* *突变器*定义了模糊器的搜索空间。 [为给定程序定制变量](GreyboxFuzzer.html#A-First-Attempt)可以将搜索空间减少到仅相关输入。 在几章中,我们将学习基于[的字典和基于语法的变量](GreyboxGrammarFuzzer.html),以增加生成的有效输入的比率。 + +## 后续步骤 + +我们的目标仍然是充分涵盖功能,以便我们可以触发尽可能多的错误。 为此,我们专注于两类技术: + +1. 尝试覆盖尽可能多的*指定的*功能。 在这里,我们需要输入格式的*规范,*区分各个输入元素,例如(在我们的情况下)数字,运算符,注释和字符串-并尝试覆盖尽可能多的输入元素。 我们将在基于[语法的测试](GrammarFuzzer.html),尤其是基于[语法的突变](GreyboxGrammarFuzzer.html)中探索这一点。 + +2. 尝试覆盖尽可能多的*实现的*功能。 当讨论[基于搜索的测试](SearchBasedFuzzer.html)时,将深入探讨通过“变异”系统地“进化”的“种群”的概念。 此外,[符号测试](SymbolicFuzzer.html)介绍了如何通过解决程序路径上的条件来系统地到达程序位置。 + +这两种技术构成了本书的要旨。 当然,它们也可以相互结合。 和往常一样,我们为所有人提供可运行的代码。 请享用! + +我们完成了,所以我们清理一下: + +```py +import [shutil](https://docs.python.org/3/library/shutil.html) +import [os](https://docs.python.org/3/library/os.html) + +``` + +```py +if os.path.exists('callgraph.dot'): + os.remove('callgraph.dot') + +if os.path.exists('callgraph.py'): + os.remove('callgraph.py') + +``` + +## 背景 + +* **了解有关AFL** 的更多信息: [http://lcamt​​uf.coredump.cx/afl/](http://lcamtuf.coredump.cx/afl/) +* **了解LibFuzzer** (另一个著名的灰箱模糊器): [http://llvm.org/docs/LibFuzzer.html](http://llvm.org/docs/LibFuzzer.html) +* **白盒模糊测试仪必须多快地练习每条路径才能保持比灰盒模糊测试仪更高的效率?** MarcelBöhme和Soumya Paul。 2016\. [自动化软件测试效率的概率分析](https://mboehme.github.io/paper/TSE15.pdf),IEEE TSE,42:345-360 [[Böhme*等人*,2016。](https://doi.org/10.1109/TSE.2015.2487274)] + +## 练习 + +要添加。 \去做{} \ No newline at end of file diff --git a/new/fuzzing-book-zh/12.md b/new/fuzzing-book-zh/12.md new file mode 100644 index 0000000000000000000000000000000000000000..afba03be8bda92bd3b3f359f03fde107017fdc47 --- /dev/null +++ b/new/fuzzing-book-zh/12.md @@ -0,0 +1,1824 @@ +# 基于搜索的模糊化 + +> 原文: [https://www.fuzzingbook.org/html/SearchBasedFuzzer.html](https://www.fuzzingbook.org/html/SearchBasedFuzzer.html) + +有时,我们不仅对使尽可能多的多样化程序输入变得模糊感兴趣,而且对获得实现某些目标(例如到达程序中的特定语句)的*特定*测试输入也感兴趣。 当我们对所要查找的内容有想法时,可以*搜索*。 搜索算法是计算机科学的核心,但是应用诸如广度或深度优先搜索之类的经典搜索算法来搜索测试是不现实的,因为这些算法可能要求我们查看所有可能的输入。 但是,可以使用域知识来解决此问题。 例如,如果我们可以估计几个程序输入中的哪个更接近我们正在寻找的输入,则此信息可以指导我们更快地达到目标-此信息称为*启发式*。 *元启发式*搜索算法中捕获了系统地应用启发式方法的方式。 “元”表示这些算法是通用的,可以针对不同的问题进行不同的实例化。 元启发式方法通常从自然界中观察到的过程中获得启发。 例如,有些算法模仿进化过程,群体智能或化学反应。 通常,它们比穷举搜索方法有效得多,因此它们可以应用于广阔的搜索空间-像程序输入域一样大的搜索空间对他们而言并不是问题。 + +**前提条件** + +* 您应该知道代码覆盖率的工作原理,例如 [关于覆盖的[一章)。](Coverage.html) + +## 测试生成作为搜索问题 + +如果要应用元启发式搜索算法来生成程序的测试数据,则必须做出几种选择:首先,我们需要首先确定*搜索空间*到底是什么 。 搜索空间由我们*表示*我们要寻找的内容来定义。 我们在寻找单个整数值吗? 价值元组? 对象? XML文件? + +### 将程序输入表示为搜索问题 + +表示形式高度依赖于我们要解决的特定测试问题---我们知道要测试的程序,因此表示形式需要对目标程序的任何输入进行编码。 让我们考虑示例函数`test_me()`作为我们的测试函数: + +```py +import [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) + +``` + +```py +import [Fuzzer](Fuzzer.html) + +``` + +```py +from [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) import unicode_escape, terminal_escape + +``` + +```py +def test_me(x, y): + if x == 2 * (y + 1): + return True + else: + return False + +``` + +`test_me()`函数具有两个输入参数,并根据两者之间的关系返回`True`或`False`。 `test_me()`的测试输入由一对值组成,一个为`x`,一个为`y`。 例如: + +```py +test_me(0, 0) + +``` + +```py +False + +``` + +```py +test_me(4, 2) + +``` + +```py +False + +``` + +```py +test_me(22, 10) + +``` + +```py +True + +``` + +我们的搜索空间仅与输入有关,因此测试数据的简单表示形式就是输入元组`(x, y)`。 此输入空间中的每个点都有八个*邻居*: + +* `x-1, y-1` +* `x-1, y` +* `x-1, y+1` +* `x, y+1` +* `x+1, y+1` +* `x+1, y` +* `x, y-1` + +为简单起见,让我们限制搜索空间的大小(我们将在以后进行更改)。 例如,假设我们只需要-1000到1000范围内的值: + +```py +MAX = 1000 +MIN = -MAX + +``` + +为了在搜索空间中的任意点检索邻居,我们定义了函数`neighbours()`,该函数实现了基本的摩尔邻居。 也就是说,我们考虑了所有8个直接邻居,同时考虑了我们刚刚用`MAX`和`MIN`定义的边界: + +```py +def neighbours(x, y): + return [(x + dx, y + dy) for dx in [-1, 0, 1] + for dy in [-1, 0, 1] + if (dx != 0 or dy != 0) + and ((MIN <= x + dx <= MAX) + and (MIN <= y + dy <= MAX))] + +``` + +```py +print(neighbours(10, 10)) + +``` + +```py +[(9, 9), (9, 10), (9, 11), (10, 9), (10, 11), (11, 9), (11, 10), (11, 11)] + +``` + +这完全定义了我们的搜索空间:我们有一个表示形式,并且我们知道个人如何通过邻居相互联系。 现在,我们只需要找到一种算法来探索这个社区,就可以找到一种指导算法的启发式方法。 + +### 定义搜索范围:适应度函数 + +所有元启发式算法都基于启发式函数的使用,该函数可估算给定候选解决方案的质量。 该“优度”通常称为个人的*适合度*,估计适合度的试探法是*适合度函数*。 适应度函数是将搜索空间中的任何点映射为数值(适应度值)的函数。 就最佳解决方案而言,搜索空间中的候选解决方案越好,其适用性值就越好。 因此,如果在搜索空间中以适合度为高度来绘制每个点,则会得到一个景观,其最佳解表示为最高峰。 + +适应度函数取决于生成测试数据要达到的目标。 假设我们有兴趣在`test_me()`函数中覆盖if条件的真实分支,即`x == 2 * (y + 1)`。 + +该函数的给定输入元组到目标分支的距离有多近? 让我们考虑一下搜索空间中的任意点,例如 `(274, 153)`。 如果条件比较以下值: + +```py +x = 274 +y = 153 +x, 2 * (y + 1) + +``` + +```py +(274, 308) + +``` + +为了使分支正确,两个值必须相同。 因此,它们之间的差异越大,我们离实现比较结果的真实性就越远;而它们之间的差异越小,我们就可以使比较结果更加真实。 因此,我们可以通过计算`x`和`2 * (y + 1)`之间的差异来量化比较的“假性”。 因此,我们可以将该距离计算为`abs(x - 2 * (y + 1))`: + +```py +def calculate_distance(x, y): + return abs(x - 2 * (y + 1)) + +``` + +```py +calculate_distance(274, 153) + +``` + +```py +34 + +``` + +我们可以将此距离值用作适应度函数,因为我们可以很好地衡量我们与最佳解的接近程度。 但是请注意,在这种情况下,“更好”并不意味着“更大”。 距离越小越好。 这不是问题,因为还可以使用任何可以最大化值的算法来使其最小化。 + +对于整数元组的搜索空间中的每个值,此距离值定义了我们的搜索格局中的海拔。 由于我们的示例搜索空间是二维的,因此搜索范围是三维的,我们可以对其进行绘制以查看其外观: + +```py +from [mpl_toolkits.mplot3d](https://docs.python.org/3/library/mpl_toolkits.mplot3d.html) import Axes3D + +``` + +```py +import [matplotlib.pyplot](https://docs.python.org/3/library/matplotlib.pyplot.html) as [plt](https://docs.python.org/3/library/plt.html) + +``` + +```py +import [numpy](https://docs.python.org/3/library/numpy.html) as [np](https://docs.python.org/3/library/np.html) + +``` + +```py +%matplotlib inline + +x = np.outer(np.linspace(-10, 10, 30), np.ones(30)) +y = x.copy().T +z = calculate_distance(x, y) + +fig = plt.figure() +ax = plt.axes(projection='3d') + +ax.plot_surface(x, y, z, cmap=plt.cm.jet, rstride=1, cstride=1, linewidth=0); + +``` + +![]( +) + +最佳值,即那些使if条件成立的值,其适应度值为0,并且可以在图的底部清楚地看到。 离最佳值越远,搜索空间中的点越高。 + +### 仪表 + +适应度函数应为具体的测试执行计算距离值。 也就是说,我们要运行程序,然后学习该执行的距离值。 但是,分支条件隐藏在目标函数的源代码中,其值原则上可以是沿着达到它的执行路径进行的各种计算的结果。 即使在我们的示例中,条件是直接使用函数输入值的方程式,但通常情况可能并非如此。 它也可能是衍生值。 因此,我们需要直接在条件语句中观察计算距离度量所需的值。 + +通常使用*仪器*完成此操作:我们在分支条件之前或之后立即添加新代码,以跟踪观察到的值并使用这些值计算距离。 以下是我们正在测试的程序的检测版本,它在执行时打印出距离值: + +```py +def test_me_instrumented(x, y): + print("Instrumentation: Input = (%d, %d), distance = %d" % + (x, y, calculate_distance(x, y))) + if x == 2 * (y + 1): + return True + else: + return False + +``` + +让我们尝试一些示例值: + +```py +test_me_instrumented(0, 0) + +``` + +```py +Instrumentation: Input = (0, 0), distance = 2 + +``` + +```py +False + +``` + +```py +test_me_instrumented(5, 2) + +``` + +```py +Instrumentation: Input = (5, 2), distance = 1 + +``` + +```py +False + +``` + +```py +test_me_instrumented(22, 10) + +``` + +```py +Instrumentation: Input = (22, 10), distance = 0 + +``` + +```py +True + +``` + +在计算适应性值时,我们将执行检测程序版本,但是我们需要一些方法来访问在执行过程中计算出的距离值。 作为此问题的简单第一种解决方案,我们只需添加一个全局变量,然后在其中存储距离计算的值即可。 + +```py +distance = 0 + +``` + +```py +def test_me_instrumented(x, y): + global distance + distance = calculate_distance(x, y) + if x == 2 * (y + 1): + return True + else: + return False + +``` + +现在,使用此工具化的`test_me()`版本,我们终于可以定义适应性函数,该函数简单地运行工具化的`test_me_instrumented()`函数,然后检索全局`distance`变量的值: + +```py +def get_fitness(x, y): + global distance + test_me_instrumented(x, y) + fitness = distance + return fitness + +``` + +让我们在一些示例输入上尝试一下: + +```py +get_fitness(0, 0) + +``` + +```py +2 + +``` + +```py +get_fitness(1, 2) + +``` + +```py +5 + +``` + +```py +get_fitness(22, 10) + +``` + +```py +0 + +``` + +### 爬上示例 + +确定了表示形式(2个整数的整数)和适应度函数(到目标分支的距离)之后,我们现在终于可以继续执行搜索算法了。 让我们使用最简单的元启发式算法Hillclimbing探索这个搜索空间。 隐喻恰当地捕获了正在发生的事情:该算法尝试在我们的表示形式所定义的搜索空间中爬坡。 除此以外,在我们的搜索环境中,最佳值不是高值而是低值,因此从技术上讲,我们正在跌入低谷。 + +爬山算法本身非常简单: + +1. 随机出发 +2. 确定所有邻居的适应度值 +3. 以最合适的身价去邻居 +4. 如果找不到解决方案,请继续执行步骤2 + +爬山者从随机测试输入开始,即`x`和`y`的随机值。 对于任意一对随机整数,它们满足条件`x == 2 * (y + 1)`的几率很小。 假设随机值为`(274, 153)`。 该方程式的右手边`2 * (y + 1)`的计算结果为308,因此该条件显然为假。 登山者应该去哪里? 让我们看一下此测试输入及其邻居的适应性值: + +```py +x, y = 274, 153 +print("Origin %d, %d has fitness %d" % (x, y, get_fitness(x, y))) +for nx, ny in neighbours(x, y): + print("Neighbour %d, %d has fitness %d" % (nx, ny, get_fitness(nx, ny))) + +``` + +```py +Origin 274, 153 has fitness 34 +Neighbour 273, 152 has fitness 33 +Neighbour 273, 153 has fitness 35 +Neighbour 273, 154 has fitness 37 +Neighbour 274, 152 has fitness 32 +Neighbour 274, 154 has fitness 36 +Neighbour 275, 152 has fitness 31 +Neighbour 275, 153 has fitness 33 +Neighbour 275, 154 has fitness 35 + +``` + +将`y`增加1会使等式右侧的值增加到`310`。 因此,等式左边的值与增加之前的值相比,*与等式右边的值甚至更大*! 因此,增加`y`似乎不是一个好主意。 另一方面,将`x`加1可以改善性能:等式的左侧和右侧变得更相似; 他们是“不太平等”。 因此,在`(274, 153)`的八个可能邻居中,增加`x`并减少`y`(`(275, 152)`)的邻居在直观上似乎最好--条件的结果仍然是假的,但是“少” 因此”,而不是原始值。** + +现在让我们实现Hillcimbing算法。 + +```py +import [random](https://docs.python.org/3/library/random.html) + +``` + +```py +LOG_VALUES = 20 # Number of values to log + +``` + +```py +def hillclimber(): + # Create and evaluate starting point + x, y = random.randint(MIN, MAX), random.randint(MIN, MAX) + fitness = get_fitness(x, y) + print("Initial value: %d, %d at fitness %.4f" % (x, y, fitness)) + iterations = 0 + logs = 0 + + # Stop once we have found an optimal solution + while fitness > 0: + iterations += 1 + # Move to first neighbour with a better fitness + for (nextx, nexty) in neighbours(x, y): + new_fitness = get_fitness(nextx, nexty) + + # Smaller fitness values are better + if new_fitness < fitness: + x, y = nextx, nexty + fitness = new_fitness + if logs < LOG_VALUES: + print("New value: %d, %d at fitness %.4f" % (x, y, fitness)) + elif logs == LOG_VALUES: + print("...") + logs += 1 + break + + print("Found optimum after %d iterations at %d, %d" % (iterations, x, y)) + +``` + +```py +hillclimber() + +``` + +```py +Initial value: 201, -956 at fitness 2111.0000 +New value: 200, -956 at fitness 2110.0000 +New value: 199, -956 at fitness 2109.0000 +New value: 198, -956 at fitness 2108.0000 +New value: 197, -956 at fitness 2107.0000 +New value: 196, -956 at fitness 2106.0000 +New value: 195, -956 at fitness 2105.0000 +New value: 194, -956 at fitness 2104.0000 +New value: 193, -956 at fitness 2103.0000 +New value: 192, -956 at fitness 2102.0000 +New value: 191, -956 at fitness 2101.0000 +New value: 190, -956 at fitness 2100.0000 +New value: 189, -956 at fitness 2099.0000 +New value: 188, -956 at fitness 2098.0000 +New value: 187, -956 at fitness 2097.0000 +New value: 186, -956 at fitness 2096.0000 +New value: 185, -956 at fitness 2095.0000 +New value: 184, -956 at fitness 2094.0000 +New value: 183, -956 at fitness 2093.0000 +New value: 182, -956 at fitness 2092.0000 +New value: 181, -956 at fitness 2091.0000 +... +Found optimum after 1656 iterations at -1000, -501 + +``` + +通过选择`x`和`y`的随机值开始爬山。 我们使用`-1000`-`1000`(我们将`MIN`和`MAX`定义为更早)范围内的较低值来减少播放示例所花费的时间。 然后,我们通过调用`get_fitness()`确定此起点的适合度值。 回想一下,我们正在尝试找到最小的适应度值,因此,我们现在循环运行,直到找到适合度`0`(即最佳值)为止。 + +在此循环中,我们遍历所有邻居(`neighbours`),并评估每个邻居的适应度值。 一旦我们发现邻居的适应性更好(更小),爬山者便退出循环,并以此为新起点。 此简单爬坡算法的另一种替代形式是删除`break`语句:这样,将评估*所有*邻居,并选择最佳邻居。 这就是*最陡的爬坡*。 您将看到达到最佳状态所需的迭代次数会减少,尽管对于每个迭代都执行更多的测试。 + +```py +def steepest_ascent_hillclimber(): + # Create and evaluate starting point + x, y = random.randint(MIN, MAX), random.randint(MIN, MAX) + fitness = get_fitness(x, y) + print("Initial value: %d, %d at fitness %.4f" % (x, y, fitness)) + iterations = 0 + logs = 0 + + # Stop once we have found an optimal solution + while fitness > 0: + iterations += 1 + # Move to first neighbour with a better fitness + for (nextx, nexty) in neighbours(x, y): + new_fitness = get_fitness(nextx, nexty) + if new_fitness < fitness: + x, y = nextx, nexty + fitness = new_fitness + if logs < LOG_VALUES: + print("New value: %d, %d at fitness %.4f" % (x, y, fitness)) + elif logs == LOG_VALUES: + print("...") + logs += 1 + + print("Found optimum after %d iterations at %d, %d" % (iterations, x, y)) + +``` + +```py +steepest_ascent_hillclimber() + +``` + +```py +Initial value: -258, 645 at fitness 1550.0000 +New value: -259, 644 at fitness 1549.0000 +New value: -258, 644 at fitness 1548.0000 +New value: -257, 644 at fitness 1547.0000 +New value: -258, 643 at fitness 1546.0000 +New value: -257, 643 at fitness 1545.0000 +New value: -256, 643 at fitness 1544.0000 +New value: -257, 642 at fitness 1543.0000 +New value: -256, 642 at fitness 1542.0000 +New value: -255, 642 at fitness 1541.0000 +New value: -256, 641 at fitness 1540.0000 +New value: -255, 641 at fitness 1539.0000 +New value: -254, 641 at fitness 1538.0000 +New value: -255, 640 at fitness 1537.0000 +New value: -254, 640 at fitness 1536.0000 +New value: -253, 640 at fitness 1535.0000 +New value: -254, 639 at fitness 1534.0000 +New value: -253, 639 at fitness 1533.0000 +New value: -252, 639 at fitness 1532.0000 +New value: -253, 638 at fitness 1531.0000 +New value: -252, 638 at fitness 1530.0000 +... +Found optimum after 517 iterations at 258, 128 + +``` + +我们的示例程序具有非常好的健身环境-完美的坡度,爬山者将永远找到解决方案。 如果绘制随时间推移观察到的适应度值,我们可以看到这个不错的渐变: + +```py +def plotting_hillclimber(fitness_function): + data = [] + + # Create and evaluate starting point + x, y = random.randint(MIN, MAX), random.randint(MIN, MAX) + fitness = fitness_function(x, y) + data += [fitness] + iterations = 0 + + # Stop once we have found an optimal solution + while fitness > 0: + iterations += 1 + # Move to first neighbour with a better fitness + for (nextx, nexty) in neighbours(x, y): + new_fitness = fitness_function(nextx, nexty) + if new_fitness < fitness: + x, y = nextx, nexty + fitness = new_fitness + data += [fitness] + break + + print("Found optimum after %d iterations at %d, %d" % (iterations, x, y)) + return data + +``` + +```py +data = plotting_hillclimber(get_fitness) + +``` + +```py +Found optimum after 429 iterations at -1000, -501 + +``` + +```py +import [matplotlib.pyplot](https://docs.python.org/3/library/matplotlib.pyplot.html) as [plt](https://docs.python.org/3/library/plt.html) + +``` + +```py +fig = plt.figure() +ax = plt.axes() + +x = range(len(data)) +ax.plot(x, data); + +``` + +![]( +) + +这种梯度是理想健身景观的结果。 实际上,我们不会总是有这么好的渐变。 特别是,我们的爬山者只有在至少有一个邻居的适应性更好的情况下才能运作良好。 如果我们达到邻居的*没有*实际上具有更好的适应性值的程度,该怎么办? 考虑以下函数`test_me2`: + +```py +def test_me2(x, y): + if(x * x == y * y * (x % 20)): + return True + else: + return False + +``` + +如果我们想再次覆盖`test_me2`中if条件的真分支,那么我们可以采用与以前相同的方式来计算距离,即通过计算比较两侧之间的差异。 让我们来介绍一下`test_me2()`功能: + +```py +def test_me2_instrumented(x, y): + global distance + distance = abs(x * x - y * y * (x % 20)) + if(x * x == y * y * (x % 20)): + return True + else: + return False + +``` + +使用此工具版本,我们只需要一个适应性函数即可调用该工具版本并读取全局`distance`变量。 + +```py +def bad_fitness(x, y): + global distance + test_me2_instrumented(x, y) + fitness = distance + return fitness + +``` + +在此示例上运行hillclimber之前,让我们通过绘制一下来再次查看搜索格局: + +```py +from [mpl_toolkits.mplot3d](https://docs.python.org/3/library/mpl_toolkits.mplot3d.html) import Axes3D + +``` + +```py +from [math](https://docs.python.org/3/library/math.html) import exp, tan + +``` + +```py +x = np.outer(np.linspace(-10, 10, 30), np.ones(30)) +y = x.copy().T +z = abs(x * x - y * y * (x % 20)) + +``` + +```py +fig = plt.figure() +ax = plt.axes(projection='3d') + +ax.plot_surface(x, y, z, cmap=plt.cm.jet, rstride=1, cstride=1, linewidth=0); + +``` + +![]( +) + +在这一点上,使用新的适应性函数运行爬坡器可能会很好,但是存在一个问题:使用此适应性函数运行爬坡器不是一个好主意,因为它可能永远不会终止。 假设我们已经达到了所有邻居都具有相同或更差的适应度值的地步。 登山者无法在任何地方移动并永远被困在那里! 搜索景观中的这种点称为*局部最优*。 如果达到了这一点,最简单的方法就是放弃并从新的随机点重新开始。 这就是我们在*随机重启*的爬坡器中所做的事情。 + +```py +def restarting_hillclimber(fitness_function): + data = [] + + # Create and evaluate starting point + x, y = random.randint(MIN, MAX), random.randint(MIN, MAX) + fitness = fitness_function(x, y) + data += [fitness] + print("Initial value: %d, %d at fitness %.4f" % (x, y, fitness)) + iterations = 0 + + # Stop once we have found an optimal solution + while fitness > 0: + changed = False + iterations += 1 + # Move to first neighbour with a better fitness + for (nextx, nexty) in neighbours(x, y): + new_fitness = fitness_function(nextx, nexty) + if new_fitness < fitness: + x, y = nextx, nexty + fitness = new_fitness + data += [fitness] + changed = True + break + if not changed: + x, y = random.randint(MIN, MAX), random.randint(MIN, MAX) + fitness = fitness_function(x, y) + data += [fitness] + + print("Found optimum after %d iterations at %d, %d" % (iterations, x, y)) + return data + +``` + +这种变化是微不足道的:我们只是简单地跟踪是否有布尔标志发生任何移动,如果我们没有移至任何邻居,那么我们将选择一个新的随机位置重新开始。 为了方便起见,我们还使用健身功能对爬坡器进行了参数化。 让我们用`bad_fitness`进行试验,并绘制我们观察到的结果适应度值: + +```py +MAX = 1000 +MIN = -MAX + +``` + +```py +data = restarting_hillclimber(bad_fitness) + +``` + +```py +Initial value: 333, 231 at fitness 582804.0000 +Found optimum after 165 iterations at 521, 521 + +``` + +```py +import [matplotlib.pyplot](https://docs.python.org/3/library/matplotlib.pyplot.html) as [plt](https://docs.python.org/3/library/plt.html) + +``` + +```py +fig = plt.figure() +ax = plt.axes() + +x = range(len(data)) +ax.plot(x, data); + +``` + +![]( +) + +多次运行该示例。 有时,我们很幸运,并且存在一个可以直接找到最佳解决方案的梯度。 但是有时候,您会发现在整个搜索过程中重新启动之前会达到最佳值。 + +我们将`x`和`y`的初始值限制在`[MIN, MAX]`的较小范围内。 这是测试生成中的常见技巧,因为在*中,大多数*情况下的解决方案都倾向于由较小的值组成,并且在许多情况下,使用较小的值来开始搜索会使搜索更快。 但是,如果我们需要的解决方案在搜索空间中位于完全不同的位置,该怎么办? 我们偏向于较小的解决方案,这意味着爬山者将需要很长时间才能找到解决方案,并且如果搜索预算固定,那么实际找到解决方案的可能性就较小。 要查看其效果,我们可以简单地用`1000000`或更多替换`1000`。 我们可以尝试使用该范围,以查看我们针对简单搜索问题而获得的效果。 + +```py +MAX = 100000 +MIN = -MAX + +``` + +```py +from [Timer](Timer.html) import Timer + +``` + +```py +with Timer() as t: + restarting_hillclimber(get_fitness) + print("Search time: %.2fs" % t.elapsed_time()) + +``` + +```py +Initial value: 64543, -55357 at fitness 175255.0000 +Found optimum after 169899 iterations at -100000, -50001 +Search time: 0.74s + +``` + +在大多数情况下,直到找到解决方案为止,搜索将花费更长的时间-可能比我们准备等待这样一个简单的示例函数所需的时间更长! (尽管有时我们会很幸运,并随机获得良好的开始位置)。 如何处理“真实”示例? 不要想象是否还有更多的参数和更大的社区! + +## 测试更复杂的程序 + +让我们来看一个稍微复杂的程序:您已经从 [Coverage一章](Coverage.html)中知道了CGI解码器。 + +```py +def cgi_decode(s): + """Decode the CGI-encoded string `s`: + * replace "+" by " " + * replace "%xx" by the character with hex number xx. + Return the decoded string. Raise `ValueError` for invalid inputs.""" + + # Mapping of hex digits to their integer values + hex_values = { + '0': 0, '1': 1, '2': 2, '3': 3, '4': 4, + '5': 5, '6': 6, '7': 7, '8': 8, '9': 9, + 'a': 10, 'b': 11, 'c': 12, 'd': 13, 'e': 14, 'f': 15, + 'A': 10, 'B': 11, 'C': 12, 'D': 13, 'E': 14, 'F': 15, + } + + t = "" + i = 0 + while i < len(s): + c = s[i] + if c == '+': + t += ' ' + elif c == '%': + digit_high, digit_low = s[i + 1], s[i + 2] + i += 2 + if digit_high in hex_values and digit_low in hex_values: + v = hex_values[digit_high] * 16 + hex_values[digit_low] + t += chr(v) + else: + raise ValueError("Invalid encoding") + else: + t += c + i += 1 + return t + +``` + +### CGI解码器作为搜索问题 + +`cgi_decode()`函数具有一个类型为string的输入,并且定义字符串邻域的一种可能方式是编辑距离为1的所有可能的字符串。例如,字符串`test`将为每个字符串具有两个邻居。 它的四个字符: + +* `uest` +* `tfst` +* `tett` +* `tesu` +* `sest` +* `tdst` +* `tert` +* `tess` + +此外,在任何字符之前或之后添加任何字符也将具有1的编辑距离,并且可以将其视为邻居。 为简单起见,让我们将输入字符串的长度固定为合理的值(例如10)。 在这种情况下,每个人有20个邻居(即每个角色有两个邻居)。 + +让我们实现一个新的`neighbour_strings()`函数,该函数生成这些相邻的字符串: + +```py +def neighbour_strings(x): + n = [] + for pos in range(len(x)): + c = ord(x[pos]) + if c < 127: + n += [x[:pos] + chr(c + 1) + x[pos + 1:]] + if c > 20: + n += [x[:pos] + chr(c - 1) + x[pos + 1:]] + return n + +``` + +`neighbour_strings()`函数获取输入字符串中每个字符的数值,并创建一个新字符串,并用字母中的前一个和后继字符替换该字符。 首先,我们仅考虑可打印的ASCII字符,范围为​​20--127。 + +```py +print(neighbour_strings("Hello")) + +``` + +```py +['Iello', 'Gello', 'Hfllo', 'Hdllo', 'Hemlo', 'Heklo', 'Helmo', 'Helko', 'Hellp', 'Helln'] + +``` + +因此,我们为`cgi_decode()`函数定义了搜索空间。 在此搜索空间中搜索个人的下一个要素是适应度函数。 + +### 分支距离 + +`test_me()`函数由单个if条件组成,其中比较了两个整数。 在`cgi_decode()`函数中,我们具有三个if条件和一个while循环,它们都比较字符。 幸运的是,正如我们已经看到的,我们可以将字符视为数字,因此我们可以使用在`test_me()`示例中使用的相同距离估计。 但是,还有两个条件可以检查字符是否包含在集合中,例如: `digit_high in hex_values`。 集合中包含的值接近多少? 一个明显的解决方案是将与集合中最接近的值的距离视为估计值。 + +```py +import [sys](https://docs.python.org/3/library/sys.html) + +``` + +```py +def distance_character(target, values): + + # Initialize with very large value so that any comparison is better + minimum = sys.maxsize + + for elem in values: + distance = abs(target - elem) + if distance < minimum: + minimum = distance + return minimum + +``` + +```py +distance_character(10, [1, 5, 12, 100]) + +``` + +```py +2 + +``` + +```py +distance_character(10, [0, 50, 80, 200]) + +``` + +```py +10 + +``` + +到目前为止,我们所做的进一步简化是假设我们总是希望条件评估为真。 在实践中,我们可能还希望if条件的评估结果也为false。 因此,每个if条件实际上有两个距离估计值,一个估计它与真实条件的接近程度,另一个估计与错误条件的接近程度。 如果条件为真,则真实距离为0;否则为0。 如果条件为假,则假距为0。即,在比较`a == b`中,如果`a`小于`b`,则假距为`0`。 + +当`a`等于`b`时`a == b`为假的距离是多少? 对`a`或`b`的任何更改都会使条件评估为false,因此在这种情况下,我们可以简单地将距离定义为1。 + +更一般地,可以存在其他类型的比较,例如使用关系运算符。 考虑`cgi_decode()`:`i < len(s)`中的循环条件,即它使用小于比较运算符。 将分支距离的概念扩展到涵盖不同类型的比较,并计算正确和错误的距离是很直接的。 下表显示了如何计算不同类型的比较的距离: + +| 健康)状况 | 距离真 | 距离错误 | +| --- | --- | --- | +| a == b | abs(a-b) | 1 | +| a!= b | 1 | abs(a-b) | +| a < b | b-a + 1 | - | +| a < = b | b-a | a-b + 1 | +| a > b | a-b + 1 | b-a | + +请注意,一些计算会添加一个常量`1`。 这样做的原因很简单:假设我们要让`a < b`评估为true,然后让`a = 27`和`b = 27`成立。 条件不成立,但简单地求和将得出`0`的结果。 为了避免这种情况,我们必须添加一个常数。 该值是否为`1`并不重要-任何正常数都起作用。 + +### 处理复杂条件 + +在`cgi_decode()`函数中,我们还可以找到一个稍微复杂一些的谓词,该谓词由两个条件组成,这些条件由一个逻辑`and`连接: + +`if digit_high in hex_values and digit_low in hex_values:` + +原则上,将分支距离定义为使得使连词`A and B`为真的距离等于`A`和`B`的分支距离之和,因为两个条件都必须为真。 同样,使`A or B`为真的分支距离将为`A`和`B`的两个分支距离中的最小值,因为如果两个条件之一为真就可以使整个表达式为真。 + +但是,这并不像在实践中那样容易:谓词可以由嵌套条件和否定组成,并且在应用此计算之前,需要将表达式转换为规范形式。 此外,大多数现代编程语言都使用*短路评估*:如果存在条件`A or B`且`A`为true,则永远不会评估`B`。 如果`B`是带有副作用的表达式,那么即使短路评估会避免执行`B`的分支距离,也可以通过计算`B`的分支距离,来潜在地改变程序的行为(通过调用会导致副作用的副作用) 在正常行为中不执行),那是不可接受的。 + +此外,如果分支条件有副作用怎么办? 例如,假设分支条件为`x == 2 * foo(y)`,其中`foo()`是采用整数作为输入的函数。 幼稚的检测将导致以下代码: + +```py + distance = abs(x - 2 * foo(y)) + if x == 2 * foo(y): + ... +``` + +因此,检测将导致两次执行的`foo()`。 假设`foo()`更改了系统状态(例如,通过打印某些内容,访问文件系统,更改了一些状态变量等),然后清楚地第二次调用`foo()`是个坏主意。 解决此问题的一种方法是*转换​​*条件,而不是*添加*跟踪调用。 例如,可以创建一个临时变量来保存距离计算所需的值,然后在分支条件中使用它们: + +```py + tmp1 = x + tmp2 = 2 * foo(y) + distance = abs(tmp1 - tmp2) + if tmp1 == tmp2: + ... +``` + +除了这些问题之外,向程序中添加全局变量和方法调用的方法似乎还很笨拙---当然,我们不能开始自己考虑程序中的每个分支,也无法对要手动测试的程序进行检测, 特别是如果程序具有多个分支,例如`cgi_decode()`功能。 相反,我们应该研究如何自动仪器程序包含必需的添加语句,以便我们可以计算适合度值。 + +### 原子条件仪器 + +使用全局变量和临时变量的另一种方法是用对辅助函数的调用来代替实际的比较,该函数将原始表达式作为参数求值,而运算符是一个附加参数。 假设我们有一个函数`evaluate_condition()`,它带有四个参数: + +* `num`是标识条件的唯一ID; +* `op`是比较的运算符; +* `lhs`和`rhs`是操作数。 + +该函数计算条件的两个距离:到条件评估为真的距离和到条件评估为假的距离。 这两个结果之一将始终为真,因此其中之一将始终具有距离`0`。 由于该函数替换了原始比较,因此根据`0`的距离返回true或false。 这意味着示例表达式 + +```py + if x == 2 * foo(y) +``` + +将被替换 + +```py + if evaluate_condition(0, "Eq", x, 2 * foo(y)) +``` + +这样,参数仅计算一次,因此可以正确处理副作用。 `evaluate_condition()`函数的外观如下: + +```py +def evaluate_condition(num, op, lhs, rhs): + distance_true = 0 + distance_false = 0 + if op == "Eq": + if lhs == rhs: + distance_false = 1 + else: + distance_true = abs(lhs - rhs) + + # ... code for other types of conditions + + if distance_true == 0: + return True + else: + return False + +``` + +请注意,我们正在使用`0`初始化`distance_true`和`distance_false`。 因此,如果`lhs`等于`rhs`,则变量`distance_true`保持为0,反之亦然。 + +```py +evaluate_condition(1, "Eq", 10, 20) + +``` + +```py +False + +``` + +```py +evaluate_condition(2, "Eq", 20, 20) + +``` + +```py +True + +``` + +`evaluate_condition()`功能尚未执行的操作是存储观察到的距离。 显然,我们需要将值存储在某个位置,以便我们可以从适应性函数中访问它。 由于`cgi_decode()`程序由多个条件组成,并且对于每个条件我们可能都对真实和错误距离感兴趣,因此我们仅使用两个全局词典`distances_true`和`distances_false`,并定义一个用于存储 在字典中观察到的距离值: + +```py +def update_maps(condition_num, d_true, d_false): + global distances_true, distances_false + + if condition_num in distances_true.keys(): + distances_true[condition_num] = min( + distances_true[condition_num], d_true) + else: + distances_true[condition_num] = d_true + + if condition_num in distances_false.keys(): + distances_false[condition_num] = min( + distances_false[condition_num], d_false) + else: + distances_false[condition_num] = d_false + +``` + +变量`condition_num`是我们刚刚评估的条件的唯一ID。 如果这是我们第一次执行此特定条件,则将正确和错误的距离简单地存储在相应的字典中。 但是,同一测试有可能多次执行条件。 例如,`cgi_decode()`函数中的循环条件`i < len(s)`在每个单循环迭代之前进行评估。 但是,最后,我们希望为测试提供一个适合度值。 由于覆盖分支仅要求至少有一个执行到达分支,因此我们仅考虑最接近的一个。 因此,如果`distances_true`和`distances_false`字典已经包含与上一个执行程序的距离,则仅当新的执行程序更接近分支时才替换该值;否则,将替换该值。 这是使用`min()`功能实现的。 + +现在,我们需要从`evaluate_condition()`中调用此函数。 我们还要为`in`运算符和`<`比较添加距离计算,因为在`cgi_decode()`示例中我们都需要它们。 此外,`cgi_decode()`实际上比较字符和数字。 为了确保使用正确的类型,我们首先必须将字符转换为数字以计算距离。 这是使用Python的`ord()`函数完成的。 + +```py +def evaluate_condition(num, op, lhs, rhs): + distance_true = 0 + distance_false = 0 + + # Make sure the distance can be calculated on number and character + # comparisons + if isinstance(lhs, str): + lhs = ord(lhs) + if isinstance(rhs, str): + rhs = ord(rhs) + + if op == "Eq": + if lhs == rhs: + distance_false = 1 + else: + distance_true = abs(lhs - rhs) + + elif op == "Lt": + if lhs < rhs: + distance_false = rhs - lhs + else: + distance_true = lhs - rhs + 1 + # ... + # handle other comparison operators + # ... + + elif op == "In": + minimum = sys.maxsize + for elem in rhs.keys(): + distance = abs(lhs - ord(elem)) + if distance < minimum: + minimum = distance + + distance_true = minimum + if distance_true == 0: + distance_false = 1 + + update_maps(num, distance_true, distance_false) + + if distance_true == 0: + return True + else: + return False + +``` + +下面显示了如何使用`cgi_decode()`功能使用`cgi_decode()`进行连接。 对应于这两个条件,有两个对`evaluate_condition`的调用,并且将它们结合在一起的`and`可确保保留原始的短路行为: + +`if (evaluate_condition(4, 'In', digit_high, hex_values) and evaluate_condition(5, 'In', digit_low, hex_values))` + +当然,我们希望自动产生这种仪器化的变体。 + +### 自动检测源代码 + +实际上,使用程序的抽象语法树(AST)在Python中自动替换比较非常容易。 在AST中,比较通常是一个树节点,该节点具有一个运算符属​​性,两个运算符分别用于左手运算符和右手运算符。 要用对`evaluate_condition()`的调用替换此类比较,只需将AST中的比较节点替换为函数调用节点,这就是`BranchTransformer`类使用Python的`ast`模块中的NodeTransformer所做的事情: + +```py +import [ast](https://docs.python.org/3/library/ast.html) + +``` + +```py +class BranchTransformer(ast.NodeTransformer): + + branch_num = 0 + + def visit_FunctionDef(self, node): + node.name = node.name + "_instrumented" + return self.generic_visit(node) + + def visit_Compare(self, node): + if node.ops[0] in [ast.Is, ast.IsNot, ast.In, ast.NotIn]: + return node + + self.branch_num += 1 + return ast.Call(func=ast.Name("evaluate_condition", ast.Load()), + args=[ast.Num(self.branch_num), + ast.Str(node.ops[0].__class__.__name__), + node.left, + node.comparators[0]], + keywords=[], + starargs=None, + kwargs=None) + +``` + +`BranchTransformer`使用内置解析器`ast.parse()`解析目标Python程序,该解析器返回AST。 Python提供了用于遍历和修改此AST的API。 为了用函数调用代替比较,我们使用`ast.NodeTransformer`,它使用访问者模式,其中AST中每种类型的节点都有一个`visit_*`函数。 因为我们有兴趣替换比较,所以我们覆盖了`visit_Compare`,在这里,我们返回了一个类型为`ast.Func`的新节点,而不是原始的比较节点,这是一个函数调用节点。 该节点的第一个参数是函数`evaluate_condition()`的名称,参数是我们的`evaluate_condition()`函数所期望的四个参数: + +* 分支的数量(我们将其保留在`branch_num`中), +* 运算符(我们只使用其类名), +* 左侧,以及 +* 右边。 + +请注意,Python允许比较多个表达式(例如`1 < x < 10`); 为了使代码保持简单,我们在这里仅处理单个比较,但是通过将每个比较与对`evaluate_condition`的单独调用进行处理,可以扩展代码。 您会注意到,我们还覆盖了`visit_FunctionDef`; 这只是通过添加`_instrumented`来更改方法的名称,以便我们可以继续将原始功能与已检测的功能一起使用。 + +以下代码将`cgi_decode()`函数的源代码解析为AST,然后对其进行转换,然后再次打印出来(使用`astor`库中的`to_source()`函数): + +```py +import [inspect](https://docs.python.org/3/library/inspect.html) +import [ast](https://docs.python.org/3/library/ast.html) +import [astor](https://docs.python.org/3/library/astor.html) + +``` + +```py +from [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) import print_content + +``` + +```py +source = inspect.getsource(cgi_decode) +node = ast.parse(source) +BranchTransformer().visit(node) + +# Make sure the line numbers are ok before printing +node = ast.fix_missing_locations(node) +print_content(astor.to_source(node), '.py') + +``` + +```py +def cgi_decode_instrumented(s): + """Decode the CGI-encoded string `s`: + * replace "+" by " " + * replace "%xx" by the character with hex number xx. + Return the decoded string. Raise `ValueError` for invalid inputs.""" + hex_values = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, + '7': 7, '8': 8, '9': 9, 'a': 10, 'b': 11, 'c': 12, 'd': 13, 'e': 14, + 'f': 15, 'A': 10, 'B': 11, 'C': 12, 'D': 13, 'E': 14, 'F': 15} + t = '' + i = 0 + while evaluate_condition(1, 'Lt', i, len(s)): + c = s[i] + if evaluate_condition(2, 'Eq', c, '+'): + t += ' ' + elif evaluate_condition(3, 'Eq', c, '%'): + digit_high, digit_low = s[i + 1], s[i + 2] + i += 2 + if evaluate_condition(4, 'In', digit_high, hex_values + ) and evaluate_condition(5, 'In', digit_low, hex_values): + v = hex_values[digit_high] * 16 + hex_values[digit_low] + t += chr(v) + else: + raise ValueError('Invalid encoding') + else: + t += c + i += 1 + return t + +``` + +要使用工具版本计算适应性值,我们需要再次编译工具AST,这是使用Python的`compile()`函数完成的。 然后,我们需要使已编译函数可访问,为此,首先要从`sys.modules`中检索当前模块,然后使用`exec`将已检测函数的已编译代码添加到当前模块的函数列表中。 此后,可以访问`cgi_decode_instrumented()`功能。 + +```py +def create_instrumented_function(f): + source = inspect.getsource(f) + node = ast.parse(source) + node = BranchTransformer().visit(node) + + # Make sure the line numbers are ok so that it compiles + node = ast.fix_missing_locations(node) + + # Compile and add the instrumented function to the current module + current_module = sys.modules[__name__] + code = compile(node, filename="", mode="exec") + exec(code, current_module.__dict__) + +``` + +```py +# Set up the global maps +distances_true = {} +distances_false = {} + +``` + +```py +# Create instrumented function +# cgi_decode_instrumented = +create_instrumented_function(cgi_decode) + +``` + +```py +assert cgi_decode("Hello+Reader") == cgi_decode_instrumented("Hello+Reader") + +``` + +```py +cgi_decode_instrumented("Hello+Reader") + +``` + +```py +'Hello Reader' + +``` + +```py +distances_true + +``` + +```py +{1: 0, 2: 0, 3: 35} + +``` + +```py +distances_false + +``` + +```py +{1: 0, 2: 0, 3: 0} + +``` + +从`distances_true`和`distances_false`映射中可以看出,条件1和2在`cgi_decode_instrumented`上执行时已评估为true和false,而条件3仅已评估为false。 这是预期的,因为进入并离开了while循环,并且输入字符串中只有一个空格,但没有`%`-字符。 + +### 适用于创建有效十六进制输入的适应度函数 + +例如,让我们以测试`cgi_decode()`的一部分来解码有效十六进制代码为目标。 这意味着我们要使条件1为真,2为假,3为真和4为真。 为了表示这样的路径,我们可以简单地总结出这些分支的分支距离。 但是,简单地总结分支距离存在潜在的问题:如果一个条件的距离取决于很大的值的比较,而另一种条件的距离取决于小值的计算,则很可能会改进大值 导致更好的适应性改善,从而使搜索产生偏见。 为避免这种情况,我们需要先将*归一化*分支距离,然后再将其相加。 + +范围`[a, b]`的归一化函数将数字作为输入,并返回`>=a`和`<=b`的值。 该函数的重要之处在于,对于任何两个数字`x`和`y`,都需要通过规范化来保留顺序。 也就是说,如果为`x 0: + changed = False + for (nextx) in neighbour_strings(x): + new_fitness = get_fitness(nextx) + if new_fitness < fitness: + x = nextx + fitness = new_fitness + changed = True + print("New value: %s at fitness %.4f" % (x, fitness)) + break + + # Random restart if necessary + if not changed: + x = random_string(10) + fitness = get_fitness(x) + + print("Optimum at %s, fitness %.4f" % (x, fitness)) + +``` + +```py +hillclimb_cgi() + +``` + +```py +Initial input: o'@[3(rW*M at fitness 2.6667 +New value: o&@[3(rW*M at fitness 2.5000 +New value: o%@[3(rW*M at fitness 1.5000 +New value: o%A[3(rW*M at fitness 0.8571 +New value: o%A\3(rW*M at fitness 0.8333 +New value: o%A]3(rW*M at fitness 0.8000 +New value: o%A^3(rW*M at fitness 0.7500 +New value: o%A_3(rW*M at fitness 0.6667 +New value: o%A`3(rW*M at fitness 0.5000 +New value: o%Aa3(rW*M at fitness 0.0000 +Optimum at o%Aa3(rW*M, fitness 0.0000 + +``` + +运行hillclimber几次,以查看它生成带有有效十六进制字符的字符串。 有时只需要几个步骤,有时就需要更长的时间,但是最后它总是可以解决问题并生成我们想要的字符串。 + +## 进化搜索 + +如果邻里很小,爬山的效果很好。 到目前为止,在`cgi_decode()`示例中就是这种情况,因为我们将自己限制为固定数量的字符(10),并将字符范围限制为可打印的ASCII字符。 但是想象一下,如果我们不寻找ASCII字符,而是寻找UTF-16 Unicode字符,会发生什么? 确实不允许在URL中使用它们,但是让我们看看如果更改搜索空间会发生什么: + +```py +def random_unicode_string(l): + s = "" + for i in range(l): + # Limits to reflect range of UTF-16 + random_character = chr(random.randrange(0, 65536)) + s = s + random_character + return s + +``` + +```py +def unicode_string_neighbours(x): + n = [] + for pos in range(len(x)): + c = ord(x[pos]) + # Limits to reflect range of UTF-16 + if c < 65536: + n += [x[:pos] + chr(c + 1) + x[pos + 1:]] + if c > 0: + n += [x[:pos] + chr(c - 1) + x[pos + 1:]] + + return n + +``` + +UTF-8字符用16位表示,这为我们提供了65536个可能的字符范围。 以上功能适用于这些边界。 在再次运行爬坡器之前,让我们再做一个更改:我们将添加一个迭代限制,以便我们可以放弃搜索,而不是永远等待搜索完成。 + +```py +def terminal_repr(s): + return terminal_escape(repr(s)) + +``` + +```py +def hillclimb_cgi_limited(max_iterations): + x = random_unicode_string(10) + fitness = get_fitness(x) + print("Initial input: %s at fitness %.4f" % (terminal_repr(x), fitness)) + + iteration = 0 + logs = 0 + while fitness > 0 and iteration < max_iterations: + changed = False + for (nextx) in unicode_string_neighbours(x): + new_fitness = get_fitness(nextx) + if new_fitness < fitness: + x = nextx + fitness = new_fitness + changed = True + if logs < LOG_VALUES: + print("New value: %s at fitness %.4f" % + (terminal_repr(x), fitness)) + elif logs == LOG_VALUES: + print("...") + logs += 1 + break + + # Random restart if necessary + if not changed: + x = random_string(10) + fitness = get_fitness(x) + iteration += 1 + + print("Optimum at %s, fitness %.4f" % (terminal_repr(x), fitness)) + +``` + +```py +hillclimb_cgi_limited(100) + +``` + +```py +Initial input: '埂\udf19\uf67c듵騛쁥핡勸\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勷\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勶\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勵\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勴\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勳\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勲\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勱\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勰\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勯\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勮\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勭\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勬\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勫\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勪\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勩\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勨\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勧\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勦\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勥\uf172싕' at fitness 3.0000 +New value: '埂\udf19\uf67c듵騛쁥핡勤\uf172싕' at fitness 3.0000 +... +Optimum at '埂\udf19\uf67c듵騛쁥핡劔\uf172싕', fitness 3.0000 + +``` + +您可以尝试迭代限制,并查看在此搜索空间中找到解决方案需要多长时间。 除非您对随机的起点感到幸运,否则通常会花费不合理的时间。 + +### 全局搜索 + +爬山者在搜索的每个步骤中都会探索一个人的本地邻域,如果邻域太大,那么这将花费很长时间。 一种替代策略是不将搜索限制在本地附近,而是全局搜索搜索空间。 也就是说,允许搜索算法在搜索空间内进行更大的调整。 对爬山者的简单修改即可将其从本地搜索算法转换为全局搜索算法:无需查看所有直接邻居,而是以允许进行较大修改的方式对*进行了突变*。 + +*突变*是一种变化,代表围绕搜索空间的较大步幅。 实施突变时,一个重要的决定是,从理论上讲,只需连续应用突变,就可以到达搜索空间中的任何点。 但是,突变通常不应完全用随机的个体代替个体。 对于该搜索而言,重要的是,该突变构成对仍然保留其大部分特征的个体的合理改变。 对于我们的10个字符字符串的搜索问题,可能的突变是在10个字符中仅替换 *1* ,如下所示: + +```py +def flip_random_character(s): + pos = random.randint(0, len(s) - 1) + new_c = chr(random.randrange(0, 65536)) + return s[:pos] + new_c + s[pos + 1:] + +``` + +对爬山者的一个简单修改就是用突变代替对邻域的探索。 在每次迭代中,当前个体都会发生变异。 将生成的后代个体与其父代个体进行比较,两者中的更好者是搜索空间中的新点,并用于下一轮突变。 这称为“随机爬山”。 + +```py +def randomized_hillclimb(): + x = random_unicode_string(10) + fitness = get_fitness(x) + print("Initial value: %s at fitness %.4f" % + (terminal_repr(x), fitness)) + + iterations = 0 + while fitness > 0: + mutated = flip_random_character(x) + new_fitness = get_fitness(mutated) + if new_fitness <= fitness: + x = mutated + fitness = new_fitness + #print("New value: %s at fitness %.4f" %(terminal_repr(x), fitness)) + iterations += 1 + + print("Optimum at %s after %d iterations" % + (terminal_repr(x), iterations)) + +``` + +```py +randomized_hillclimb() + +``` + +```py +Initial value: '舨ᑆ\uec4f\ue27f羏\uf314䖗繣厪킨' at fitness 2.9998 +Optimum at 'ጤ〆撟%e5匸㗵暠ᴌ' after 34356 iterations + +``` + +该算法通常比标准爬坡器更快地找到解决方案,尽管它仍然相当慢! + +值得指出的是,爬山和随机版本之间有一个微妙但至关重要的变化:请注意比较`new_fitness <= fitness`,而在爬山中我们使用`new_fitness < fitness`。 这很重要,因为搜索范围可能具有适合度值(高原)相等的区域,我们需要以某种方式克服这些适合度值。 在标准的Hillcimber中,我们通过随机重启来完成此操作。 如果随机的爬山者拒绝适应度相同的后代,它将继续变异相同的个体,并可能难以摆脱高原。 如果我们也用相同的适应性替换,则允许搜索在高原上移动,最终增加逃脱的机会。 + +随机爬山者也称为 *1 + 1进化算法*(*(1 + 1)EA* )。 进化算法是一种试图启发自然进化过程的元启发式搜索算法。 自然进化的基础是环境压力导致自然选择的种群:只有适者生存,而那些不适应者将死亡,因此种群的整体适应度逐渐提高。 (1 + 1)EA是一种非常特殊的进化算法,种群大小为1,可以精确地产生1个后代。 但是,实践中最常见的搜索算法是遗传算法。 + +### 遗传算法 + +最著名的进化算法之一是*遗传算法*(GA)。 遗传算法的基础是问题解决方案可以通过基因编码:染色体由一系列基因组成,其中每个基因都编码一个人的一个特征(例如,眼睛的颜色,头发的颜色等)。 适应度函数可以获取此描述中包含的信息,即所谓的基因型,并评估所得表型的属性,即该遗传编码表示的实际解。 在表型上测量个体的适应性值。 + +对于我们的`cgi_decode()`示例,我们可以将单个字符视为基因,然后染色体是字符序列。 换句话说,到目前为止,我们已经使用了遗传编码! 但是,对于GA来说,代表所需要的操作与邻居的枚举不同。 + +遗传算法通过以下过程模拟自然进化: + +* 创建随机染色体的初始种群 +* 选择适合的个体进行繁殖 +* 通过选定个体的繁殖产生新的种群 +* 继续这样做,直到找到最佳解决方案或达到其他限制。 + +创建初始种群的第一步很简单: + +```py +def create_population(size): + return [random_unicode_string(10) for i in range(size)] + +``` + +```py +create_population(10) + +``` + +```py +['㛇莜戹豔㮝\ue008力ᒐᱯꊎ', + '\ue295쁉陵ꯃ赖蟽⍬꺲緥㲱', + '\u2e77騬⊳铁땕\uf189\ue663쌯幆艆', + '龚筓\uf3a9욀놷䓒隯迌쀐∑', + '쓛唁뗌蹽\udcd5偏躝娒鸭赌', + '蹤⪖ឺ웳ఫ䓻䤷溸ᰒﵘ', + '㲒혋Ꮘ\uea95\udf7b䢶裕㖬눹庑', + '\u2d9d鼓咝笩窻ꨔ铺扄\ueb57\uf1bf', + '\udd26Ч甄ꃢ\udcb0㼁튰㣋ช봼', + '닇軬欴鞛㈓Ẫ住畿ꔪ칀'] + +``` + +选择过程偏向于更健康的个体,因此我们需要确定人口中所有个体的适应度值。 由于我们将在算法中的多个位置需要每个人的适应度值,因此我们要通过使适应度成为*元组*的列表来存储它,每个元组都由一个人及其适应度值组成。 + +```py +def evaluate_population(population): + fitness = [get_fitness(x) for x in population] + return list(zip(population, fitness)) + +``` + +```py +population = create_population(10) + +``` + +```py +for (individual, fitness) in evaluate_population(population): + print("%s: %.4f" % (terminal_repr(individual), fitness)) + +``` + +```py +'\ue46fت팣㘇ธ漅ೇ↪䜭㎮': 2.9994 +'\ua7e9\ue9e0\ue7de턤댪囿厠‐\ue0c5ﴌ': 2.9999 +'䇯Ꜩ잣\ua9ce㙦\uf4aa歿蘸ཎ㫜': 2.9997 +'ⱳ콾哇\uef1f\uf6a8⾃䣖坤Ꮾ둰': 2.9998 +'າ伫螉\ue110㝎겱괼䆵喞\u18ac': 2.9997 +'ས婎쥤䇉韤\udd06䕮춵磒露': 2.9997 +'辺緢噑粲\uf400嚳寬\x87ꐂ쑹': 2.9899 +'뉫㻑\u1fd4㈖鬒樼\u0dcc朏\ue57eማ': 2.9997 +'얨㐁皭់멄\ud97b\ueac9㢂ቅ뮜': 2.9998 +'⒃⍜㈪㊷\udbdb乑蓍\udc48鱲뻜': 2.9999 + +``` + +在搜寻中使用适应性值通常是用“适者生存”来解释的,但达尔文对进化的主要见解之一是选择不仅取决于生存-个人通过性繁殖,而性选择描述了选择压力 在繁殖期间。 这种选择通常受以下两种情况之一的影响:竞争中的雄性为雌性而战,雄性(强力)获胜; 选择也受显示影响。 达尔文(Darwin)的例子就是孔雀:孔雀有长长而美丽的尾羽,似乎毫无用处,似乎也不支持自然选择的概念。 但是,豌豆的出现会影响其选择性伴侣的能力。 令人印象深刻的装饰品表明,男性在遗传上特别健康,并将导致健康的后代。 这在GA中得到了体现:一个人的适应度值越好,与另一个人交配的可能性就越大。 反映此概念的简单选择算法是*比赛选择*:少数随机选择的个人参加比赛,其中最好的被选中: + +```py +def selection(evaluated_population, tournament_size): + competition = random.sample(evaluated_population, tournament_size) + winner = min(competition, key=lambda individual: individual[1])[0] + + # Return a copy of the selected individual + return winner[:] + +``` + +`tournament_size`参数指定从总体中随机选择的个人中有多少人参加锦标赛。 这是一个重要的选择,因为它决定了*选择压力*:比赛规模越大,优秀个人被纳入比赛的可能性就越大。 反过来,这增加了这些非常好的个人支配下一代的可能性,从而降低了多样性并导致了过早的收敛。 相反,如果比赛的规模太小,那么这会阻碍比赛的进行。 锦标赛规模的最佳值取决于人口规模,但通常很小(例如5)。 让我们使用示例人群中的所有个体来运行一次锦标赛,以查看是否选择了最佳锦标赛: + +```py +population = create_population(10) +fitness = evaluate_population(population) +selected = selection(fitness, 10) + +``` + +```py +for (individual, fitness_value) in fitness: + print("%s: %.4f" % (terminal_repr(individual), fitness_value)) + +``` + +```py +'둚䘣蹸붢騒ꋎỺ觉\ued2a焊': 2.9999 +'닔㶐ꡡ\udca4贕굇᳆\ueccd윘赉': 2.9999 +'笁깉ရ豴\uea60ᛰ滒鶵)Ⰴ': 2.9998 +'㠒㵄\ue14cᤃᇚ\udebe\uf851쿛鏆闊': 2.9998 +'ࠝ\udd53ᶂ㮍訬廘랦铘뫘출': 2.9995 +'ꡩၔ玤姨乪药汏䗫汔悔': 2.9998 +'\uef2a潦ﳠ鹉卼㴐Ṭ\uf4b0˅얓': 2.9985 +'❱\u0ff7╇塐䲫琭煸ᮤឋ퇃': 2.9998 +'ڮ焈㱉煉ꅿᦗ툍혐خ꧓': 2.9994 +'ἂጋ\uddcc\ue3d7粖\ude2c⮌鮓讃\ueab6': 2.9998 + +``` + +```py +print("Winner: %s" % terminal_repr(selected)) + +``` + +```py +Winner: '\uef2a潦ﳠ鹉卼㴐Ṭ\uf4b0˅얓' + +``` + +就像在自然进化中一样,根据自己的健康状况选择的个体也可以繁殖,形成新一代。 在这种繁殖过程中,就像在自然繁殖过程中一样,所选亲本的遗传物质也会被合并。 这通常是通过称为 *crossover* 的过程完成的,其中后代染色体是由其父母的基因产生的。 在我们的例子中,一条染色体是一个字符序列,通过选择一个截止随机点,然后通过基于截止点组合父母染色体的两半来创建后代,可以简单地跨越两个父字符序列。 + +```py +def crossover(parent1, parent2): + pos = random.randint(1, len(parent1)) + + offspring1 = parent1[:pos] + parent2[pos:] + offspring2 = parent2[:pos] + parent1[pos:] + + return (offspring1, offspring2) + +``` + +```py +parent1 = "Hello World" +parent2 = "Goodbye Book" + +crossover(parent1, parent2) + +``` + +```py +('Hello W Book', 'Goodbyeorld') + +``` + +遗传进化的另一个重要组成部分是突变的概念:有时候,后代的基因会有细微的变化,代表着新的遗传物质和新的生理特性。 如果突变引入了代表有用特性的新遗传物质,从而导致了更好的适应性值,那么该遗传物质将生存。 如果该突变引入了无用的遗传物质,那么产生的个体将很可能具有不良适应性值并迅速死亡。 + +一个重要方面是,突变和交叉都是概率行为。 它们并不总是会发生,并且每次发生时其影响都是不同的。 对于序列遗传编码,一种常见的方法是首先使用概率来决定是否应用突变,然后选择一个基因并对其稍加更改。 或者,我们可以概率性地突变基因,使得平均一个基因发生改变。 我们通过计算每个基因被突变为1 /(基因数量)的概率`P`来做到这一点。 然后,如果基因发生突变,我们不仅会用随机字符代替它,而且更有可能只有很小的变化。 这是通过以当前值作为平均值从高斯分布中采样来实现的。 我们任意使用100的标准偏差来使小的变化比大的变化更有可能。 + +```py +def mutate(chromosome): + mutated = chromosome[:] + P = 1.0 / len(mutated) + + for pos in range(len(mutated)): + if random.random() < P: + new_c = chr(int(random.gauss(ord(mutated[pos]), 100) % 65536)) + mutated = mutated[:pos] + new_c + mutated[pos + 1:] + return mutated + +``` + +现在,终于有了构成完整算法的所有要素: + +```py +def genetic_algorithm(): + # Generate and evaluate initial population + generation = 0 + population = create_population(100) + fitness = evaluate_population(population) + best = min(fitness, key=lambda item: item[1]) + best_individual = best[0] + best_fitness = best[1] + print("Best fitness of initial population: %s - %.10f" % + (terminal_repr(best_individual), best_fitness)) + logs = 0 + + # Stop when optimum found, or we run out of patience + while best_fitness > 0 and generation < 1000: + + # The next generation will have the same size as the current one + new_population = [] + while len(new_population) < len(population): + # Selection + offspring1 = selection(fitness, 10) + offspring2 = selection(fitness, 10) + + # Crossover + if random.random() < 0.7: + (offspring1, offspring2) = crossover(offspring1, offspring2) + + # Mutation + offspring1 = mutate(offspring1) + offspring2 = mutate(offspring2) + + new_population.append(offspring1) + new_population.append(offspring2) + + # Once full, the new population replaces the old one + generation += 1 + population = new_population + fitness = evaluate_population(population) + + best = min(fitness, key=lambda item: item[1]) + best_individual = best[0] + best_fitness = best[1] + if logs < LOG_VALUES: + print( + "Best fitness at generation %d: %s - %.8f" % + (generation, terminal_repr(best_individual), best_fitness)) + elif logs == LOG_VALUES: + print("...") + logs += 1 + + print( + "Best individual: %s, fitness %.10f" % + (terminal_repr(best_individual), best_fitness)) + +``` + +让我们看看这在我们的unicode示例中如何工作。 + +```py +genetic_algorithm() + +``` + +```py +Best fitness of initial population: '俴\x8a辰燄펧䬍缯檒㤢⦡' - 2.9901960784 +Best fitness at generation 1: 'ཬə쫯ὼ酟剺鬈{Ż\ue313' - 2.98850575 +Best fitness at generation 2: '俴\x82辰燄酟剺鬢\x1bŻ\ue313' - 2.90909091 +Best fitness at generation 3: 'ྂɵ쫕ὼ酟剺鬈%Ŧ\ue384' - 1.99610895 +Best fitness at generation 4: 'ྂɵ쬆ὼ酟剺鬈%ŋ\ue384' - 1.99565217 +Best fitness at generation 5: '俴ʐ쫕ἶ酟剺髺%¼\ue384' - 1.98850575 +Best fitness at generation 6: 'ྂɵ쫪ὼ酟剒鬈%\x9e\ue37f' - 1.98245614 +Best fitness at generation 7: '俴̗쪕ἶ酟剺髱%4\ue378' - 0.99998280 +Best fitness at generation 8: '侪\x86쪕ἶ酟剺髱%4\ue378' - 0.99998280 +Best fitness at generation 9: '俆ǫ쪸ἶ醿剺髱%4\ue2b5' - 0.99998274 +Best fitness at generation 10: '俆ǫ쪸ἶ釘剺髧%4\ue2b5' - 0.99998274 +Best fitness at generation 11: '俆ɫ쫕Ồ酟剺髱%4\ue256' - 0.99998271 +Best fitness at generation 12: '侪\x86쪕ἶ醿剺髱%4\ue1f9' - 0.99998268 +Best fitness at generation 13: '侪ï쪕ἶ醿剺髱%4\ue1f9' - 0.99998268 +Best fitness at generation 14: '俆\x86쪕ἶ醿剺髱%4\ue1f9' - 0.99998268 +Best fitness at generation 15: '俆Ǩ쪸ἂ醿剺髱%4\ue150' - 0.99998263 +Best fitness at generation 16: '俴ʓ쫕ớ鄞务髱%e\ue0f0' - 0.99998260 +Best fitness at generation 17: '侪ï쪵ớ酟刖髱%F\ue0a9' - 0.99998258 +Best fitness at generation 18: '佺ģ쪵ớ鄞劐髱%e\ue05c' - 0.99998256 +Best fitness at generation 19: '侪ï쪵ớ酟刖髱%e\ue05c' - 0.99998256 +Best fitness at generation 20: '侪ï쪵ί酃劐髝%e\ue00c' - 0.99998253 +... +Best individual: '予ß쥇᳗轐咆隭%2A', fitness 0.0000000000 + +``` + +## 经验教训 + +* 元启发式搜索问题由算法,表示形式和适应度函数组成。 +* 对于测试生成,适应度函数通常会估计执行到目标位置的距离。 为了确定该距离,我们使用仪器来计算测试执行期间的距离。 +* 当邻域定义良好且不太大时,像爬坡这样的本地搜索算法可以很好地工作。 +* 全局搜索算法(例如遗传算法)非常灵活,可以很好地扩展到更大的测试问题。 + +## 后续步骤 + +在本章中,我们介绍了相当简单的程序输入。 我们还可以应用相同的搜索算法来发展复杂的测试输入,尤其是语法输入的[。](EvoGrammarFuzzer.html) + +## 背景 + +\ todo {添加更多} + +搜索的目标通常与覆盖范围有关。 有关讨论,请参见[测试简介](Intro_Testing.html)中的书。 + +## 练习 + +\ todo {稍后会添加} \ No newline at end of file diff --git a/new/fuzzing-book-zh/13.md b/new/fuzzing-book-zh/13.md new file mode 100644 index 0000000000000000000000000000000000000000..b7cb9f6f34130c22861d1cadec431752dac7d756 --- /dev/null +++ b/new/fuzzing-book-zh/13.md @@ -0,0 +1,1918 @@ +# 变异分析 + +> 原文: [https://www.fuzzingbook.org/html/MutationAnalysis.html](https://www.fuzzingbook.org/html/MutationAnalysis.html) + +在有关的[一章中,我们展示了如何识别程序的哪些部分由程序执行,从而了解一组测试用例在覆盖程序结构方面的有效性。 但是,仅覆盖可能不是衡量测试有效性的最佳方法,因为无需检查结果是否正确,覆盖范围就可以很大。 在本章中,我们介绍了另一种评估测试套件有效性的方法:将*突变* – *人为错误* –注入代码后,我们检查测试套件是否可以检测到这些人为的 故障。 这个想法是,如果它无法检测到此类突变,那么它也会错过真正的错误。](Coverage.html) + +**前提条件** + +* 您需要对程序的执行方式有所了解。 +* 您应该已经阅读[关于覆盖](Coverage.html)的章节。 + +## 内容提要 + +要使用本章中提供的代码来[,请编写](Importing.html) + +```py +>>> from [fuzzingbook.MutationAnalysis](MutationAnalysis.html) import + +``` + +然后利用以下功能。 + +本章介绍在主题程序上运行*突变分析*的两种方法。 第一类`MuFunctionAnalyzer`针对各个功能。 给定一个函数`gcd`并评估两个测试用例,一个可以对测试用例进行突变分析,如下所示: + +```py +>>> for mutant in MuFunctionAnalyzer(gcd, log=True): +>>> with mutant: +>>> assert gcd(1, 0) == 1, "Minimal" +>>> assert gcd(0, 1) == 1, "Mirror" +>>> mutant.pm.score() +-> gcd_1 +<- gcd_1 + +-> gcd_2 +<- gcd_2 + +-> gcd_3 +<- gcd_3 + +-> gcd_4 +<- gcd_4 +Detected gcd_4 Minimal + +0.25 + +``` + +第二类`MuProgramAnalyzer`针对具有测试套件的独立程序。 给定一个程序`gcd`,其源代码在`gcd_src`中提供,而测试套件由`TestGCD`提供,则可以如下评估`TestGCD`的突变评分: + +```py +>>> class TestGCD(unittest.TestCase): +>>> def test_simple(self): +>>> assert cfg.gcd(1, 0) == 1 +>>> +>>> def test_mirror(self): +>>> assert cfg.gcd(0, 1) == 1 +>>> for mutant in MuProgramAnalyzer('gcd', gcd_src): +>>> mutant[test_module].runTest('TestGCD') +>>> mutant.pm.score() +====================================================================== +FAIL: test_simple (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_simple + assert cfg.gcd(1, 0) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_simple (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_simple + assert cfg.gcd(1, 0) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_simple (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_simple + assert cfg.gcd(1, 0) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_simple (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_simple + assert cfg.gcd(1, 0) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_simple (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_simple + assert cfg.gcd(1, 0) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_simple (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_simple + assert cfg.gcd(1, 0) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_simple (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_simple + assert cfg.gcd(1, 0) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) + +1.0 + +``` + +这样获得的突变评分比纯覆盖范围更好地指示了给定测试套件的质量。 + +## 为什么结构覆盖不足 + +[结构覆盖率](Coverage.html)措施的问题之一是,它无法检查测试套件生成的程序执行是否实际上*是正确的*。 也就是说,产生测试套件未注意到的错误输出的执行与产生正确覆盖率的执行的计数完全相同。 的确,如果删除典型测试用例中的断言,则新测试套件的覆盖范围不会改变,但是新测试套件的功能远不如原始测试套件有用。 例如,考虑以下“测试”: + +```py +def ineffective_test(): + execute_the_program_as_a_whole() + assert True + +``` + +无论`execute_the_program_as_a_whole()`做什么,这里的最终断言总是会通过。 好的,如果`execute_the_program_as_a_whole()`引发异常,则测试将失败,但是我们也可以解决该问题: + +```py +def ineffective_test(): + try: + execute_the_program_as_a_whole() + except: + pass + assert True + +``` + +但是,这些“测试”的问题在于`execute_the_program_as_a_whole()`可能实现100%的代码覆盖率(或任何其他结构覆盖率度量标准的100%)。 但是,这个100%的数字并不反映测试发现错误的能力,实际上是0%。 + +实际上,这不是最佳状态。 我们如何验证我们的测试确实有用? 一种选择(在有关覆盖率的章节中提供了提示)是将错误注入程序,并评估测试套件在捕获这些注入的错误方面的有效性。 但是,这带来了另一个问题。 我们如何首先产生这些错误? 开发人员对错误可能发生的位置以及产生的影响的先入之见可能会使任何手动工作都产生偏差。 此外,编写非常好的bug可能会花费大量时间,这是非常间接的好处。 因此,这样的解决方案是不够的。 + +## 通过突变分析[播种人工故障](#Seeding-Artificial-Faults-with-Mutation-Analysis) + +变异分析提供了另一种解决方案,用于评估测试套件的有效性。 突变分析的想法是将*人为错误*(称为*突变*)植入程序代码,并检查测试套件是否找到了它们。 例如,这种突变可以用`execute_the_program_as_a_whole()`中某处的`-`代替`+`。 当然,上述无效的测试不会检测到这一点,因为它们不会检查任何结果。 然而,有效的测试将; 假设测试在发现*人为*错误中越有效,则在发现*实际*错误中越有效。 + +变异分析的见解是从程序员的角度考虑错误插入的可能性。 如果假设程序中每个程序元素所收到的注意力足够相似,则可以进一步假定程序中的每个令牌都具有相似的被错误转录的可能性。 当然,程序员将纠正编译器(或其他静态分析工具)检测到的所有错误。 因此,与经过编译阶段之后的原始令牌不同的有效令牌集被认为是它的*突变*的可能集,它们表示程序中的*可能的错误*。 然后,通过测试套件检测(从而防止)此类突变的能力来对其进行判断。 在产生的所有*有效*突变体中检测到的此类突变体的比例作为突变得分。 在这一章中,我们将了解如何在Python程序中实现变异分析。 所获得的变异分数代表任何程序分析工具预防错误的能力,并且可以用于判断静态测试套件,测试生成器(例如模糊器)以及静态和符号执行框架。 + +考虑一个稍微不同的观点可能很直观。 测试套件是可以视为接受测试的程序作为其输入的程序。 评估此类程序(测试套件)的最佳方法是什么? 通过对输入程序应用小的变异,并验证所涉及的测试套件不会产生意外行为,我们实质上可以*对*进行模糊测试。 测试套件应该只允许原始版本通过。 因此,任何未被检测为有缺陷的突变体都表示测试套件中的错误。 + +## 示例的结构覆盖范围充分性 + +让我们介绍一个更详细的示例,以说明覆盖问题以及突变分析的工作原理。 下面的`triangle()`程序将边长为$ a $,$ b $和$ c $的三角形分类为适当的三角形类别。 我们要验证程序是否正常运行。 + +```py +def triangle(a, b, c): + if a == b: + if b == c: + return 'Equilateral' + else: + return 'Isosceles' + else: + if b == c: + return "Isosceles" + else: + if a == c: + return "Isosceles" + else: + return "Scalene" + +``` + +这里有一些测试用例,以确保程序正常运行。 + +```py +def strong_oracle(fn): + assert fn(1, 1, 1) == 'Equilateral' + + assert fn(1, 2, 1) == 'Isosceles' + assert fn(2, 2, 1) == 'Isosceles' + assert fn(1, 2, 2) == 'Isosceles' + + assert fn(1, 2, 3) == 'Scalene' + +``` + +运行它们实际上会使所有测试通过。 + +```py +strong_oracle(triangle) + +``` + +但是,只有当我们知道我们的测试有效时,“所有测试都通过”的声明才有价值。 我们的测试套件的功效是什么? 正如我们在关于的[一章中所看到的,可以使用结构性覆盖技术(例如语句覆盖)来获得测试用例有效性的度量。](Coverage.html) + +```py +import [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) + +``` + +```py +from [Coverage](Coverage.html) import Coverage + +``` + +```py +import [inspect](https://docs.python.org/3/library/inspect.html) + +``` + +我们添加了一个函数`show_coverage()`以可视化获得的覆盖范围。 + +```py +class Coverage(Coverage): + def show_coverage(self, fn): + src = inspect.getsource(fn) + name = fn.__name__ + covered = set([lineno for method, + lineno in self._trace if method == name]) + for i, s in enumerate(src.split('\n')): + print('%s %2d: %s' % ('#' if i + 1 in covered else ' ', i + 1, s)) + +``` + +```py +with Coverage() as cov: + strong_oracle(triangle) + +``` + +```py +cov.show_coverage(triangle) + +``` + +```py + 1: def triangle(a, b, c): +# 2: if a == b: +# 3: if b == c: +# 4: return 'Equilateral' + 5: else: +# 6: return 'Isosceles' + 7: else: +# 8: if b == c: +# 9: return "Isosceles" + 10: else: +# 11: if a == c: +# 12: return "Isosceles" + 13: else: +# 14: return "Scalene" + 15: + +``` + +我们的`strong_oracle()`似乎已充分涵盖了所有可能的条件。 也就是说,根据结构覆盖范围,我们的测试用例集相当不错。 但是,获得的报道能说明全部情况吗? 请考虑以下测试套件: + +```py +def weak_oracle(fn): + assert fn(1, 1, 1) == 'Equilateral' + + assert fn(1, 2, 1) != 'Equilateral' + assert fn(2, 2, 1) != 'Equilateral' + assert fn(1, 2, 2) != 'Equilateral' + + assert fn(1, 2, 3) != 'Equilateral' + +``` + +我们这里要检查的只是边不相等的三角形不是等边的。 获得了什么保障? + +```py +with Coverage() as cov: + weak_oracle(triangle) + +``` + +```py +cov.show_coverage(triangle) + +``` + +```py + 1: def triangle(a, b, c): +# 2: if a == b: +# 3: if b == c: +# 4: return 'Equilateral' + 5: else: +# 6: return 'Isosceles' + 7: else: +# 8: if b == c: +# 9: return "Isosceles" + 10: else: +# 11: if a == c: +# 12: return "Isosceles" + 13: else: +# 14: return "Scalene" + 15: + +``` + +实际上,覆盖范围似乎没有*任何*差异。 `weak_oracle()`获得的覆盖范围与`strong_oracle()`完全相同。 然而,片刻的反思应该使人相信`weak_oracle()`不如`strong_oracle()`有效。 但是,*的覆盖范围*无法区分这两个测试套件。 我们在覆盖范围上缺少什么? 这里的问题是覆盖范围无法评估我们断言的*质量*。 实际上,覆盖范围根本不关心断言。 但是,如上所述,断言是测试套件有效性的极其重要的部分。 因此,我们需要一种评估断言质量的方法。 + +## 注入人为故障 + +注意,在有关的[一章中,覆盖范围是*代理*的形式,表示测试套件可能会发现错误。 如果实际上试图评估测试套件发现错误的可能性怎么办? 我们所需要做的就是一次将一个错误注入程序,并计算测试套件检测到的此类错误的数量。 检测频率将为我们提供测试套件发现漏洞的实际可能性。 此技术称为*故障注入*。 这是*故障注入*的示例。](Coverage.html) + +```py +def triangle_m1(a, b, c): + if a == b: + if b == c: + return 'Equilateral' + else: + # return 'Isosceles' + return None # <-- injected fault + else: + if b == c: + return "Isosceles" + else: + if a == c: + return "Isosceles" + else: + return "Scalene" + +``` + +让我们看看我们的测试套件是否足以应付此故障。 我们首先检查`weak_oracle()`是否可以检测到此更改。 + +```py +from [ExpectError](ExpectError.html) import ExpectError + +``` + +```py +with ExpectError(): + weak_oracle(triangle_m1) + +``` + +`weak_oracle()`无法检测到任何更改。 那我们的`strong_oracle()`呢? + +```py +with ExpectError(): + strong_oracle(triangle_m1) + +``` + +```py +Traceback (most recent call last): + File "", line 2, in + strong_oracle(triangle_m1) + File "", line 5, in strong_oracle + assert fn(2, 2, 1) == 'Isosceles' +AssertionError (expected) + +``` + +我们的`strong_oracle()`能够检测到此故障,这证明`strong_oracle()`可能是更好的测试套件。 + +*故障注入*可以很好地衡量测试套件的有效性,前提是我们提供了可能的故障列表。 问题是收集这样的*无偏*故障集是相当昂贵的。 难以创建难以检测的良好故障,这是一个手动过程。 鉴于这是一个手动过程,因此所产生的错误将受到创建它的开发人员的先入为主的偏见。 即使存在此类经过策划的错误,它们也不大可能是详尽无遗的,并且可能会错过重要的错误类别以及程序的某些部分。 因此,*故障注入*不足以替代覆盖范围。 我们可以做得更好吗? + +变异分析提供了一组精选故障的替代方法。 关键的见解是,如果假设程序员理解所讨论的程序,则大多数错误很可能是小的转录错误(少量的令牌)。 编译器很可能会捕获其中的大多数错误。 因此,程序中的大多数残余故障可能是由于正确程序的程序结构中某些点上的小(单个令牌)变化(此特定假设称为*合格程序员假说*或*有限邻里假说*)。 由程序的多个更改组成的较大故障又如何呢? 此处的关键洞察力是,对于此类故障中的绝大部分,可以检测到隔离中的单个更改的测试用例很有可能检测到包含该故障的较大复合故障。 (此假设称为*耦合效应*。)我们如何在实践中使用这些假设? 这个想法是简单地生成程序的所有可能有效的*有效*变体,这些变体与原始版本之间的差别很小(例如单个令牌更改)(这种变体称为 *突变体*)。 接下来,将给定的测试套件应用于由此生成的每个变体。 据说测试套件检测到的任何突变体均已被测试套件杀死*。 测试套件的有效性由杀死的突变体与产生的有效突变体的比例确定。* + +接下来,我们实现一个简单的突变分析框架,并使用它来评估我们的测试套件。 + +## 突变Python代码 + +要处理Python程序,我们需要使用*抽象语法树*(AST)表示形式-这是内部表示形式,编译器和解释器在读取程序文本后便会进行处理。 + +简而言之,我们将程序转换为树,然后*更改此树的一部分*-例如,通过将`+`运算符更改为`-`或反之亦然,或将实际语句更改为`pass`语句 什么也没做。 然后可以进一步处理生成的变异树。 它可以传递给Python解释器以执行,或者我们可以*将其解析为文本形式。* + +我们首先导入AST操作模块。 + +```py +import [ast](https://docs.python.org/3/library/ast.html) +import [astor](https://docs.python.org/3/library/astor.html) +import [inspect](https://docs.python.org/3/library/inspect.html) + +``` + +我们可以使用`inspect.getsource()`获得Python函数的源代码。 (请注意,这不适用于其他笔记本中定义的功能。) + +```py +triangle_source = inspect.getsource(triangle) +triangle_source + +``` + +```py +'def triangle(a, b, c):\n if a == b:\n if b == c:\n return \'Equilateral\'\n else:\n return \'Isosceles\'\n else:\n if b == c:\n return "Isosceles"\n else:\n if a == c:\n return "Isosceles"\n else:\n return "Scalene"\n' + +``` + +为了以令人愉悦的形式查看这些内容,我们的函数`print_content(s, suffix)`格式化并突出显示了字符串`s`,就像它是一个以`suffix`结尾的文件一样。 因此,我们可以像查看Python文件一样查看(并突出显示)源: + +```py +from [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) import print_content + +``` + +```py +print_content(triangle_source, '.py') + +``` + +```py +def triangle(a, b, c): + if a == b: + if b == c: + return 'Equilateral' + else: + return 'Isosceles' + else: + if b == c: + return "Isosceles" + else: + if a == c: + return "Isosceles" + else: + return "Scalene" + +``` + +对此进行解析可以为我们提供抽象语法树(AST)-以树形式表示程序。 + +```py +triangle_ast = ast.parse(triangle_source) + +``` + +这个AST是什么样的? 辅助功能`astor.dump_tree()`(文本输出)和`showast.show_ast()`(带有 [showast](https://github.com/hchasestevens/show_ast) 的图形输出)使我们可以检查树的结构。 我们看到函数以带有名称和参数的`FunctionDef`开始,后跟一个主体,该主体是`Expr`类型(文档字符串),`Assign`类型(赋值),`While`类型的语句列表 环回自己的身体),最后`Return`。 + +```py +print(astor.dump_tree(triangle_ast)) + +``` + +```py +Module( + body=[ + FunctionDef(name='triangle', + args=arguments( + args=[arg(arg='a', annotation=None), arg(arg='b', annotation=None), arg(arg='c', annotation=None)], + vararg=None, + kwonlyargs=[], + kw_defaults=[], + kwarg=None, + defaults=[]), + body=[ + If(test=Compare(left=Name(id='a'), ops=[Eq], comparators=[Name(id='b')]), + body=[ + If(test=Compare(left=Name(id='b'), ops=[Eq], comparators=[Name(id='c')]), + body=[Return(value=Str(s='Equilateral'))], + orelse=[Return(value=Str(s='Isosceles'))])], + orelse=[ + If(test=Compare(left=Name(id='b'), ops=[Eq], comparators=[Name(id='c')]), + body=[Return(value=Str(s='Isosceles'))], + orelse=[ + If(test=Compare(left=Name(id='a'), ops=[Eq], comparators=[Name(id='c')]), + body=[Return(value=Str(s='Isosceles'))], + orelse=[Return(value=Str(s='Scalene'))])])])], + decorator_list=[], + returns=None)]) + +``` + +文字太多了吗? 这种图形表示可以使事情变得更简单。 + +```py +from [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) import rich_output + +``` + +```py +if rich_output(): + import [showast](https://docs.python.org/3/library/showast.html) + showast.show_ast(triangle_ast) + +``` + +%3 0 FunctionDef 1 "triangle" 0--1 2 arguments 0--2 9 If 0--9 3 arg 2--3 5 arg 2--5 7 arg 2--7 4 "a" 3--4 6 "b" 5--6 8 "c" 7--8 10 Compare 9--10 18 If 9--18 33 If 9--33 11 Name 10--11 14 Eq 10--14 15 Name 10--15 12 "a" 11--12 13 Load 11--13 16 "b" 15--16 17 Load 15--17 19 Compare 18--19 27 Return 18--27 30 Return 18--30 20 Name 19--20 23 Eq 19--23 24 Name 19--24 21 "b" 20--21 22 Load 20--22 25 "c" 24--25 26 Load 24--26 28 Str 27--28 29 "Equilateral" 28--29 31 Str 30--31 32 "Isosceles" 31--32 34 Compare 33--34 42 Return 33--42 45 If 33--45 35 Name 34--35 38 Eq 34--38 39 Name 34--39 36 "b" 35--36 37 Load 35--37 40 "c" 39--40 41 Load 39--41 43 Str 42--43 44 "Isosceles" 43--44 46 Compare 45--46 54 Return 45--54 57 Return 45--57 47 Name 46--47 50 Eq 46--50 51 Name 46--51 48 "a" 47--48 49 Load 47--49 52 "c" 51--52 53 Load 51--53 55 Str 54--55 56 "Isosceles" 55--56 58 Str 57--58 59 "Scalene" 58--59 + +函数`astor.to_source()`将这种树转换回更熟悉的文本Python代码表示形式。 + +```py +print_content(astor.to_source(triangle_ast), '.py') + +``` + +```py +def triangle(a, b, c): + if a == b: + if b == c: + return 'Equilateral' + else: + return 'Isosceles' + elif b == c: + return 'Isosceles' + elif a == c: + return 'Isosceles' + else: + return 'Scalene' + +``` + +## 一个简单的函数突变器 + +现在让我们去修改`triangle()`程序。 产生此程序的有效变异版本的一种简单方法是将其某些语句替换为`pass`。 + +`MuFunctionAnalyzer`是负责测试套件突变分析的主要类。 它接受要测试的功能。 使用上面讨论的功能,它将通过解析和解析一次给出的源代码标准化。 这是必需的,以确保原始和突变体之间的`diff`之后不会因空白注释等的差异而脱轨。 + +```py +class MuFunctionAnalyzer: + def __init__(self, fn, log=False): + self.fn = fn + self.name = fn.__name__ + src = inspect.getsource(fn) + self.ast = ast.parse(src) + self.src = astor.to_source(self.ast) # normalize + self.mutator = self.mutator_object() + self.nmutations = self.get_mutation_count() + self.un_detected = set() + self.mutants = [] + self.log = log + + def mutator_object(self, locations=None): + return StmtDeletionMutator(locations) + + def register(self, m): + self.mutants.append(m) + + def finish(self): + pass + +``` + +`get_mutation_count()`获取可用的可能突变数。 稍后我们将看到如何实现。 + +```py +class MuFunctionAnalyzer(MuFunctionAnalyzer): + def get_mutation_count(self): + self.mutator.visit(self.ast) + return self.mutator.count + +``` + +`Mutator`提供了实现单个突变的基类。 它接受要突变的位置列表。 假定方法`mutable_visit()`在子类确定的所有感兴趣的节点上被调用。 当调用`Mutator`而没有要突变的位置列表时,它仅循环遍历所有可能的突变点,并在`self.count`中保留计数。 如果使用要突变的特定位置列表调用它,则`mutable_visit()`方法将调用`mutation_visit()`,该节点将在节点上执行突变。 请注意,单个位置可以产生多个突变。 (因此,哈希图)。 + +```py +class Mutator(ast.NodeTransformer): + def __init__(self, mutate_location=-1): + self.count = 0 + self.mutate_location = mutate_location + + def mutable_visit(self, node): + self.count += 1 # statements start at line no 1 + if self.count == self.mutate_location: + return self.mutation_visit(node) + return self.generic_visit(node) + +``` + +`StmtDeletionMutator`只是挂接到所有处理语句的访问者中。 它通过将给定的语句替换为`pass`来执行变异。 如您所见,它访问各种语句。 + +```py +class StmtDeletionMutator(Mutator): + def visit_Return(self, node): return self.mutable_visit(node) + def visit_Delete(self, node): return self.mutable_visit(node) + + def visit_Assign(self, node): return self.mutable_visit(node) + def visit_AnnAssign(self, node): return self.mutable_visit(node) + def visit_AugAssign(self, node): return self.mutable_visit(node) + + def visit_Raise(self, node): return self.mutable_visit(node) + def visit_Assert(self, node): return self.mutable_visit(node) + + def visit_Global(self, node): return self.mutable_visit(node) + def visit_Nonlocal(self, node): return self.mutable_visit(node) + + def visit_Expr(self, node): return self.mutable_visit(node) + + def visit_Pass(self, node): return self.mutable_visit(node) + def visit_Break(self, node): return self.mutable_visit(node) + def visit_Continue(self, node): return self.mutable_visit(node) + +``` + +实际的突变包括用`pass`语句替换节点: + +```py +class StmtDeletionMutator(StmtDeletionMutator): + def mutation_visit(self, node): return ast.Pass() + +``` + +对于`triangle()`,此访问者产生五个突变-即用`pass`替换五个`return`语句: + +```py +MuFunctionAnalyzer(triangle).nmutations + +``` + +```py +5 + +``` + +我们需要一种获得单个突变体的方法。 为此,我们将`MuFunctionAnalyzer`转换为*可迭代的*。 + +```py +class MuFunctionAnalyzer(MuFunctionAnalyzer): + def __iter__(self): + return PMIterator(self) + +``` + +`PMIterator`定义为`MuFunctionAnalyzer`的*迭代器*类。 + +```py +class PMIterator: + def __init__(self, pm): + self.pm = pm + self.idx = 0 + +``` + +`next()`方法返回相应的`Mutant`: + +```py +class PMIterator(PMIterator): + def __next__(self): + i = self.idx + if i >= self.pm.nmutations: + self.pm.finish() + raise StopIteration() + self.idx += 1 + mutant = Mutant(self.pm, self.idx, log=self.pm.log) + self.pm.register(mutant) + return mutant + +``` + +`Mutant`类包含用于在给定要突变的位置时生成突变体的逻辑。 + +```py +class Mutant: + def __init__(self, pm, location, log=False): + self.pm = pm + self.i = location + self.name = "%s_%s" % (self.pm.name, self.i) + self._src = None + self.tests = [] + self.detected = False + self.log = log + +``` + +使用方法如下: + +```py +for m in MuFunctionAnalyzer(triangle): + print(m.name) + +``` + +```py +triangle_1 +triangle_2 +triangle_3 +triangle_4 +triangle_5 + +``` + +这些名称还有些通用。 让我们看看是否可以对产生的突变有更多的了解。 + +`generate_mutant()`只需调用`mutator()`方法,并向mutator传递AST的副本。 + +```py +class Mutant(Mutant): + def generate_mutant(self, location): + mutant_ast = self.pm.mutator_object( + location).visit(ast.parse(self.pm.src)) # copy + return astor.to_source(mutant_ast) + +``` + +`src()`方法返回变异的源。 + +```py +class Mutant(Mutant): + def src(self): + if self._src is None: + self._src = self.generate_mutant(self.i) + return self._src + +``` + +这是获取突变体并显示与原始突变的区别的方式: + +```py +import [difflib](https://docs.python.org/3/library/difflib.html) + +``` + +```py +for mutant in MuFunctionAnalyzer(triangle): + shape_src = mutant.pm.src + for line in difflib.unified_diff(mutant.pm.src.split('\n'), + mutant.src().split('\n'), + fromfile=mutant.pm.name, + tofile=mutant.name, n=3): + print(line) + +``` + +```py +--- triangle + ++++ triangle_1 + +@@ -1,7 +1,7 @@ + + def triangle(a, b, c): + if a == b: + if b == c: +- return 'Equilateral' ++ pass + else: + return 'Isosceles' + elif b == c: +--- triangle + ++++ triangle_2 + +@@ -3,7 +3,7 @@ + + if b == c: + return 'Equilateral' + else: +- return 'Isosceles' ++ pass + elif b == c: + return 'Isosceles' + elif a == c: +--- triangle + ++++ triangle_3 + +@@ -5,7 +5,7 @@ + + else: + return 'Isosceles' + elif b == c: +- return 'Isosceles' ++ pass + elif a == c: + return 'Isosceles' + else: +--- triangle + ++++ triangle_4 + +@@ -7,7 +7,7 @@ + + elif b == c: + return 'Isosceles' + elif a == c: +- return 'Isosceles' ++ pass + else: + return 'Scalene' + +--- triangle + ++++ triangle_5 + +@@ -9,5 +9,5 @@ + + elif a == c: + return 'Isosceles' + else: +- return 'Scalene' ++ pass + +``` + +在此`diff`输出中,添加以`+`前缀的行,而以`-`前缀的行被删除。 我们看到五个突变体的每一个确实用`pass`语句替换了return语句。 + +我们将`diff()`方法添加到`Mutant`,以便可以直接调用它。 + +```py +class Mutant(Mutant): + def diff(self): + return '\n'.join(difflib.unified_diff(self.pm.src.split('\n'), + self.src().split('\n'), + fromfile='original', + tofile='mutant', + n=3)) + +``` + +## 评估突变 + +我们现在准备实施实际评估。 我们将变量定义为*上下文管理器*,它可以验证给定的所有断言是否成功。 这个想法是我们可以编写如下代码 + +```py +for mutant in MuFunctionAnalyzer(function): + with mutant: + assert function(x) == y + +``` + +当`mutant`处于活动状态时(即`with:`下的代码块),原始功能被替换为替换功能。 + +输入`with`块时,将调用`__enter__()`功能。 它将突变体创建为Python函数并将其放置在全局名称空间中,以使`assert`语句执行变异函数而不是原始函数。 + +```py +class Mutant(Mutant): + def __enter__(self): + if self.log: + print('->\t%s' % self.name) + c = compile(self.src(), '', 'exec') + eval(c, globals()) + +``` + +`__exit__()`函数检查是否发生了异常(即断言失败或引发了其他错误); 如果是这样,则将其标记为`detected`。 最后,它将恢复原始函数定义。 + +```py +class Mutant(Mutant): + def __exit__(self, exc_type, exc_value, traceback): + if self.log: + print('<-\t%s' % self.name) + if exc_type is not None: + self.detected = True + if self.log: + print("Detected %s" % self.name, exc_type, exc_value) + globals()[self.pm.name] = self.pm.fn + if self.log: + print() + return True + +``` + +`finish()`方法仅在突变体上调用该方法,检查是否发现了该突变体,然后返回结果。 + +```py +from [ExpectError](ExpectError.html) import ExpectTimeout + +``` + +```py +class MuFunctionAnalyzer(MuFunctionAnalyzer): + def finish(self): + self.un_detected = { + mutant for mutant in self.mutants if not mutant.detected} + +``` + +突变分数-由测试套件检测到的突变体比率-由`score()`计算。 分数为1.0表示发现了所有突变体。 得分为0.1表示仅检测到10%的突变体。 + +```py +class MuFunctionAnalyzer(MuFunctionAnalyzer): + def score(self): + return (self.nmutations - len(self.un_detected)) / self.nmutations + +``` + +这是我们如何使用我们的框架。 + +```py +import [sys](https://docs.python.org/3/library/sys.html) + +``` + +```py +for mutant in MuFunctionAnalyzer(triangle, log=True): + with mutant: + assert triangle(1, 1, 1) == 'Equilateral', "Equal Check1" + assert triangle(1, 0, 1) != 'Equilateral', "Equal Check2" + assert triangle(1, 0, 2) != 'Equilateral', "Equal Check3" +mutant.pm.score() + +``` + +```py +-> triangle_1 +<- triangle_1 +Detected triangle_1 Equal Check1 + +-> triangle_2 +<- triangle_2 + +-> triangle_3 +<- triangle_3 + +-> triangle_4 +<- triangle_4 + +-> triangle_5 +<- triangle_5 + +``` + +```py +0.2 + +``` + +五分之二的突变中只有一个导致断言失败。 因此,`weak_oracle()`测试套件的突变得分为20%。 + +```py +for mutant in MuFunctionAnalyzer(triangle): + with mutant: + weak_oracle(triangle) +mutant.pm.score() + +``` + +```py +0.2 + +``` + +由于我们正在修改全局名称空间,因此我们不必直接在mutant的for循环内引用该函数。 + +```py +def oracle(): + strong_oracle(triangle) + +``` + +```py +for mutant in MuFunctionAnalyzer(triangle, log=True): + with mutant: + oracle() +mutant.pm.score() + +``` + +```py +-> triangle_1 +<- triangle_1 +Detected triangle_1 + +-> triangle_2 +<- triangle_2 +Detected triangle_2 + +-> triangle_3 +<- triangle_3 +Detected triangle_3 + +-> triangle_4 +<- triangle_4 +Detected triangle_4 + +-> triangle_5 +<- triangle_5 +Detected triangle_5 + +``` + +```py +1.0 + +``` + +也就是说,我们可以通过`strong_oracle()`测试套件获得`100%`突变评分。 + +这是另一个例子。 `gcd()`计算两个数字的最大公约数。 + +```py +def gcd(a, b): + if a < b: + c = a + a = b + b = c + + while b != 0: + c = a + a = b + b = c % b + return a + +``` + +这是一个测试。 效果如何? + +```py +for mutant in MuFunctionAnalyzer(gcd, log=True): + with mutant: + assert gcd(1, 0) == 1, "Minimal" + assert gcd(0, 1) == 1, "Mirror" +mutant.pm.score() + +``` + +```py +-> gcd_1 +<- gcd_1 +Detected gcd_1 local variable 'c' referenced before assignment + +-> gcd_2 +<- gcd_2 +Detected gcd_2 Mirror + +-> gcd_3 +<- gcd_3 + +-> gcd_4 +<- gcd_4 + +-> gcd_5 +<- gcd_5 + +-> gcd_6 +<- gcd_6 + +-> gcd_7 +<- gcd_7 +Detected gcd_7 Minimal + +``` + +```py +0.42857142857142855 + +``` + +我们看到,我们的`TestGCD`测试套件能够获得42%的突变评分。 + +## 模块和测试套件的变量 + +考虑我们前面讨论的`triangle()`程序。 正如我们所讨论的,产生此程序的有效变异版本的一种简单方法是将其某些语句替换为`pass`。 + +出于演示目的,我们希望程序看起来像在另一个文件中一样。 我们可以通过在Python中生成`Module`对象并将函数附加到该对象来实现。 + +```py +import [imp](https://docs.python.org/3/library/imp.html) + +``` + +```py +def import_code(code, name): + module = imp.new_module(name) + exec(code, module.__dict__) + return module + +``` + +我们将`triangle()`功能附加到`shape`模块。 + +```py +shape = import_code(shape_src, 'shape') + +``` + +现在我们可以通过模块`shape`调用三角形。 + +```py +shape.triangle(1, 1, 1) + +``` + +```py +'Equilateral' + +``` + +我们要测试`triangle()`功能。 为此,我们定义了一个`StrongShapeTest`类,如下所示。 + +```py +import [unittest](https://docs.python.org/3/library/unittest.html) + +``` + +```py +class StrongShapeTest(unittest.TestCase): + + def test_equilateral(self): + assert shape.triangle(1, 1, 1) == 'Equilateral' + + def test_isosceles(self): + assert shape.triangle(1, 2, 1) == 'Isosceles' + assert shape.triangle(2, 2, 1) == 'Isosceles' + assert shape.triangle(1, 2, 2) == 'Isosceles' + + def test_scalene(self): + assert shape.triangle(1, 2, 3) == 'Scalene' + +``` + +我们定义了一个帮助程序功能`suite()`,它可以查看给定的类并标识测试功能。 + +```py +def suite(test_class): + suite = unittest.TestSuite() + for f in test_class.__dict__: + if f.startswith('test_'): + suite.addTest(test_class(f)) + return suite + +``` + +可以使用不同的测试运行程序调用`TestTriangle`类中的测试。 最简单的方法是直接调用`TestCase`的`run()`方法。 + +```py +suite(StrongShapeTest).run(unittest.TestResult()) + +``` + +```py + + +``` + +`TextTestRunner`类提供了控制执行的详细程度的能力。 它还允许在第一个*故障时返回*。** + +```py +runner = unittest.TextTestRunner(verbosity=0, failfast=True) +runner.run(suite(StrongShapeTest)) + +``` + +```py +---------------------------------------------------------------------- +Ran 3 tests in 0.000s + +OK + +``` + +```py + + +``` + +在覆盖范围内运行该程序的操作如下: + +```py +with Coverage() as cov: + suite(StrongShapeTest).run(unittest.TestResult()) + +``` + +获得的覆盖范围如下: + +```py +cov.show_coverage(triangle) + +``` + +```py + 1: def triangle(a, b, c): +# 2: if a == b: +# 3: if b == c: +# 4: return 'Equilateral' + 5: else: +# 6: return 'Isosceles' +# 7: else: +# 8: if b == c: +# 9: return "Isosceles" +# 10: else: + 11: if a == c: +# 12: return "Isosceles" + 13: else: + 14: return "Scalene" + 15: + +``` + +```py +class WeakShapeTest(unittest.TestCase): + def test_equilateral(self): + assert shape.triangle(1, 1, 1) == 'Equilateral' + + def test_isosceles(self): + assert shape.triangle(1, 2, 1) != 'Equilateral' + assert shape.triangle(2, 2, 1) != 'Equilateral' + assert shape.triangle(1, 2, 2) != 'Equilateral' + + def test_scalene(self): + assert shape.triangle(1, 2, 3) != 'Equilateral' + +``` + +它获得多少覆盖率? + +```py +with Coverage() as cov: + suite(WeakShapeTest).run(unittest.TestResult()) + +``` + +```py +cov.show_coverage(triangle) + +``` + +```py + 1: def triangle(a, b, c): +# 2: if a == b: +# 3: if b == c: +# 4: return 'Equilateral' + 5: else: +# 6: return 'Isosceles' +# 7: else: +# 8: if b == c: +# 9: return "Isosceles" +# 10: else: + 11: if a == c: +# 12: return "Isosceles" + 13: else: + 14: return "Scalene" + 15: + +``` + +`MuProgramAnalyzer`是负责测试套件突变分析的主要类。 它接受要测试的模块的名称及其源代码。 它通过解析和解析一次来标准化源代码。 这是必需的,以确保原始和突变体之间的`diff`之后不会因空白注释等的差异而脱轨。 + +```py +class MuProgramAnalyzer(MuFunctionAnalyzer): + def __init__(self, name, src): + self.name = name + self.ast = ast.parse(src) + self.src = astor.to_source(self.ast) + self.changes = [] + self.mutator = self.mutator_object() + self.nmutations = self.get_mutation_count() + self.un_detected = set() + + def mutator_object(self, locations=None): + return AdvStmtDeletionMutator(self, locations) + +``` + +The `Mutator` provides the base class for implementing individual mutations. It accepts a list of locations to mutate. It assumes that the method `mutable_visit()` is invoked on all nodes of interest as determined by the subclass. When the `Mutator` is invoked without a list of locations to mutate, it simply loops through all possible mutation points and retains a count in `self.count`. If it is invoked with a specific list of locations to mutate, the `mutable_visit()` method calls the `mutation_visit()` which performs the mutation on the node. Note that a single location can produce multiple mutations. (Hence the hashmap). + +```py +class AdvMutator(Mutator): + def __init__(self, analyzer, mutate_locations=None): + self.count = 0 + self.mutate_locations = [] if mutate_locations is None else mutate_locations + self.pm = analyzer + + def mutable_visit(self, node): + self.count += 1 # statements start at line no 1 + return self.mutation_visit(node) + +``` + +`AdvStmtDeletionMutator`只是挂接到所有处理语句的访问者中。 它通过将给定的语句替换为`pass`来执行变异。 + +```py +class AdvStmtDeletionMutator(AdvMutator, StmtDeletionMutator): + def __init__(self, analyzer, mutate_locations=None): + AdvMutator.__init__(self, analyzer, mutate_locations) + + def mutation_visit(self, node): + index = 0 # there is only one way to delete a statement -- replace it by pass + if not self.mutate_locations: # counting pass + self.pm.changes.append((self.count, index)) + return self.generic_visit(node) + else: + # get matching changes for this pass + mutating_lines = set((count, idx) + for (count, idx) in self.mutate_locations) + if (self.count, index) in mutating_lines: + return ast.Pass() + else: + return self.generic_visit(node) + +``` + +Aagin,我们可以如下获得`triangle()`产生的突变数。 + +```py +MuProgramAnalyzer('shape', shape_src).nmutations + +``` + +```py +5 + +``` + +我们需要一种获得单个突变体的方法。 为此,我们将`MuProgramAnalyzer`转换为*可迭代的*。 + +```py +class MuProgramAnalyzer(MuProgramAnalyzer): + def __iter__(self): + return AdvPMIterator(self) + +``` + +`AdvPMIterator`定义为`MuProgramAnalyzer`的*迭代器*类。 + +```py +class AdvPMIterator: + def __init__(self, pm): + self.pm = pm + self.idx = 0 + +``` + +`next()`方法返回相应的`Mutant` + +```py +class AdvPMIterator(AdvPMIterator): + def __next__(self): + i = self.idx + if i >= len(self.pm.changes): + raise StopIteration() + self.idx += 1 + # there could be multiple changes in one mutant + return AdvMutant(self.pm, [self.pm.changes[i]]) + +``` + +The `Mutant` class contains logic for generating mutants when given the locations to mutate. + +```py +class AdvMutant(Mutant): + def __init__(self, pm, locations): + self.pm = pm + self.i = locations + self.name = "%s_%s" % (self.pm.name, + '_'.join([str(i) for i in self.i])) + self._src = None + +``` + +Here is how it can be used: + +```py +shape_src = inspect.getsource(triangle) + +``` + +```py +for m in MuProgramAnalyzer('shape', shape_src): + print(m.name) + +``` + +```py +shape_(1, 0) +shape_(2, 0) +shape_(3, 0) +shape_(4, 0) +shape_(5, 0) + +``` + +The `generate_mutant()` simply calls the `mutator()` method, and passes the mutator a copy of the AST. + +```py +class AdvMutant(AdvMutant): + def generate_mutant(self, locations): + mutant_ast = self.pm.mutator_object( + locations).visit(ast.parse(self.pm.src)) # copy + return astor.to_source(mutant_ast) + +``` + +The `src()` method returns the mutated source. + +```py +class AdvMutant(AdvMutant): + def src(self): + if self._src is None: + self._src = self.generate_mutant(self.i) + return self._src + +``` + +同样,我们将突变体可视化为与原始突变体的区别: + +```py +import [difflib](https://docs.python.org/3/library/difflib.html) + +``` + +We add the `diff()` method to `Mutant` so that it can be called directly. + +```py +class AdvMutant(AdvMutant): + def diff(self): + return '\n'.join(difflib.unified_diff(self.pm.src.split('\n'), + self.src().split('\n'), + fromfile='original', + tofile='mutant', + n=3)) + +``` + +```py +for mutant in MuProgramAnalyzer('shape', shape_src): + print(mutant.name) + print(mutant.diff()) + break + +``` + +```py +shape_(1, 0) +--- original + ++++ mutant + +@@ -1,7 +1,7 @@ + + def triangle(a, b, c): + if a == b: + if b == c: +- return 'Equilateral' ++ pass + else: + return 'Isosceles' + elif b == c: + +``` + +我们现在准备实施实际评估。 为此,我们需要能够接受定义了测试套件的模块,并在其上调用测试方法。 方法`getitem`接受测试模块,将测试模块上的导入条目固定为正确指向变异模块,然后将其传递给测试运行器`MutantTestRunner`。 + +```py +class AdvMutant(AdvMutant): + def __getitem__(self, test_module): + test_module.__dict__[ + self.pm.name] = import_code( + self.src(), self.pm.name) + return MutantTestRunner(self, test_module) + +``` + +`MutantTestRunner`只需调用测试模块上的所有`test_`方法,检查是否发现了突变体,然后返回结果。 + +```py +from [ExpectError](ExpectError.html) import ExpectTimeout + +``` + +```py +class MutantTestRunner: + def __init__(self, mutant, test_module): + self.mutant = mutant + self.tm = test_module + + def runTest(self, tc): + suite = unittest.TestSuite() + test_class = self.tm.__dict__[tc] + for f in test_class.__dict__: + if f.startswith('test_'): + suite.addTest(test_class(f)) + runner = unittest.TextTestRunner(verbosity=0, failfast=True) + try: + with ExpectTimeout(1): + res = runner.run(suite) + if res.wasSuccessful(): + self.mutant.pm.un_detected.add(self) + return res + except SyntaxError: + print('Syntax Error (%s)' % self.mutant.name) + return None + raise Exception('Unhandled exception during test execution') + +``` + +突变得分通过`score()`计算。 + +```py +class MuProgramAnalyzer(MuProgramAnalyzer): + def score(self): + return (self.nmutations - len(self.un_detected)) / self.nmutations + +``` + +Here is how we use our framework. + +```py +import [sys](https://docs.python.org/3/library/sys.html) + +``` + +```py +test_module = sys.modules[__name__] +for mutant in MuProgramAnalyzer('shape', shape_src): + mutant[test_module].runTest('WeakShapeTest') +mutant.pm.score() + +``` + +```py +====================================================================== +FAIL: test_equilateral (__main__.WeakShapeTest) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_equilateral + assert shape.triangle(1, 1, 1) == 'Equilateral' +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) +---------------------------------------------------------------------- +Ran 3 tests in 0.001s + +OK +---------------------------------------------------------------------- +Ran 3 tests in 0.001s + +OK +---------------------------------------------------------------------- +Ran 3 tests in 0.001s + +OK +---------------------------------------------------------------------- +Ran 3 tests in 0.001s + +OK + +``` + +```py +0.2 + +``` + +`WeakShape`测试套件仅导致`20%`突变评分。 + +```py +for mutant in MuProgramAnalyzer('shape', shape_src): + mutant[test_module].runTest('StrongShapeTest') +mutant.pm.score() + +``` + +```py +====================================================================== +FAIL: test_equilateral (__main__.StrongShapeTest) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 4, in test_equilateral + assert shape.triangle(1, 1, 1) == 'Equilateral' +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_isosceles (__main__.StrongShapeTest) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 8, in test_isosceles + assert shape.triangle(2, 2, 1) == 'Isosceles' +AssertionError + +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_isosceles (__main__.StrongShapeTest) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 9, in test_isosceles + assert shape.triangle(1, 2, 2) == 'Isosceles' +AssertionError + +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_isosceles (__main__.StrongShapeTest) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 7, in test_isosceles + assert shape.triangle(1, 2, 1) == 'Isosceles' +AssertionError + +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +FAILED (failures=1) +====================================================================== +FAIL: test_scalene (__main__.StrongShapeTest) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 12, in test_scalene + assert shape.triangle(1, 2, 3) == 'Scalene' +AssertionError + +---------------------------------------------------------------------- +Ran 3 tests in 0.001s + +FAILED (failures=1) + +``` + +```py +1.0 + +``` + +另一方面,我们可以通过`StrongShapeTest`测试套件获得`100%`突变评分。 + +这是另一个示例`gcd()`。 + +```py +gcd_src = inspect.getsource(gcd) + +``` + +```py +class TestGCD(unittest.TestCase): + def test_simple(self): + assert cfg.gcd(1, 0) == 1 + + def test_mirror(self): + assert cfg.gcd(0, 1) == 1 + +``` + +```py +for mutant in MuProgramAnalyzer('cfg', gcd_src): + mutant[test_module].runTest('TestGCD') +mutant.pm.score() + +``` + +```py +====================================================================== +ERROR: test_mirror (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 6, in test_mirror + assert cfg.gcd(0, 1) == 1 + File "", line 5, in gcd +UnboundLocalError: local variable 'c' referenced before assignment + +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +FAILED (errors=1) +====================================================================== +FAIL: test_mirror (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 6, in test_mirror + assert cfg.gcd(0, 1) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +FAILED (failures=1) +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +OK +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +OK +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +OK +---------------------------------------------------------------------- +Ran 2 tests in 0.001s + +OK +====================================================================== +FAIL: test_simple (__main__.TestGCD) +---------------------------------------------------------------------- +Traceback (most recent call last): + File "", line 3, in test_simple + assert cfg.gcd(1, 0) == 1 +AssertionError + +---------------------------------------------------------------------- +Ran 1 test in 0.001s + +FAILED (failures=1) + +``` + +```py +0.42857142857142855 + +``` + +我们看到我们的`TestGCD`测试套件能够获得`42%`突变得分。 + +## 等价突变体[的问题](#The-Problem-of--Equivalent-Mutants) + +突变分析的问题之一是,并非所有产生的突变体都必须是有缺陷的。 例如,考虑下面的`new_gcd()`程序。 + +```py +def new_gcd(a, b): + if a < b: + a, b = b, a + else: + a, b = a, b + + while b != 0: + a, b = b, a % b + return a + +``` + +可以对该程序进行突变以产生以下突变体。 + +```py +def gcd(a, b): + if a < b: + a, b = b, a + else: + pass + + while b != 0: + a, b = b, a % b + return a + +``` + +```py +for i, mutant in enumerate(MuFunctionAnalyzer(new_gcd)): + print(i,mutant.src()) + +``` + +```py +0 def new_gcd(a, b): + if a < b: + pass + else: + a, b = a, b + while b != 0: + a, b = b, a % b + return a + +1 def new_gcd(a, b): + if a < b: + a, b = b, a + else: + pass + while b != 0: + a, b = b, a % b + return a + +2 def new_gcd(a, b): + if a < b: + a, b = b, a + else: + a, b = a, b + while b != 0: + pass + return a + +3 def new_gcd(a, b): + if a < b: + a, b = b, a + else: + a, b = a, b + while b != 0: + a, b = b, a % b + pass + +``` + +尽管其他突变体与原始变异体相比有缺陷,但是`mutant 1`在语义上与原始变异没有区别,因为它删除了无关紧要的分配。 这表示`mutant 1`不代表故障。 这些不代表故障的突变体称为*等效突变体*。 等效突变体的问题在于,在存在等效突变体的情况下,很难判断突变得分。 例如,突变分数为70%时,0%至30%的突变体可能是等效的。 因此,在不知道等效突变体的实际数目的情况下,不可能判断测试可以提高多少。 我们讨论了两种处理等效突变体的方法。 + +### 等价突变体数量的统计估计 + +如果活着的突变体的数量足够少,则可以依靠简单地手动检查它们。 但是,如果突变体的数量足够大(例如> 1000),则可以从存活的突变体中随机选择较少数量的突变体,然后手动评估它们是否代表缺陷。 样本大小的确定由以下公式控制,该公式用于二项式分布(近似于正态分布): + +$$ n \ ge \ hat {p}(1- \ hat {p})\ bigg(\ frac {Z _ {\ frac {\ alpha} {2}}} {\ Delta} \ bigg)^ 2 $$ + +其中,$ n $是样本数,$ p $是概率分布的参数,$ \ alpha $是所需的精度,$ \ Delta $是精度。 对于$ 95 \%$的准确性,$ Z_ {0.95} = 1.96 $。 我们有以下值($ \ hat {p}(1- \ hat {p})的最大值= 0.25 $),而$ Z $是正态分布的临界值: + +$$ n \ ge 0.25 \ bigg(\ frac {1.96} {\ Delta} \ bigg)^ 2 $$ + +对于$ Delta = 0.01 $,(最大误差为1%),我们需要评估$ 9604 $突变体的等效性。 如果将约束放宽到$ \ Delta = 0.1 $(这是$ 10 \%$的误差),则只需要评估$ 96 $突变体的等效性即可。 + +### 统计量估计由不朽的估计 + +尽管仅采样有限数量的突变体的想法很吸引人,但它仍然受到限制,因为必须进行手动分析。 如果计算能力很便宜,另一种估算真实突变体数量(以及等效突变体数量)的方法是使用Chao的估算器。 正如我们将在[一章中看到的何时停止模糊](WhenToStopFuzzing.html)的公式一样,公式为: + +$$ \ hat S_ \ text {Chao1} = \ begin {cases} S(n)+ \ frac {f_1 ^ 2} {2f_2} & \ text {if $ f_2 > 0 $} \\ S( n)+ \ frac {f_1(f_1-1)} {2} & \ text {否则} \ end {cases} $$ + +基本思想是针对每个突变体计算每个测试的完整测试矩阵$ T \ M $的结果。 变量$ f_1 $代表被精确杀死一次的突变体的数量,变量$ f_2 $代表被精确杀死两次的变量的数量。 $ S(n)$是被杀死的突变体总数。 在这里,$ \ hat {S} _ {Chao1} $提供了对突变体真实数量的估计。 如果$ M $是生成的总突变体,则$ M-\ hat {S} _ {Chao1} $表示**不朽**突变体的数量。 请注意,这些**不朽**突变体与传统的等效突变体有些不同,因为**死亡率**取决于用于区分变体行为的预言。 也就是说,如果使用依赖于抛出的错误来检测杀戮的模糊器,它将不会检测到产生不同输出但不会抛出错误的突变体。 因此, *Chao1* 估计值将实质上是模糊器可以检测到的突变体的渐近线值,如果该突变体被赋予了无限的时间。 当使用的预言家足够强大时,**不朽的**突变体估算值将接近真实的**等效**突变体估算值。 有关更多详细信息,请参见[何时停止模糊](WhenToStopFuzzing.html)的章节。 + +## 经验教训 + +* 我们已经了解了为什么结构覆盖范围不足以评估测试套件的质量。 +* 我们已经了解了如何使用变异分析来评估测试套件的质量。 +* 我们已经了解了突变分析的局限性-等效和冗余突变体,以及如何估算它们。 + +## 后续步骤 + +* 虽然幼稚的模糊测试会产生质量较差的预言,但诸如[符号](SymbolicFuzzer.html)和[缩略语](ConcolicFuzzer.html)之类的技术可以增强模糊测试中使用的预言质量。 +* [动态不变量](DynamicInvariants.html)对提高Oracle的质量也有很大的帮助。 +* [何时停止模糊](WhenToStopFuzzing.html)的章节详细介绍了Chao估算器。 + +## 背景 + +突变分析的想法最早由Lipton等人提出。 [Lipton *等人*,1971。]。 贾等人发表了一份出色的突变分析研究综述。 [Jia *等*,2011。]。 Papadakis等人[Papadakis *等人*,2019年。有关突变分析的章节是对突变分析当前趋势的又一出色概述。 + +## 练习 + +### 练习1:算术表达变量 + +我们简单的语句删除突变只是可以对程序进行突变的一种方法。 另一类突变体是*表达突变*,其中算术运算符(例如`{+,-,*,/}`等)彼此替换。 例如,给定一个表达式,例如 + +```py +x = x + 1 +``` + +可以将其变异为 + +```py +x = x - 1 +``` + +和 + +```py +x = x * 1 +``` + +and + +```py +x = x / 1 +``` + +首先,我们需要找出要突变的节点类型。 我们通过ast函数获得这些,并发现节点类型名为BinOp + +```py +print(astor.dump_tree(ast.parse("1 + 2 - 3 * 4 / 5"))) + +``` + +```py +Module( + body=[ + Expr( + value=BinOp(left=BinOp(left=Num(n=1), op=Add, right=Num(n=2)), + op=Sub, + right=BinOp(left=BinOp(left=Num(n=3), op=Mult, right=Num(n=4)), op=Div, right=Num(n=5))))]) + +``` + +要使树变异,因此您需要更改`op`属性(其值为`Add`,`Sub`,`Mult`和`Div`之一) + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/MutationAnalysis.ipynb#Exercises) to work on the exercises and see solutions. + +要使树变异,我们需要更改`op`属性(其值为`Add`,`Sub`,`Mult`和`Div`之一)。 编写一个进行必要突变的类`BinOpMutator`,然后创建一个类`MuBinOpAnalyzer`作为`MuFunctionAnalyzer`的子类,该类使用`BinOpMutator`。 + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/MutationAnalysis.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习2:优化突变分析 + +我们的突变分析技术效率低下,因为我们即使在代码中包含测试案例未涵盖的突变的突变体上也可以运行测试。 测试用例无法检测未涵盖的部分代码中的错误。 因此,最简单的优化方法之一是首先从给定的测试用例中恢复覆盖率信息,然后仅在突变位于测试用例所覆盖的代码中的突变体上运行测试用例。 您可以修改`MuFunctionAnalyzer`以纳入恢复覆盖范围作为第一步吗? + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/MutationAnalysis.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习3:字节码突变器 + +我们已经看到了在给定源的情况下如何突变AST。 这种方法的缺点之一是Python字节码也被其他语言作为目标。 在这种情况下,源可能不容易转换为Python AST,因此希望更改字节码。 您是否可以为Python函数实现字节码更改器,该字节器更改字节码而不是获取源代码然后对其进行更改? + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/MutationAnalysis.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习4:估计残余缺陷密度 + +程序的缺陷密度是程序中发布之前检测到的缺陷数除以程序大小。 残余缺陷密度是逃避检测的缺陷百分比。 尽管很难估计实际的残余缺陷密度,但突变分析可以提供一个上限。 仍未检测到的突变体数量是程序中剩余缺陷数量的合理上限。 但是,此上限可能太宽。 原因是一些剩余的故障可以相互影响,并且如果一起出现,则可以由可用的测试套件检测到。 因此,更严格的界限是在给定程序中可以被*并存*却没有被给定测试套件检测到的突变体的数量。 这可以通过从可能的完整突变集开始,并应用[的delta-debugging来完成,该章在减少](Reducer.html)的章节中确定了需要删除的最小数目的突变,以使突变体无法被检测到。 测试套件。 您可以通过扩展使用此技术来估计残余缺陷密度上限的`MuFunctionAnalyzer`来产生新的`RDDEstimator`吗? + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/MutationAnalysis.ipynb#Exercises) to work on the exercises and see solutions. \ No newline at end of file diff --git a/new/fuzzing-book-zh/14.md b/new/fuzzing-book-zh/14.md new file mode 100644 index 0000000000000000000000000000000000000000..56f04a002e1476f34518589014c4bdd754a9772d --- /dev/null +++ b/new/fuzzing-book-zh/14.md @@ -0,0 +1,21 @@ +# 第三部分:语法模糊 + +> 原文: [https://www.fuzzingbook.org/html/03_Syntactical_Fuzzing.html](https://www.fuzzingbook.org/html/03_Syntactical_Fuzzing.html) + +本部分介绍了*语法*级别的测试生成,即,构成语言结构的输入。 + +* [语法](Grammars.html)为程序提供合法输入的*规范*。 通过语法指定输入可以非常系统和有效地生成测试,特别是对于复杂的输入格式。 + +* [高效的语法模糊处理](GrammarFuzzer.html)引入了基于树的语法模糊处理算法,该算法速度更快,并且可以更好地控制模糊输入的产生。 + +* [语法覆盖率](GrammarCoverageFuzzer.html)可以系统地覆盖语法元素,以便我们最大限度地提高多样性,而不会漏掉单个元素。 + +* [解析输入](Parser.html)显示了如何使用语法将给定的有效种子输入集解析和分解为相应的派生树。 + +* [概率语法模糊](ProbabilisticGrammarFuzzer.html)通过将*概率*分配给各个扩展来赋予语法更多的功能。 + +* [生成器模糊处理](GeneratorGrammarFuzzer.html)显示如何使用*函数*扩展语法-在语法扩展过程中执行的代码片段,可以生成,检查或更改生成的元素。 + +* [Greybox语法模糊](GreyboxGrammarFuzzer.html)利用结构表示法允许我们对它们的各个部分进行变异,交叉和重组,以生成新的有效的,稍有变化的输入。 + +* [减少故障导致的输入](Reducer.html)提出了以下技术:*自动将故障引起的输入减少并简化到最小*,以便于调试。 \ No newline at end of file diff --git a/new/fuzzing-book-zh/15.md b/new/fuzzing-book-zh/15.md new file mode 100644 index 0000000000000000000000000000000000000000..4203eecca4938058cb4695c7e7b9099e809ed0ca --- /dev/null +++ b/new/fuzzing-book-zh/15.md @@ -0,0 +1,2099 @@ +# 用文法模糊处理 + +> 原文: [https://www.fuzzingbook.org/html/Grammars.html](https://www.fuzzingbook.org/html/Grammars.html) + +在[“基于突变的模糊检测”](MutationFuzzer.html) 一章中,我们了解了如何使用额外的提示(例如样本输入文件)来加快测试生成速度。 在本章中,我们通过为程序提供合法输入的*规范*来使这一想法更进一步。 通过*语法*指定输入可以进行非常系统和有效的测试生成,尤其是对于复杂的输入格式。 语法还充当配置模糊测试,API模糊测试,GUI模糊测试等的基础。 + +**前提条件** + +* 您应该知道基本的模糊测试如何工作,例如 [一章中介绍了模糊](Fuzzer.html)。 +* 基于[突变的模糊](MutationFuzzer.html)和[覆盖率](Coverage.html)的知识尚不需要*,但仍推荐使用。* + +```py +import [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) + +``` + +```py +import [Fuzzer](Fuzzer.html) + +``` + +## 内容提要 + +要使用本章中提供的代码来[,请编写](Importing.html) + +```py +>>> from [fuzzingbook.Grammars](Grammars.html) import + +``` + +然后利用以下功能。 + +本章介绍*语法*,作为指定输入语言并将其用于测试具有语法有效输入的程序的简单方法。 语法定义为非终结符到替代扩展列表的映射,如以下示例所示: + +```py +>>> US_PHONE_GRAMMAR = { +>>> "": [""], +>>> "": ["()-"], +>>> "": [""], +>>> "": [""], +>>> "": [""], +>>> "": ["2", "3", "4", "5", "6", "7", "8", "9"], +>>> "": ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9"] +>>> } +>>> +>>> assert is_valid_grammar(US_PHONE_GRAMMAR) + +``` + +非终端符号括在尖括号中(例如``)。 为了从语法生成输入字符串,*生产者*以起始符号(``)开头,并为该符号随机选择一个随机扩展。 它将继续该过程,直到所有非终结符都展开为止。 函数`simple_grammar_fuzzer()`可以做到: + +```py +>>> [simple_grammar_fuzzer(US_PHONE_GRAMMAR) for i in range(5)] +['(692)449-5179', + '(519)230-7422', + '(613)761-0853', + '(979)881-3858', + '(810)914-5475'] + +``` + +但是,实际上,您应该使用[类,](GrammarFuzzer.html)类或基于[覆盖率的](GrammarCoverageFuzzer.html),基于[概率性的](ProbabilisticGrammarFuzzer.html)而不是 [基于生成器的](GeneratorGrammarFuzzer.html)衍生物; 这些功能更加有效,可防止无限增长,并提供其他一些功能。 + +本章还介绍了[语法工具箱](#A-Grammar-Toolbox),该工具箱具有多个辅助功能,可简化语法的编写,例如对字符类和重复使用快捷方式符号或扩展语法 + +## 输入语言 + +程序的所有可能的行为都可以通过其输入来触发。 这里的“输入”可以有很多种可能的来源:我们正在谈论从文件,环境或网络中读取的数据,用户输入的数据或通过与其他资源交互而获取的数据。 所有这些输入的集合决定了程序的行为方式-包括其失败。 因此,在测试时,考虑可能的输入源,如何控制它们以及*如何系统地测试它们*非常有帮助。 + +为了简单起见,我们现在假设该程序只有一个输入源; 这也是我们在前几章中一直使用的假设。 程序的有效输入集称为*语言*。 语言的范围从简单到复杂:CSV语言表示有效的逗号分隔输入的集合,而Python语言表示有效的Python程序的集合。 我们通常将数据语言和编程语言分开,尽管任何程序也可以视为输入数据(例如,对于编译器)。 文件格式的 [Wikipedia页面列出了1,000多种不同的文件格式,每种格式都是其自己的语言。](https://en.wikipedia.org/wiki/List_of_file_formats) + +为了正式描述语言,*正式语言*领域已经设计了许多描述语言的*语言规范*。 *正则表达式*表示这些语言中表示字符串集的最简单的类:例如,正则表达式`[a-z]*`表示小写字母(可能为空)的序列。 *自动机理论*将这些语言与接受这些输入的自动机联系起来; 例如,*有限状态机*可用于指定正则表达式的语言。 + +正则表达式非常适合不太复杂的输入格式,并且关联的有限状态机具有许多使它们适合推理的属性。 但是,要指定更复杂的输入,它们很快就会遇到限制。 在语言频谱的另一端,我们有*通用语法*,它们表示 *Turing机器*接受的语言。 图灵机可以计算任何可以计算的东西。 并且由于Python是图灵完备的,这意味着我们还可以使用Python程序$ p $来指定甚至枚举合法输入。 但是,然后,计算机科学理论也告诉我们,每个这样的测试程序都必须专门针对要测试的程序编写,这不是我们想要的自动化水平。 + +## 语法 + +正则表达式和图灵机之间的中间立场由*语法*覆盖。 语法是用于正式指定输入语言的最流行(和最佳理解)形式主义之一。 使用一种语法,可以表达一种输入语言的多种属性。 语法对于表示输入的*语法结构*特别有用,并且是表示嵌套或递归输入的形式化选择。 我们使用的语法是所谓的*上下文无关文法*,这是最简单和最受欢迎的语法形式主义之一。 + +### 规则和扩展 + +语法由*起始符号*和一组*扩展规则*(或简称为*规则*)组成,这些规则指示如何扩展起始符号(和其他符号) 。 例如,请考虑以下语法,表示两个数字的序列: + +```py + ::= + ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 +``` + +要阅读此类语法,请从开始符号(``)开始。 扩展规则` ::= `表示左侧的符号(``)可以由右侧的字符串(``)代替。 在以上语法中,``将替换为``。 + +再次在此字符串中,``将替换为``规则右侧的字符串。 特殊运算符`|`表示*扩展替代项*(或简称为*替代项*),意味着可以为扩展选择任何数字。 因此,每个``都将扩展为给定的数字之一,最终在`00`和`99`之间产生一个字符串。 `0`到`9`没有进一步的扩展,因此我们都准备就绪。 + +关于语法的有趣之处在于它们可以是*递归*。 也就是说,扩展可以利用之前扩展的符号-然后再将其扩展。 例如,考虑描述整数的语法: + +```py + ::= + ::= | + ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 +``` + +此处,``可以是一个数字,也可以是后面跟另一个整数的数字。 因此,数字`1234`将被表示为一个数字`1`,后跟一个整数`234`,后者又是一个数字`2`,然后是整数`34`。 + +如果我们想表达一个整数可以以一个符号(`+`或`-`)开头,我们可以将语法写为 + +```py + ::= + ::= | + | - + ::= | + ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 +``` + +这些规则正式定义了语言:可以从起始符号派生的任何内容都是该语言的一部分; 没有的一切都不是。 + +### 算术表达式 + +让我们扩展语法以涵盖完整的*算术表达式*-语法的后代子示例。 我们看到表达式(``)是和,差,或项。 术语是产品或部门或因素; 因素是数字或带括号的表达式。 几乎所有规则都可以递归,因此可以使用任意复杂的表达式,例如`(1 + 2) * (3.4 / 5.6 - 789)`。 + +```py + ::= + ::= + | - | + ::= * | / | + ::= + | - | () | | . + ::= | + ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 +``` + +在这样的语法中,如果我们以``开头,然后将一个符号扩展为另一个,随机选择替代符号,则可以快速地生成一个有效的算术表达式。 这种*语法模糊*可以产生复杂的输入,因此非常有效,这就是我们将在本章中实现的功能。 + +## 在Python 中表示语法 + +构建语法模糊器的第一步是为语法找到合适的格式。 为了使语法的编写尽可能简单,我们使用基于字符串和列表的格式。 我们在Python中的语法采用符号名称和扩展名之间的*映射*的格式,其中扩展名是*列表的*。 因此,数字的单规则语法采用以下形式: + +```py +DIGIT_GRAMMAR = { + "": + ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9"] +} + +``` + +而算术表达式的完整语法如下所示: + +```py +EXPR_GRAMMAR = { + "": + [""], + + "": + [" + ", " - ", ""], + + "": + [" * ", " / ", ""], + + "": + ["+", + "-", + "()", + ".", + ""], + + "": + ["", ""], + + "": + ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9"] +} + +``` + +在语法中,每个符号可以定义一次。 我们可以通过其符号访问任何规则... + +```py +EXPR_GRAMMAR[""] + +``` + +```py +['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'] + +``` + +....我们可以检查语法中是否包含符号: + +```py +"" in EXPR_GRAMMAR + +``` + +```py +False + +``` + +请注意,我们假设在规则的左侧(即映射中的键)始终是单个符号。 这是使我们的语法具有*上下文无关*的特征的属性。 + +## 一些定义 + +我们假设规范的开始符号是``: + +```py +START_SYMBOL = "" + +``` + +方便的`nonterminals()`函数从扩展中提取非终结符列表(即`<`和`>`之间的任何字符,空格除外)。 + +```py +import [re](https://docs.python.org/3/library/re.html) + +``` + +```py +RE_NONTERMINAL = re.compile(r'(<[^<> ]*>)') + +``` + +```py +def nonterminals(expansion): + # In later chapters, we allow expansions to be tuples, + # with the expansion being the first element + if isinstance(expansion, tuple): + expansion = expansion[0] + + return re.findall(RE_NONTERMINAL, expansion) + +``` + +```py +assert nonterminals(" * ") == ["", ""] +assert nonterminals("") == ["", ""] +assert nonterminals("1 < 3 > 2") == [] +assert nonterminals("1 <3> 2") == ["<3>"] +assert nonterminals("1 + 2") == [] +assert nonterminals(("<1>", {'option': 'value'})) == ["<1>"] + +``` + +同样,`is_nonterminal()`检查某个符号是否为非终结符: + +```py +def is_nonterminal(s): + return re.match(RE_NONTERMINAL, s) + +``` + +```py +assert is_nonterminal("") +assert is_nonterminal("") +assert not is_nonterminal("+") + +``` + +## 一个简单的语法模糊器 + +现在让我们使用以上语法。 我们将构建一个非常简单的语法模糊器,以起始符号(``)开头,然后继续对其进行扩展。 为了避免扩展为无限输入,我们对非终端数设置了限制(`max_nonterminals`)。 此外,为了避免陷入无法再减少符号数的情况,我们还限制了扩展步骤的总数。 + +```py +import [random](https://docs.python.org/3/library/random.html) + +``` + +```py +class ExpansionError(Exception): + pass + +``` + +```py +def simple_grammar_fuzzer(grammar, start_symbol=START_SYMBOL, + max_nonterminals=10, max_expansion_trials=100, + log=False): + term = start_symbol + expansion_trials = 0 + + while len(nonterminals(term)) > 0: + symbol_to_expand = random.choice(nonterminals(term)) + expansions = grammar[symbol_to_expand] + expansion = random.choice(expansions) + new_term = term.replace(symbol_to_expand, expansion, 1) + + if len(nonterminals(new_term)) < max_nonterminals: + term = new_term + if log: + print("%-40s" % (symbol_to_expand + " -> " + expansion), term) + expansion_trials = 0 + else: + expansion_trials += 1 + if expansion_trials >= max_expansion_trials: + raise ExpansionError("Cannot expand " + repr(term)) + + return term + +``` + +让我们看看这个简单的语法模糊器如何从起始符号中获得算术表达式: + +```py +simple_grammar_fuzzer(grammar=EXPR_GRAMMAR, max_nonterminals=3, log=True) + +``` + +```py + -> + -> + + + -> + + -> + + -> + + -> 6 6 + + -> - 6 + - + -> 6 + - + -> 6 + - + -> - 6 + - - + -> 6 + - - + -> () 6 + -() - + -> () 6 + -() - () + -> 6 + -() - () + -> 6 + -() - () + -> 6 + -() - () + -> + 6 + -(+) - () + -> + 6 + -(++) - () + -> 6 + -(++) - () + -> () 6 + -(++()) - () + -> 6 + -(++()) - () + -> 6 + -(++()) - () + -> 6 + -(++()) - () + -> 9 6 + -(++()) - (9) + -> * 6 + -(++( * )) - (9) + -> 6 + -(++( * )) - (9) + -> 6 + -(++( * )) - (9) + -> 6 + -(++( * )) - (9) + -> 2 6 + -(++(2 * )) - (9) + -> + 6 + -(++(2 * +)) - (9) + -> - 6 + -(++(2 * +-)) - (9) + -> - 6 + -(++(2 * +--)) - (9) + -> - 6 + -(++(2 * +---)) - (9) + -> - 6 + -(++(2 * +----)) - (9) + -> . 6 + -(++(2 * +----.)) - (9) + -> 6 + -(++(2 * +----.)) - (9) + -> 6 + -(++(2 * +----.)) - (9) + -> 1 6 + -(++(2 * +----1.)) - (9) + -> 7 6 + -(++(2 * +----1.7)) - (9) + +``` + +```py +'6 + -(++(2 * +----1.7)) - (9)' + +``` + +通过增加非终端的数量,我们可以快速获得更长的产量: + +```py +for i in range(10): + print(simple_grammar_fuzzer(grammar=EXPR_GRAMMAR, max_nonterminals=5)) + +``` + +```py``` + +注意,由于大量的搜索和替换操作,此模糊器效率很低。 另一方面,实现很简单,并且在大多数情况下都能胜任。 在本章中,我们将坚持下去; 在[下一章](GrammarFuzzer.html)中,我们将展示如何构建更有效的代码。 + +## 将语法可视化为铁路图 + +使用语法,我们可以轻松指定前面讨论的几个示例的格式。 例如,上述算术表达式可以直接发送到`bc`(或任何采用算术表达式的程序)中。 在介绍一些其他语法之前,让我们给出一种方法,使*可视化*,并提供另一种视图以帮助他们理解。 + +*铁路图*,也称为*语法图*,是无上下文语法的图形表示。 按照可能的“轨道”轨迹从左到右读取它们; 轨道上遇到的符号顺序定义了语言。 + +我们使用 [RailroadDiagrams](RailroadDiagrams.html) (一个用于可视化的外部库)。 + +```py +from [RailroadDiagrams](RailroadDiagrams.html) import NonTerminal, Terminal, Choice, HorizontalChoice, Sequence, Diagram, show_diagram + +``` + +```py +from [IPython.display](https://ipython.readthedocs.io/en/stable/api/generated/IPython.display.html) import SVG, display + +``` + +我们首先定义方法`syntax_diagram_symbol()`以可视化给定的符号。 终端符号表示为椭圆形,而非终端符号(例如``)表示为矩形。 + +```py +def syntax_diagram_symbol(symbol): + if is_nonterminal(symbol): + return NonTerminal(symbol[1:-1]) + else: + return Terminal(symbol) + +``` + +```py +SVG(show_diagram(syntax_diagram_symbol(''))) + +``` + + term + +我们定义`syntax_diagram_expr()`以可视化扩展替代方案。 + +```py +def syntax_diagram_expr(expansion): + # In later chapters, we allow expansions to be tuples, + # with the expansion being the first element + if isinstance(expansion, tuple): + expansion = expansion[0] + + symbols = [sym for sym in re.split(RE_NONTERMINAL, expansion) if sym != ""] + if len(symbols) == 0: + symbols = [""] # special case: empty expansion + + return Sequence(*[syntax_diagram_symbol(sym) for sym in symbols]) + +``` + +```py +SVG(show_diagram(syntax_diagram_expr(EXPR_GRAMMAR[''][0]))) + +``` + + factor * term + +这是``的第一种选择– ``,然后是`*`和``。 + +接下来,我们定义`syntax_diagram_alt()`以显示替代表达式。 + +```py +from [itertools](https://docs.python.org/3/library/itertools.html) import zip_longest + +``` + +```py +def syntax_diagram_alt(alt): + max_len = 5 + alt_len = len(alt) + if alt_len > max_len: + iter_len = alt_len // max_len + alts = list(zip_longest(*[alt[i::iter_len] for i in range(iter_len)])) + exprs = [[syntax_diagram_expr(expr) for expr in alt + if expr is not None] for alt in alts] + choices = [Choice(len(expr) // 2, *expr) for expr in exprs] + return HorizontalChoice(*choices) + else: + return Choice(alt_len // 2, *[syntax_diagram_expr(expr) for expr in alt]) + +``` + +```py +SVG(show_diagram(syntax_diagram_alt(EXPR_GRAMMAR['']))) + +``` + + 0 1 2 3 4 5 6 7 8 9 + +我们看到``可以是`0`到`9`的任何一位数字。 + +最后,我们定义`syntax_diagram()`,它给出了一个语法,显示了其规则的语法图。 + +```py +def syntax_diagram(grammar): + from [IPython.display](https://ipython.readthedocs.io/en/stable/api/generated/IPython.display.html) import SVG, display + + for key in grammar: + print("%s" % key[1:-1]) + display(SVG(show_diagram(syntax_diagram_alt(grammar[key])))) + +``` + +```py +syntax_diagram(EXPR_GRAMMAR) + +``` + +```py +start + +``` + + expr + +```py +expr + +``` + + term + expr term - expr term + +```py +term + +``` + + factor * term factor / term factor + +```py +factor + +``` + + - factor + factor ( expr ) integer . integer integer + +```py +integer + +``` + + digit integer digit + +```py +digit + +``` + + 0 1 2 3 4 5 6 7 8 9 + +这种铁路表示形式将在可视化语法结构时派上用场-特别是对于更复杂的语法。 + +## 一些文法 + +让我们创建(并可视化)更多语法并将其用于模糊测试。 + +### CGI语法 + +这是[关于覆盖](Coverage.html)的一章中介绍的`cgi_decode()`的语法。 + +```py +CGI_GRAMMAR = { + "": + [""], + + "": + ["", ""], + + "": + ["", "", ""], + + "": + ["+"], + + "": + ["%"], + + "": + ["0", "1", "2", "3", "4", "5", "6", "7", + "8", "9", "a", "b", "c", "d", "e", "f"], + + "": # Actually, could be _all_ letters + ["0", "1", "2", "3", "4", "5", "a", "b", "c", "d", "e", "-", "_"], +} + +``` + +```py +syntax_diagram(CGI_GRAMMAR) + +``` + +```py +start + +``` + + string + +```py +string + +``` + + letter letter string + +```py +letter + +``` + + plus percent other + +```py +plus + +``` + + + + +```py +percent + +``` + + % hexdigit hexdigit + +```py +hexdigit + +``` + + 0 1 2 3 4 5 6 7 8 9 a b c d e f + +```py +other + +``` + + 0 1 2 3 4 5 a b c d e - _ + +与[基本模糊处理](Fuzzer.html)或基于[突变的模糊处理](MutationFuzzer.html)相比,语法可以快速产生各种组合: + +```py +for i in range(10): + print(simple_grammar_fuzzer(grammar=CGI_GRAMMAR, max_nonterminals=10)) + +``` + +```py ++%9a ++++%ce+ ++_ ++%c6c +++ ++%cd+5 +1%ee +%b9%d5 +%96 +%57d%42 + +``` + +### URL语法 + +我们为CGI输入看到的相同属性也适用于更复杂的输入。 让我们使用一种语法来产生大量有效的URL: + +```py +URL_GRAMMAR = { + "": + [""], + "": + ["://"], + "": + ["http", "https", "ftp", "ftps"], + "": + ["", ":", "@", "@:"], + "": # Just a few + ["cispa.saarland", "www.google.com", "fuzzingbook.com"], + "": + ["80", "8080", ""], + "": + ["", ""], + "": + ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9"], + "": # Just one + ["user:password"], + "": # Just a few + ["", "/", "/"], + "": # Just a few + ["abc", "def", "x"], + "": + ["", "?"], + "": + ["", "&"], + "": # Just a few + ["=", "="], +} + +``` + +```py +syntax_diagram(URL_GRAMMAR) + +``` + +```py +start + +``` + + url + +```py +url + +``` + + scheme :// authority path query + +```py +scheme + +``` + + https http ftp ftps + +```py +authority + +``` + + host : port host userinfo @ host userinfo @ host : port + +```py +host + +``` + + cispa.saarland www.google.com fuzzingbook.com + +```py +port + +``` + + 80 8080 nat + +```py +nat + +``` + + digit digit digit + +```py +digit + +``` + + 0 1 2 3 4 5 6 7 8 9 + +```py +userinfo + +``` + + user:password + +```py +path + +``` + + / / id + +```py +id + +``` + + abc def x digit digit + +```py +query + +``` + + ? params + +```py +params + +``` + + param param & params + +```py +param + +``` + + id = id id = nat + +同样,在几毫秒内,我们可以产生大量有效的输入。 + +```py +for i in range(10): + print(simple_grammar_fuzzer(grammar=URL_GRAMMAR, max_nonterminals=10)) + +``` + +```py +https://user:password@cispa.saarland:80/ +http://fuzzingbook.com?def=56&x89=3&x46=48&def=def +ftp://cispa.saarland/?x71=5&x35=90&def=abc +https://cispa.saarland:80/def?def=7&x23=abc +https://fuzzingbook.com:80/ +https://fuzzingbook.com:80/abc?def=abc&abc=x14&def=abc&abc=2&def=38 +ftps://fuzzingbook.com/x87 +https://user:password@fuzzingbook.com:6?def=54&x44=abc +http://fuzzingbook.com:80?x33=25&def=8 +http://fuzzingbook.com:8080/def + +``` + +### 自然语言语法 + +最后,语法不仅限于诸如计算机输入之类的*形式语言*,而且还可以用于产生*自然语言*。 这是我们用来选择本书标题的语法: + +```py +TITLE_GRAMMAR = { + "": [""], + "<title>": ["<topic>: <subtopic>"], + "<topic>": ["Generating Software Tests", "<fuzzing-prefix>Fuzzing", "The Fuzzing Book"], + "<fuzzing-prefix>": ["", "The Art of ", "The Joy of "], + "<subtopic>": ["<subtopic-main>", + "<subtopic-prefix><subtopic-main>", + "<subtopic-main><subtopic-suffix>"], + "<subtopic-main>": ["Breaking Software", + "Generating Software Tests", + "Principles, Techniques and Tools"], + "<subtopic-prefix>": ["", "Tools and Techniques for "], + "<subtopic-suffix>": [" for <reader-property> and <reader-property>", + " for <software-property> and <software-property>"], + "<reader-property>": ["Fun", "Profit"], + "<software-property>": ["Robustness", "Reliability", "Security"], +} + +``` + +```py +syntax_diagram(TITLE_GRAMMAR) + +``` + +```py +start + +``` + + <svg class="railroad-diagram" height="62" viewBox="0 0 182.5 62" width="182.5" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="non-terminal"><text x="91.25" y="35">title</text></g></g></g></g></svg> + +```py +title + +``` + + <svg class="railroad-diagram" height="62" viewBox="0 0 347.5 62" width="347.5" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="non-terminal"><text x="91.25" y="35">topic</text></g> <g class="terminal"><text x="161.0" y="35">:</text></g> <g class="non-terminal"><text x="243.5" y="35">subtopic</text></g></g></g></g></svg> + +```py +topic + +``` + + <svg class="railroad-diagram" height="122" viewBox="0 0 358.5 122" width="358.5" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="terminal"><text x="179.25" y="35">Generating Software Tests</text></g></g> <g><g class="non-terminal"><text x="129.5" y="65">fuzzing-prefix</text></g> <g class="terminal"><text x="258.75" y="65">Fuzzing</text></g></g> <g><g class="terminal"><text x="179.25" y="95">The Fuzzing Book</text></g></g></g></g></svg> + +```py +fuzzing-prefix + +``` + + <svg class="railroad-diagram" height="122" viewBox="0 0 233.5 122" width="233.5" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="terminal"><text x="116.75" y="65">The Art of</text></g></g> <g><g class="terminal"><text x="116.75" y="95">The Joy of</text></g></g></g></g></svg> + +```py +subtopic + +``` + + <svg class="railroad-diagram" height="122" viewBox="0 0 418.0 122" width="418.0" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="non-terminal"><text x="209.0" y="35">subtopic-main</text></g></g> <g><g class="non-terminal"><text x="133.75" y="65">subtopic-prefix</text></g> <g class="non-terminal"><text x="292.75" y="65">subtopic-main</text></g></g> <g><g class="non-terminal"><text x="125.25" y="95">subtopic-main</text></g> <g class="non-terminal"><text x="284.25" y="95">subtopic-suffix</text></g></g></g></g></svg> + +```py +subtopic-main + +``` + + <svg class="railroad-diagram" height="122" viewBox="0 0 412.0 122" width="412.0" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="terminal"><text x="206.0" y="35">Breaking Software</text></g></g> <g><g class="terminal"><text x="206.0" y="65">Generating Software Tests</text></g></g> <g><g class="terminal"><text x="206.0" y="95">Principles, Techniques and Tools</text></g></g></g></g></svg> + +```py +subtopic-prefix + +``` + + <svg class="railroad-diagram" height="92" viewBox="0 0 352.5 92" width="352.5" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="terminal"><text x="176.25" y="65">Tools and Techniques for</text></g></g></g></g></svg> + +```py +subtopic-suffix + +``` + + <svg class="railroad-diagram" height="92" viewBox="0 0 634.0 92" width="634.0" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="terminal"><text x="108.25" y="35">for</text></g> <g class="non-terminal"><text x="233.25" y="35">reader-property</text></g> <g class="terminal"><text x="358.25" y="35">and</text></g> <g class="non-terminal"><text x="483.25" y="35">reader-property</text></g></g> <g><g class="terminal"><text x="91.25" y="65">for</text></g> <g class="non-terminal"><text x="224.75" y="65">software-property</text></g> <g class="terminal"><text x="358.25" y="65">and</text></g> <g class="non-terminal"><text x="491.75" y="65">software-property</text></g></g></g></g></svg> + +```py +reader-property + +``` + + <svg class="railroad-diagram" height="92" viewBox="0 0 191.0 92" width="191.0" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="terminal"><text x="95.5" y="35">Fun</text></g></g> <g><g class="terminal"><text x="95.5" y="65">Profit</text></g></g></g></g></svg> + +```py +software-property + +``` + + <svg class="railroad-diagram" height="122" viewBox="0 0 233.5 122" width="233.5" xmlns="http://www.w3.org/2000/svg"><g transform="translate(.5 .5)"><g><g><g class="terminal"><text x="116.75" y="35">Robustness</text></g></g> <g><g class="terminal"><text x="116.75" y="65">Reliability</text></g></g> <g><g class="terminal"><text x="116.75" y="95">Security</text></g></g></g></g></svg> + +```py +titles = set() +while len(titles) < 10: + titles.add(simple_grammar_fuzzer( + grammar=TITLE_GRAMMAR, max_nonterminals=10)) +titles + +``` + +```py +{'Fuzzing: Generating Software Tests', + 'Fuzzing: Principles, Techniques and Tools', + 'Generating Software Tests: Breaking Software', + 'Generating Software Tests: Breaking Software for Robustness and Robustness', + 'Generating Software Tests: Principles, Techniques and Tools', + 'Generating Software Tests: Principles, Techniques and Tools for Profit and Fun', + 'Generating Software Tests: Tools and Techniques for Principles, Techniques and Tools', + 'The Fuzzing Book: Breaking Software', + 'The Fuzzing Book: Generating Software Tests for Profit and Profit', + 'The Fuzzing Book: Generating Software Tests for Robustness and Robustness'} + +``` + +(如果您发现此处存在冗余(“鲁棒性和鲁棒性”):在[我们有关基于覆盖率的模糊测试](GrammarCoverageFuzzer.html)的章节中,我们将展示如何仅覆盖每个扩展一次。并且,如果您喜欢某些替代方法 [概率语法模糊](ProbabilisticGrammarFuzzer.html)比其他要多。 + +## 语法作为突变种子 + +语法的一个非常有用的属性是它们产生大多数有效的输入。 从句法的观点来看,输入实际上*始终是*有效,因为它们满足给定语法的约束。 (当然,首先需要一个有效的语法。)但是,还有*语义*属性,这些属性无法轻松地用语法表达。 例如,如果对于URL,端口范围应该在1024到2048之间,则很难用语法来编写。 如果必须满足更复杂的约束条件,则可以很快达到语法可以表达的极限。 + +解决此问题的一种方法是对语法附加约束,因为我们将在本书的后面讨论[。 另一种可能性是将基于语法的模糊测试和基于](ConstraintFuzzer.html)[突变的模糊测试](MutationFuzzer.html)的优势结合在一起。 想法是将语法生成的输入用作*种子*,以进行进一步的基于突变的模糊测试。 这样,我们不仅可以探索*有效*输入,还可以检查有效输入和无效输入之间的*边界*。 这一点特别有趣,因为稍微无效的输入允许查找解析器错误(通常很丰富)。 就像一般的模糊测试一样,意外的情况揭示了程序中的错误。 + +要将生成的输入用作种子,我们可以将它们直接输入到前面介绍的突变模糊处理程序中: + +```py +from [MutationFuzzer](MutationFuzzer.html) import MutationFuzzer # minor dependency + +``` + +```py +number_of_seeds = 10 +seeds = [ + simple_grammar_fuzzer( + grammar=URL_GRAMMAR, + max_nonterminals=10) for i in range(number_of_seeds)] +seeds + +``` + +```py +['ftps://user:password@www.google.com:80', + 'http://cispa.saarland/', + 'ftp://www.google.com:42/', + 'ftps://user:password@fuzzingbook.com:39?abc=abc', + 'https://www.google.com?x33=1&x06=1', + 'http://www.google.com:02/', + 'https://user:password@www.google.com/', + 'ftp://cispa.saarland:8080/?abc=abc&def=def&abc=5', + 'http://www.google.com:80/def?def=abc', + 'http://user:password@cispa.saarland/'] + +``` + +```py +m = MutationFuzzer(seeds) + +``` + +```py +[m.fuzz() for i in range(20)] + +``` + +```py +['ftps://user:password@www.google.com:80', + 'http://cispa.saarland/', + 'ftp://www.google.com:42/', + 'ftps://user:password@fuzzingbook.com:39?abc=abc', + 'https://www.google.com?x33=1&x06=1', + 'http://www.google.com:02/', + 'https://user:password@www.google.com/', + 'ftp://cispa.saarland:8080/?abc=abc&def=def&abc=5', + 'http://www.google.com:80/def?def=abc', + 'http://user:password@cispa.saarland/', + 'Eh4tp:www.coogle.com:80/def?d%f=abc', + 'ftps://}ser:passwod@fuzzingbook.com:9?abc=abc', + 'uftp//cispa.sRaarland:808&0?abc=abc&def=defabc=5', + 'http://user:paswor9d@cispar.saarland/v', + 'ftp://Www.g\x7fogle.cAom:42/', + 'hht://userC:qassMword@cispy.csaarland/', + 'httx://ww.googlecom:80defde`f=ac', + 'htt://cispq.waarlnd/', + 'htFtp\t://cmspa./saarna(md/', + 'ft:/www.google.com:42\x0f'] + +``` + +前10个`fuzz()`调用返回种子输入(按设计),而后一个再次创建任意突变。 使用`MutationCoverageFuzzer`而不是`MutationFuzzer`,我们可以再次根据覆盖率进行搜索-从而将多个世界的最佳点融合在一起。 + +## 语法工具箱 + +现在让我们介绍一些有助于我们编写语法的技术。 + +### 转义 + +通过`<`和`>`在语法中定界非终结符,我们如何实际表达某些输入应包含`<`和`>`? 答案很简单:只需为它们引入一个符号即可。 + +```py +simple_nonterminal_grammar = { + "<start>": ["<nonterminal>"], + "<nonterminal>": ["<left-angle><identifier><right-angle>"], + "<left-angle>": ["<"], + "<right-angle>": [">"], + "<identifier>": ["id"] # for now +} + +``` + +在`simple_nonterminal_grammar`中,`<left-angle>`的扩展名和`<right-angle>`的扩展名都不能误认为是非终结符。 因此,我们可以生产任意数量的东西。 + +### 扩展语法 + +在本书的过程中,我们经常遇到通过*扩展*具有新功能的现有语法来创建语法的问题。 这样的扩展非常类似于面向对象编程中的子类化。 + +要从现有语法$ g $创建新语法$ g'$,我们首先将$ g $复制到$ g'$,然后使用新的替代方法扩展现有规则和/或添加新的符号。 这是一个示例,使用更好的标识符规则扩展了上述`nonterminal`语法: + +```py +import [copy](https://docs.python.org/3/library/copy.html) + +``` + +```py +nonterminal_grammar = copy.deepcopy(simple_nonterminal_grammar) +nonterminal_grammar["<identifier>"] = ["<idchar>", "<identifier><idchar>"] +nonterminal_grammar["<idchar>"] = ['a', 'b', 'c', 'd'] # for now + +``` + +```py +nonterminal_grammar + +``` + +```py +{'<start>': ['<nonterminal>'], + '<nonterminal>': ['<left-angle><identifier><right-angle>'], + '<left-angle>': ['<'], + '<right-angle>': ['>'], + '<identifier>': ['<idchar>', '<identifier><idchar>'], + '<idchar>': ['a', 'b', 'c', 'd']} + +``` + +由于语法的这种扩展是常见的操作,因此我们引入了自定义函数`extend_grammar()`,该函数首先复制给定的语法,然后使用Python字典`update()`方法从字典中对其进行更新: + +```py +def extend_grammar(grammar, extension={}): + new_grammar = copy.deepcopy(grammar) + new_grammar.update(extension) + return new_grammar + +``` + +对`extend_grammar()`的此调用将`simple_nonterminal_grammar`扩展到`nonterminal_grammar`,就像上面的“手动”示例一样: + +```py +nonterminal_grammar = extend_grammar(simple_nonterminal_grammar, + { + "<identifier>": ["<idchar>", "<identifier><idchar>"], + # for now + "<idchar>": ['a', 'b', 'c', 'd'] + } + ) + +``` + +### 字符类 + +在上面的`nonterminal_grammar`中,我们仅列举了前几个字母; 确实,如`<idchar> ::= 'a' | 'b' | 'c' ...`中那样手动枚举语法中的所有字母或数字有点痛苦。 + +但是,请记住,语法是程序的一部分,因此也可以通过程序构造。 我们引入一个函数`srange()`,该函数在字符串中构造一个字符列表: + +```py +import [string](https://docs.python.org/3/library/string.html) + +``` + +```py +def srange(characters): + """Construct a list with all characters in the string""" + return [c for c in characters] + +``` + +如果我们将包含所有ASCII字母的常量`string.ascii_letters`传递给它,则`srange()`将返回所有ASCII字母的列表: + +```py +string.ascii_letters + +``` + +```py +'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ' + +``` + +```py +srange(string.ascii_letters)[:10] + +``` + +```py +['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'] + +``` + +我们可以在语法中使用这些常量来快速定义标识符: + +```py +nonterminal_grammar = extend_grammar(nonterminal_grammar, + { + "<idchar>": srange(string.ascii_letters) + srange(string.digits) + srange("-_") + } + ) + +``` + +```py +[simple_grammar_fuzzer(nonterminal_grammar, "<identifier>") for i in range(10)] + +``` + +```py +['b', 'd', 'V9', 'x4c', 'YdiEWj', 'c', 'xd', '7', 'vIU', 'QhKD'] + +``` + +快捷方式`crange(start, end)`返回`start`到(包括)`end`的ASCII范围内的所有字符的列表: + +```py +def crange(character_start, character_end): + return [chr(i) + for i in range(ord(character_start), ord(character_end) + 1)] + +``` + +我们可以使用它来表示字符范围: + +```py +crange('0', '9') + +``` + +```py +['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'] + +``` + +```py +assert crange('a', 'z') == srange(string.ascii_lowercase) + +``` + +### 语法快捷方式 + +在上面的`nonterminal_grammar`中,像在其他语法中一样,我们必须使用*递归*来表示字符的重复,即通过引用原始定义: + +```py +nonterminal_grammar["<identifier>"] + +``` + +```py +['<idchar>', '<identifier><idchar>'] + +``` + +如果我们简单地声明非终结符应该是字母的非空序列,则可能会容易一些,例如 + +```py +<identifier> = <idchar>+ +``` + +其中`+`表示其后跟符号的非空重复。 + +诸如`+`之类的运算符经常作为语法中方便的*快捷方式*引入。 正式地,我们的语法以 [Backus-Naur形式](https://en.wikipedia.org/wiki/Backus-Naur_form)或简称 *BNF* 的形式出现。 运算符*将* BNF扩展为所谓的_extended BNF *或简称为* EBNF *: + +* `<symbol>?`格式表示`<symbol>`是可选的-也就是说,它可以出现0或1次。 +* 形式`<symbol>+`表示`<symbol>`可以重复出现1次或多次。 +* 形式`<symbol>*`表示`<symbol>`可以出现0次或更多次。 (换句话说,这是一个可选的重复。) + +为了使事情变得更加有趣,我们想在上述快捷方式中使用*括号*。 因此,`(<foo><bar>)?`表示`<foo>`和`<bar>`的顺序是可选的。 + +使用此类运算符,我们可以以更简单的方式定义标识符规则。 为此,让我们创建原始语法的副本并修改`<identifier>`规则: + +```py +nonterminal_ebnf_grammar = extend_grammar(nonterminal_grammar, + { + "<identifier>": ["<idchar>+"] + } + ) + +``` + +同样,我们可以简化表达语法。 考虑一下符号是如何可选的,以及如何将整数表示为数字序列。 + +```py +EXPR_EBNF_GRAMMAR = { + "<start>": + ["<expr>"], + + "<expr>": + ["<term> + <expr>", "<term> - <expr>", "<term>"], + + "<term>": + ["<factor> * <term>", "<factor> / <term>", "<factor>"], + + "<factor>": + ["<sign>?<factor>", "(<expr>)", "<integer>(.<integer>)?"], + + "<sign>": + ["+", "-"], + + "<integer>": + ["<digit>+"], + + "<digit>": + srange(string.digits) +} + +``` + +我们的目标是将上述EBNF语法转换为常规BNF语法。 这是通过以下四个规则完成的: + +1. 具有新规则`<new-symbol> ::= content`的表达式`(content)op`变为`<new-symbol>op`,其中`op`是`?`,`+`和`*`之一。 +2. 表达式`<symbol>?`变为`<new-symbol>`,其中`<new-symbol> ::= <empty> | <symbol>`。 +3. 表达式`<symbol>+`变为`<new-symbol>`,其中`<new-symbol> ::= <symbol> | <symbol><new-symbol>`。 +4. 表达式`<symbol>*`变为`<new-symbol>`,其中`<new-symbol> ::= <empty> | <symbol><new-symbol>`。 + +这里,`<empty>`扩展为空字符串,与`<empty> ::=`相同。 (这也称为 *epsilon扩展*。) + +如果这些运算符使您想起*正则表达式*,这并非偶然:实际上,可以使用上述规则(以及使用`crange()`定义的字符类)将任何基本正则表达式转换为语法。 。 + +将这些规则应用于上面的示例将产生以下结果: + +* `<idchar>+`与`<new-symbol> ::= <idchar> | <idchar><new-symbol>`成为`<idchar><new-symbol>`。 +* `<integer>(.<integer>)?`与`<new-symbol> ::= <empty> | .<integer>`成为`<integer><new-symbol>`。 + +让我们分三步实施这些规则。 + +#### 创建新符号 + +首先,我们需要一种机制来创建新符号。 这很简单。 + +```py +def new_symbol(grammar, symbol_name="<symbol>"): + """Return a new symbol for `grammar` based on `symbol_name`""" + if symbol_name not in grammar: + return symbol_name + + count = 1 + while True: + tentative_symbol_name = symbol_name[:-1] + "-" + repr(count) + ">" + if tentative_symbol_name not in grammar: + return tentative_symbol_name + count += 1 + +``` + +```py +assert new_symbol(EXPR_EBNF_GRAMMAR, '<expr>') == '<expr-1>' + +``` + +#### 扩展括号表达式 + +接下来,我们需要一种从扩展中提取括号表达式的方法,并根据上述规则对其进行扩展。 让我们从提取表达式开始: + +```py +RE_PARENTHESIZED_EXPR = re.compile(r'\([^()]*\)[?+*]') + +``` + +```py +def parenthesized_expressions(expansion): + # In later chapters, we allow expansions to be tuples, + # with the expansion being the first element + if isinstance(expansion, tuple): + expansion = expansion[0] + + return re.findall(RE_PARENTHESIZED_EXPR, expansion) + +``` + +```py +assert parenthesized_expressions("(<foo>)* (<foo><bar>)+ (+<foo>)? <integer>(.<integer>)?") == [ + '(<foo>)*', '(<foo><bar>)+', '(+<foo>)?', '(.<integer>)?'] + +``` + +现在,我们可以使用它们来应用上面的规则编号1,为括号中的表达式引入新的符号。 + +```py +def convert_ebnf_parentheses(ebnf_grammar): + """Convert a grammar in extended BNF to BNF""" + grammar = extend_grammar(ebnf_grammar) + for nonterminal in ebnf_grammar: + expansions = ebnf_grammar[nonterminal] + + for i in range(len(expansions)): + expansion = expansions[i] + + while True: + parenthesized_exprs = parenthesized_expressions(expansion) + if len(parenthesized_exprs) == 0: + break + + for expr in parenthesized_exprs: + operator = expr[-1:] + contents = expr[1:-2] + + new_sym = new_symbol(grammar) + expansion = grammar[nonterminal][i].replace( + expr, new_sym + operator, 1) + grammar[nonterminal][i] = expansion + grammar[new_sym] = [contents] + + return grammar + +``` + +这将执行上面概述的转换: + +```py +convert_ebnf_parentheses({"<number>": ["<integer>(.<integer>)?"]}) + +``` + +```py +{'<number>': ['<integer><symbol>?'], '<symbol>': ['.<integer>']} + +``` + +它甚至适用于带括号的嵌套表达式: + +```py +convert_ebnf_parentheses({"<foo>": ["((<foo>)?)+"]}) + +``` + +```py +{'<foo>': ['<symbol-1>+'], '<symbol>': ['<foo>'], '<symbol-1>': ['<symbol>?']} + +``` + +#### 扩展运算符 + +扩展带括号的表达式后,我们现在需要注意符号后跟运算符(`?`,`*`和`+`)。 与上面的`convert_ebnf_parentheses()`一样,我们首先提取所有符号,然后提取一个运算符。 + +```py +RE_EXTENDED_NONTERMINAL = re.compile(r'(<[^<> ]*>[?+*])') + +``` + +```py +def extended_nonterminals(expansion): + # In later chapters, we allow expansions to be tuples, + # with the expansion being the first element + if isinstance(expansion, tuple): + expansion = expansion[0] + + return re.findall(RE_EXTENDED_NONTERMINAL, expansion) + +``` + +```py +assert extended_nonterminals( + "<foo>* <bar>+ <elem>? <none>") == ['<foo>*', '<bar>+', '<elem>?'] + +``` + +我们的转换器提取符号和运算符,并根据上述规则添加新符号。 + +```py +def convert_ebnf_operators(ebnf_grammar): + """Convert a grammar in extended BNF to BNF""" + grammar = extend_grammar(ebnf_grammar) + for nonterminal in ebnf_grammar: + expansions = ebnf_grammar[nonterminal] + + for i in range(len(expansions)): + expansion = expansions[i] + extended_symbols = extended_nonterminals(expansion) + + for extended_symbol in extended_symbols: + operator = extended_symbol[-1:] + original_symbol = extended_symbol[:-1] + + new_sym = new_symbol(grammar, original_symbol) + grammar[nonterminal][i] = grammar[nonterminal][i].replace( + extended_symbol, new_sym, 1) + + if operator == '?': + grammar[new_sym] = ["", original_symbol] + elif operator == '*': + grammar[new_sym] = ["", original_symbol + new_sym] + elif operator == '+': + grammar[new_sym] = [ + original_symbol, original_symbol + new_sym] + + return grammar + +``` + +```py +convert_ebnf_operators({"<integer>": ["<digit>+"]}) + +``` + +```py +{'<integer>': ['<digit>'], '<digit>': ['<digit>', '<digit><digit>']} + +``` + +#### 全部在一起 + +我们可以结合两个,首先扩展括号,然后是运算符: + +```py +def convert_ebnf_grammar(ebnf_grammar): + return convert_ebnf_operators(convert_ebnf_parentheses(ebnf_grammar)) + +``` + +```py +convert_ebnf_grammar({"<authority>": ["(<userinfo>@)?<host>(:<port>)?"]}) + +``` + +```py +{'<authority>': ['<symbol-2><host><symbol-1-1>'], + '<symbol>': ['<userinfo>@'], + '<symbol-1>': [':<port>'], + '<symbol-2>': ['', '<symbol>'], + '<symbol-1-1>': ['', '<symbol-1>']} + +``` + +```py +expr_grammar = convert_ebnf_grammar(EXPR_EBNF_GRAMMAR) +expr_grammar + +``` + +```py +{'<start>': ['<expr>'], + '<expr>': ['<term> + <expr>', '<term> - <expr>', '<term>'], + '<term>': ['<factor> * <term>', '<factor> / <term>', '<factor>'], + '<factor>': ['<sign-1><factor>', '(<expr>)', '<integer><symbol-1>'], + '<sign>': ['+', '-'], + '<integer>': ['<digit-1>'], + '<digit>': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], + '<symbol>': ['.<integer>'], + '<sign-1>': ['', '<sign>'], + '<symbol-1>': ['', '<symbol>'], + '<digit-1>': ['<digit>', '<digit><digit-1>']} + +``` + +成功! 我们已经很好地将EBNF语法转换为BNF。 + +通过字符类和EBNF语法转换,我们有两个功能强大的工具可以使语法编写更加容易。 在处理语法时,我们将一再使用它们。 + +### 语法扩展 + +在本书的学习过程中,我们经常希望为语法指定*附加信息*,例如 [*概率*](ProbabilisticGrammarFuzzer.html) 或 [*约束* 。 为了支持这些扩展以及可能的其他扩展,我们定义了*注释*机制。 + +我们注释语法的概念是将*注释*添加到各个扩展中。 为此,我们允许扩展不仅是字符串,而且是字符串和一组属性的*对*,如 + +```py +"<expr>": + [("<term> + <expr>", opts(min_depth=10)), + ("<term> - <expr>", opts(max_depth=2)), + "<term>"] + +``` + +在这里,`opts()`函数将使我们能够表达适用于各个扩展的注释; 在这种情况下,加法将以`min_depth`值为10注释,减法以`max_depth`值为2注释。这些注释的含义留给处理语法的各个算法; 但是,一般的想法是可以忽略它们。 + +我们的`opts()`辅助函数返回其参数到值的映射: + +```py +def opts(**kwargs): + return kwargs + +``` + +```py +opts(min_depth=10) + +``` + +```py +{'min_depth': 10} + +``` + +为了处理扩展字符串以及扩展和注释对,我们通过指定的辅助函数`exp_string()`和`exp_opts()`访问扩展字符串和相关的注释: + +```py +def exp_string(expansion): + """Return the string to be expanded""" + if isinstance(expansion, str): + return expansion + return expansion[0] + +``` + +```py +exp_string(("<term> + <expr>", opts(min_depth=10))) + +``` + +```py +'<term> + <expr>' + +``` + +```py +def exp_opts(expansion): + """Return the options of an expansion. If options are not defined, return {}""" + if isinstance(expansion, str): + return {} + return expansion[1] + +``` + +```py +def exp_opt(expansion, attribute): + """Return the given attribution of an expansion. + If attribute is not defined, return None""" + return exp_opts(expansion).get(attribute, None) + +``` + +```py +exp_opts(("<term> + <expr>", opts(min_depth=10))) + +``` + +```py +{'min_depth': 10} + +``` + +```py +exp_opt(("<term> - <expr>", opts(max_depth=2)), 'max_depth') + +``` + +```py +2 + +``` + +最后,我们定义一个设置特定选项的辅助函数: + +```py +def set_opts(grammar, symbol, expansion, opts=None): + """Set the options of the given expansion of grammar[symbol] to opts""" + expansions = grammar[symbol] + for i, exp in enumerate(expansions): + if exp_string(exp) != exp_string(expansion): + continue + + new_opts = exp_opts(exp) + if opts is None or new_opts == {}: + new_opts = opts + else: + for key in opts: + new_opts[key] = opts[key] + if new_opts == {}: + grammar[symbol][i] = exp_string(exp) + else: + grammar[symbol][i] = (exp_string(exp), new_opts) + return + + raise KeyError( + "no expansion " + + repr(symbol) + + " -> " + + repr( + exp_string(expansion))) + +``` + +## 检查语法 + +由于语法以字符串表示,因此引入错误非常容易。 因此,让我们介绍一个辅助函数,该函数检查语法的一致性。 + +辅助函数`is_valid_grammar()`遍历语法以检查是否定义了所有使用的符号,反之亦然,这对于调试非常有用; 它还检查从起始符号是否可以访问所有符号。 您不必在这里深入研究细节,但是与往常一样,在使用输入数据之前,请务必先弄清楚它。 + +```py +import [sys](https://docs.python.org/3/library/sys.html) + +``` + +```py +def def_used_nonterminals(grammar, start_symbol=START_SYMBOL): + defined_nonterminals = set() + used_nonterminals = {start_symbol} + + for defined_nonterminal in grammar: + defined_nonterminals.add(defined_nonterminal) + expansions = grammar[defined_nonterminal] + if not isinstance(expansions, list): + print(repr(defined_nonterminal) + ": expansion is not a list", + file=sys.stderr) + return None, None + + if len(expansions) == 0: + print(repr(defined_nonterminal) + ": expansion list empty", + file=sys.stderr) + return None, None + + for expansion in expansions: + if isinstance(expansion, tuple): + expansion = expansion[0] + if not isinstance(expansion, str): + print(repr(defined_nonterminal) + ": " + + repr(expansion) + ": not a string", + file=sys.stderr) + return None, None + + for used_nonterminal in nonterminals(expansion): + used_nonterminals.add(used_nonterminal) + + return defined_nonterminals, used_nonterminals + +``` + +```py +def reachable_nonterminals(grammar, start_symbol=START_SYMBOL): + reachable = set() + + def _find_reachable_nonterminals(grammar, symbol): + nonlocal reachable + reachable.add(symbol) + for expansion in grammar.get(symbol, []): + for nonterminal in nonterminals(expansion): + if nonterminal not in reachable: + _find_reachable_nonterminals(grammar, nonterminal) + + _find_reachable_nonterminals(grammar, start_symbol) + return reachable + +``` + +```py +def unreachable_nonterminals(grammar, start_symbol=START_SYMBOL): + return grammar.keys() - reachable_nonterminals(grammar, start_symbol) + +``` + +```py +def opts_used(grammar): + used_opts = set() + for symbol in grammar: + for expansion in grammar[symbol]: + used_opts |= set(exp_opts(expansion).keys()) + return used_opts + +``` + +```py +def is_valid_grammar(grammar, start_symbol=START_SYMBOL, supported_opts=None): + defined_nonterminals, used_nonterminals = \ + def_used_nonterminals(grammar, start_symbol) + if defined_nonterminals is None or used_nonterminals is None: + return False + + # Do not complain about '<start>' being not used, + # even if start_symbol is different + if START_SYMBOL in grammar: + used_nonterminals.add(START_SYMBOL) + + for unused_nonterminal in defined_nonterminals - used_nonterminals: + print(repr(unused_nonterminal) + ": defined, but not used", + file=sys.stderr) + for undefined_nonterminal in used_nonterminals - defined_nonterminals: + print(repr(undefined_nonterminal) + ": used, but not defined", + file=sys.stderr) + + # Symbols must be reachable either from <start> or given start symbol + unreachable = unreachable_nonterminals(grammar, start_symbol) + msg_start_symbol = start_symbol + if START_SYMBOL in grammar: + unreachable = unreachable - \ + reachable_nonterminals(grammar, START_SYMBOL) + if start_symbol != START_SYMBOL: + msg_start_symbol += " or " + START_SYMBOL + for unreachable_nonterminal in unreachable: + print(repr(unreachable_nonterminal) + ": unreachable from " + msg_start_symbol, + file=sys.stderr) + + used_but_not_supported_opts = set() + if supported_opts is not None: + used_but_not_supported_opts = opts_used( + grammar).difference(supported_opts) + for opt in used_but_not_supported_opts: + print( + "warning: option " + + repr(opt) + + " is not supported", + file=sys.stderr) + + return used_nonterminals == defined_nonterminals and len(unreachable) == 0 + +``` + +上面定义的语法通过了测试: + +```py +assert is_valid_grammar(EXPR_GRAMMAR) +assert is_valid_grammar(CGI_GRAMMAR) +assert is_valid_grammar(URL_GRAMMAR) + +``` + +该检查也可以应用于EBNF语法: + +```py +assert is_valid_grammar(EXPR_EBNF_GRAMMAR) + +``` + +但是,这些没有通过测试: + +```py +assert not is_valid_grammar({"<start>": ["<x>"], "<y>": ["1"]}) + +``` + +```py +'<y>': defined, but not used +'<x>': used, but not defined +'<y>': unreachable from <start> + +``` + +```py +assert not is_valid_grammar({"<start>": "123"}) + +``` + +```py +'<start>': expansion is not a list + +``` + +```py +assert not is_valid_grammar({"<start>": []}) + +``` + +```py +'<start>': expansion list empty + +``` + +```py +assert not is_valid_grammar({"<start>": [1, 2, 3]}) + +``` + +```py +'<start>': 1: not a string + +``` + +从这里开始,在定义语法时,我们将始终使用`is_valid_grammar()`。 + +## 经验教训 + +* 语法是表达和产生语法有效输入的强大工具。 +* 语法产生的输入可以直接使用,也可以用作基于突变的模糊测试的种子。 +* 可以使用字符类和运算符扩展语法,以使编写更加容易。 + +## 后续步骤 + +由于它们为生成软件测试奠定了良好的基础,因此在本书中我们一再使用语法。 作为先睹为快,我们可以对[模糊配置](ConfigurationFuzzer.html)使用语法: + +```py +<options> ::= <option>* +<option> ::= -h | --version | -v | -d | -i | --global-config <filename> +``` + +我们可以对[模糊功能和API](APIFuzzer.html) 和[模糊图形用户界面](WebFuzzer.html)使用语法: + +```py +<call-sequence> ::= <call>* +<call> ::= urlparse(<url>) | urlsplit(<url>) +``` + +我们可以将[概率](ProbabilisticGrammarFuzzer.html)和[约束](GeneratorGrammarFuzzer.html)分配给各个扩展: + +```py +<term>: 50% <factor> * <term> | 30% <factor> / <term> | 20% <factor> +<integer>: <digit>+ { <integer> >= 100 } +``` + +所有这些额外的东西变得特别有价值 + +1. *自动推断语法*,无需手动指定语法,并且 +2. *指导他们实现特定目标*,例如覆盖范围或关键功能; + +我们还将在本书中讨论所有技术。 + +但是,要到达那里,我们还有一些功课要做。 特别是,我们首先必须学习如何 + +* [创建高效的语法模糊器](GrammarFuzzer.html) + +## 背景 + +作为人类语言的基础之一,语法一直存在,只要人类语言存在就可以。 生成语法的第一个*形式化*是达克西·普特拉·帕尼(DakṣiputraPāṇini)于公元前350年。 。 作为表达用于数据和程序的形式语言的一般手段,不能夸大其在计算机科学中的作用。 Chomsky [ [Chomsky *等人*,1956\.](https://chomsky.info/wp-content/uploads/195609-.pdf) ]的开创性工作介绍了正则语言,上下文无关文法,上下文相关文法和通用文法的中心模型。 从那以后(并在计算机科学领域任教)作为一种指定输入和编程语言的方法。 + +语法在产生*的*测试输入中的使用可以追溯到Burkhardt [ [Burkhardt *等人*,1967年。](https://doi.org/10.1007/BF02235512)],稍后由Hanford重新发现并应用 [] Hanford *等*,1970。](https://doi.org/10.1147/sj.94.0242)]和Purdom [ [Purdom *等*,1972。](https://doi.org/10.1007/BF01932308)]。 此后,语法测试最重要的用途是*编译器测试*。 实际上,基于语法的测试是编译器和Web浏览器按其应有的方式工作的重要原因之一: + +* [CSmith](https://embed.cs.utah.edu/csmith/) 工具[ [Yang *等*,2011年。](https://doi.org/10.1145/1993498.1993532)]特别针对C程序,从C语法开始,然后应用其他步骤,例如引用变量 和较早定义的函数,或确保整数和类型安全。 他们的作者使用它“查找并报告了400多个以前未知的编译器错误”。 + +* [LangFuzz](http://issta2016.cispa.saarland/interview-with-christian-holler/) 作品[ [Holler *等人*,2012年。](https://www.usenix.org/system/files/conference/usenixsecurity12/sec12-final73.pdf)]与本书共有两名作者,使用通用语法产生输出,每天使用 晚上生成JavaScript程序并测试其解释器; 截止到今天,它已经在Mozilla Firefox,Google Chrome和Microsoft Edge等浏览器中发现了2,600多个错误。 + +* [EMI项目](http://web.cs.ucdavis.edu/~su/emi-project/) [ [Le *等*,2014年。](https://doi.org/10.1145/2594291.2594334)]使用语法对C编译器进行压力测试,将已知测试转换为在语义上等效的替代程序 所有输入。 同样,这已经修复了100多个C编译器中的错误。 + +* [Grammarinator](https://github.com/renatahodovan/grammarinator) [[Hodován*等人*,2018。](https://www.researchgate.net/publication/328510752_Grammarinator_a_grammar-based_open_source_fuzzer)]是一种开源语法模糊工具(用Python编写!),使用流行的ANTLR格式作为语法规范。 像LangFuzz一样,它使用语法进行解析和生成,并且在 *JerryScript* 轻量级JavaScript引擎和相关平台中发现了100多个问题。 + +* [Domato](https://github.com/googleprojectzero/domato) 是一个通用的语法生成引擎,专门用于对DOM输入进行模糊处理。 它揭示了流行的Web浏览器中的许多安全问题。 + +当然,编译器和Web浏览器不仅是测试需要语法的领域,而且还是众所周知的语法的领域。 我们在本书中的主张是,语法可用于几乎生成任何输入*,而我们的目标是使您能够准确地做到这一点。* + +## 练习 + +### 练习1:JSON语法 + +看一下 [JSON规范](http://www.json.org)并从中得出语法: + +* 使用*字符类*表示有效字符 +* 使用EBNF表示重复和可选部分 +* 假使,假设 + * 字符串是数字,ASCII字母,标点和空格字符的序列,不带引号或转义符 + * 空白只是一个空格。 +* 使用`is_valid_grammar()`确保语法有效。 + +将语法输入`simple_grammar_fuzzer()`。 您是否遇到任何错误,为什么? + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/Grammars.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习2:查找错误 + +名称`simple_grammar_fuzzer()`并非偶然出现:它扩展语法的方式受到多种限制。 如果按上述定义在`nonterminal_grammar`和`expr_grammar`上应用`simple_grammar_fuzzer()`,会发生什么,为什么? + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/Grammars.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习3:带有正则表达式的语法 + +在以正则表达式扩展的*语法中,我们可以使用特殊形式* + +```py +/regex/ +``` + +在扩展中包含正则表达式。 例如,我们可以有一条规则 + +```py +<integer> ::= /[+-]?[0-9]+/ +``` + +快速表示整数是可选符号,后跟数字序列。 + +#### 第1部分:转换正则表达式 + +编写一个使用正则表达式`r`并创建等效语法的转换器`convert_regex(r)`。 支持以下正则表达式构造: + +* `*`,`+`,`?`,`()`应该仅在上述EBNF中起作用。 +* `a|b`应该转换为替代项列表`[a, b]`。 +* `.`应该匹配除换行符之外的任何字符。 +* `[abc]`应翻译为`srange("abc")` +* `[^abc]`应该转换为ASCII字符集*,除了* `srange("abc")`之外。 +* `[a-b]`应翻译为`crange(a, b)` +* `[^a-b]`应该转换为ASCII字符集*,除了* `crange(a, b)`之外。 + +示例:`convert_regex(r"[0-9]+")`应该产生一个语法,例如 + +```py +{ + "<start>": ["<s1>"], + "<s1>": [ "<s2>", "<s1><s2>" ], + "<s2>": crange('0', '9') +} + +``` + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/Grammars.ipynb#Exercises) to work on the exercises and see solutions. + +#### 第2部分:识别并扩展正则表达式 + +编写一个转换器`convert_regex_grammar(g)`,该转换器采用EBNF文法`g`,其中包含形式为`/.../`的正则表达式,并创建等效的BNF文法。 支持上面的正则表达式构造。 + +示例:`convert_regex_grammar({ "<integer>" : "/[+-]?[0-9]+/" })`应该产生一个语法,例如 + +```py +{ + "<integer>": ["<s1><s3>"], + "<s1>": [ "", "<s2>" ], + "<s2>": srange("+-"), + "<s3>": [ "<s4>", "<s4><s3>" ], + "<s4>": crange('0', '9') +} + +``` + +可选:支持*以正则表达式转义*:`\c`转换为文字字符`c`; `\/`转换为`/`(因此不结束正则表达式); `\\`转换为`\`。 + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/Grammars.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习4:将语法定义为函数(高级)) + +为了获得用于指定语法的更好语法,可以使用Python构造,然后再通过另一种功能将*解析为*。 例如,我们可以想象一个语法定义,它使用`|`作为分隔替代项的手段: + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/Grammars.ipynb#Exercises) to work on the exercises and see solutions. + +```py +def expression_grammar_fn(): + start = "<expr>" + expr = "<term> + <expr>" | "<term> - <expr>" + term = "<factor> * <term>" | "<factor> / <term>" | "<factor>" + factor = "+<factor>" | "-<factor>" | "(<expr>)" | "<integer>.<integer>" | "<integer>" + integer = "<digit><integer>" | "<digit>" + digit = '0' | '1' | '2' | '3' | '4' | '5' | '6' | '7' | '8' | '9' + +``` + +如果执行`expression_grammar_fn()`,将产生错误。 然而,`expression_grammar_fn()`的目的不是要执行,而是用作将要构造语法的*数据*。 + +```py +with ExpectError(): + expression_grammar_fn() + +``` + +```py +Traceback (most recent call last): + File "<ipython-input-109-612cec5468d3>", line 2, in <module> + expression_grammar_fn() + File "<ipython-input-108-f21ab929e5ee>", line 3, in expression_grammar_fn + expr = "<term> + <expr>" | "<term> - <expr>" +TypeError: unsupported operand type(s) for |: 'str' and 'str' (expected) + +``` + +为此,我们使用了`ast`(抽象语法树)和`inspect`(代码检查)模块。 + +```py +import [ast](https://docs.python.org/3/library/ast.html) +import [inspect](https://docs.python.org/3/library/inspect.html) + +``` + +首先,我们获得`expression_grammar_fn()`的源代码... + +```py +source = inspect.getsource(expression_grammar_fn) +source + +``` + +```py +'def expression_grammar_fn():\n start = "<expr>"\n expr = "<term> + <expr>" | "<term> - <expr>"\n term = "<factor> * <term>" | "<factor> / <term>" | "<factor>"\n factor = "+<factor>" | "-<factor>" | "(<expr>)" | "<integer>.<integer>" | "<integer>"\n integer = "<digit><integer>" | "<digit>"\n digit = \'0\' | \'1\' | \'2\' | \'3\' | \'4\' | \'5\' | \'6\' | \'7\' | \'8\' | \'9\'\n' + +``` + +...然后将其解析为抽象语法树: + +```py +tree = ast.parse(source) + +``` + +现在,我们可以分析树以查找运算符和替代方法。 `get_alternatives()`遍历树的所有节点`op`; 如果该节点看起来像二进制*或*(`|`)操作,我们将进行更深入的挖掘并递归。 如果没有,那么我们已经达到了单一生产,并且我们尝试从生产中获得表达。 我们根据要表示产品的方式定义`to_expr`参数。 在这种情况下,我们用单个字符串表示单个产品。 + +```py +def get_alternatives(op, to_expr=lambda o: o.s): + if isinstance(op, ast.BinOp) and isinstance(op.op, ast.BitOr): + return get_alternatives(op.left, to_expr) + [to_expr(op.right)] + return [to_expr(op)] + +``` + +`funct_parser()`接受函数的抽象语法树(例如`expression_grammar_fn()`)并遍历所有分配: + +```py +def funct_parser(tree, to_expr=lambda o: o.s): + return {assign.targets[0].id: get_alternatives(assign.value, to_expr) + for assign in tree.body[0].body} + +``` + +结果是我们常规格式的语法: + +```py +grammar = funct_parser(tree) +for symbol in grammar: + print(symbol, "::=", grammar[symbol]) + +``` + +```py +start ::= ['<expr>'] +expr ::= ['<term> + <expr>', '<term> - <expr>'] +term ::= ['<factor> * <term>', '<factor> / <term>', '<factor>'] +factor ::= ['+<factor>', '-<factor>', '(<expr>)', '<integer>.<integer>', '<integer>'] +integer ::= ['<digit><integer>', '<digit>'] +digit ::= ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'] + +``` + +#### 第1部分(a):单个功能:-One-Single-Function) + +编写单个函数`define_grammar(fn)`,该函数采用定义为函数的语法(例如`expression_grammar_fn()`)并返回常规语法。 + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/Grammars.ipynb#Exercises) to work on the exercises and see solutions. + +#### 第1部分(b):替代表示形式:-Alternative-representations) + +我们注意到,我们先前设计的语法表示形式不允许简单生成替代项,例如`srange()`和`crange()`。 此外,可能会发现表达式的字符串表示形式受到限制。 事实证明,扩展我们的语法定义以支持如下语法很简单: + +```py +def define_name(o): + return o.id if isinstance(o, ast.Name) else o.s + +``` + +```py +def define_expr(op): + if isinstance(op, ast.BinOp) and isinstance(op.op, ast.Add): + return (*define_expr(op.left), define_name(op.right)) + return (define_name(op),) + +``` + +```py +def define_ex_grammar(fn): + return define_grammar(fn, define_expr) + +``` + +语法: + +```py +@define_ex_grammar +def expression_grammar(): + start = expr + expr = (term + '+' + expr + | term + '-' + expr) + term = (factor + '*' + term + | factor + '/' + term + | factor) + factor = ('+' + factor + | '-' + factor + | '(' + expr + ')' + | integer + '.' + integer + | integer) + integer = (digit + integer + | digit) + digit = '0' | '1' | '2' | '3' | '4' | '5' | '6' | '7' | '8' | '9' + +for symbol in expression_grammar: + print(symbol, "::=", expression_grammar[symbol]) + +``` + +**注意。** 这样获得的语法数据结构比标准数据结构更详细。 它表示每个生产为元组。 + +我们注意到,我们在上述语法中未启用`srange()`或`crange()`。 您将如何添加这些? (*提示:*包装`define_expr()`以查找`ast.Call`) + +#### 第2部分:扩展文法 + +引入一个带有一对`(min, max)`的运算符`*`,其中`min`和`max`分别是最小和最大重复次数。 缺失值`min`代表零; 无限值的缺失值`max`。 + +```py +def identifier_grammar_fn(): + identifier = idchar * (1,) + +``` + +使用`*`运算符,我们可以概括EBNF运算符-`?`变为(0,1),`*`变为(0,),`+`变为(1,)。 编写一个转换器,该转换器采用使用`*`定义的扩展语法,对其进行解析,然后将其转换为BNF。 + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/Grammars.ipynb#Exercises) to work on the exercises and see solutions. \ No newline at end of file diff --git a/new/fuzzing-book-zh/16.md b/new/fuzzing-book-zh/16.md new file mode 100644 index 0000000000000000000000000000000000000000..bb01355b58ada8b78abd99d88fc597a445ab25ea --- /dev/null +++ b/new/fuzzing-book-zh/16.md @@ -0,0 +1,1503 @@ +# 高效的语法模糊化 + +> 原文: [https://www.fuzzingbook.org/html/GrammarFuzzer.html](https://www.fuzzingbook.org/html/GrammarFuzzer.html) + +在语法的[一章中,我们已经看到了如何使用*语法*进行非常有效的测试。 在本章中,我们将以前的基于字符串的算法改进为基于树的算法,该算法速度更快,并且可以更好地控制模糊输入的产生。](Grammars.html) + +本章中的算法是其他几种技术的基础。 因此,本章是书中的“枢纽”。 + +**前提条件** + +* 您应该知道基于语法的模糊测试的工作原理,例如 摘自[语法](Grammars.html)一章。 + +## 内容提要 + +要使用本章中提供的代码来[,请编写](Importing.html) + +```py +>>> from [fuzzingbook.GrammarFuzzer](GrammarFuzzer.html) import <identifier> + +``` + +然后利用以下功能。 + +本章介绍`GrammarFuzzer`,这是一种高效的语法模糊器,它采用一种语法来产生语法上有效的输入字符串。 这是典型用法: + +```py +>>> from [Grammars](Grammars.html) import US_PHONE_GRAMMAR +>>> phone_fuzzer = GrammarFuzzer(US_PHONE_GRAMMAR) +>>> phone_fuzzer.fuzz() +'(582)871-9500' + +``` + +`GrammarFuzzer`构造函数采用许多关键字参数来控制其行为。 例如,`start_symbol`允许设置以扩展名开头的符号(而不是`<start>`): + +```py +>>> area_fuzzer = GrammarFuzzer(US_PHONE_GRAMMAR, start_symbol='<area>') +>>> area_fuzzer.fuzz() +'707' +>>> import [inspect](https://docs.python.org/3/library/inspect.html) +>>> print(inspect.getdoc(GrammarFuzzer.__init__)) +Produce strings from `grammar`, starting with `start_symbol`. +If `min_nonterminals` or `max_nonterminals` is given, use them as limits +for the number of nonterminals produced. +If `disp` is set, display the intermediate derivation trees. +If `log` is set, show intermediate steps as text on standard output. + +``` + +在内部,`GrammarFuzzer`使用[派生树](#Derivation-Trees),并逐步扩展。 生成字符串后,可以在`derivation_tree`属性中访问生成的树。 + +```py +>>> display_tree(phone_fuzzer.derivation_tree) + +``` + +! + +在派生树的内部表示中,*节点*是一对(`symbol`,`children`)。 对于非终端,`symbol`是正在扩展的符号,`children`是其他节点的列表。 对于终端,`symbol`是终端字符串,`children`为空。 + +```py +>>> phone_fuzzer.derivation_tree +('<start>', + [('<phone-number>', + [('(', []), + ('<area>', + [('<lead-digit>', [('5', [])]), + ('<digit>', [('8', [])]), + ('<digit>', [('2', [])])]), + (')', []), + ('<exchange>', + [('<lead-digit>', [('8', [])]), + ('<digit>', [('7', [])]), + ('<digit>', [('1', [])])]), + ('-', []), + ('<line>', + [('<digit>', [('9', [])]), + ('<digit>', [('5', [])]), + ('<digit>', [('0', [])]), + ('<digit>', [('0', [])])])])]) + +``` + +本章包含各种与派生树配合使用的助手,包括可视化工具。 + +## 算法 + +在[的前一章](Grammars.html)中,我们介绍了`simple_grammar_fuzzer()`函数,该函数采用语法并自动从中产生语法上有效的字符串。 但是,`simple_grammar_fuzzer()`的名称恰如其分-简单。 为了说明问题,让我们回到在语法的[一章中从`EXPR_GRAMMAR_BNF`创建的`expr_grammar`:](Grammars.html) + +```py +import [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) + +``` + +```py +from [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) import unicode_escape + +``` + +```py +from [Grammars](Grammars.html) import EXPR_EBNF_GRAMMAR, convert_ebnf_grammar, simple_grammar_fuzzer, is_valid_grammar, exp_string, exp_opts + +``` + +```py +expr_grammar = convert_ebnf_grammar(EXPR_EBNF_GRAMMAR) +expr_grammar + +``` + +```py +{'<start>': ['<expr>'], + '<expr>': ['<term> + <expr>', '<term> - <expr>', '<term>'], + '<term>': ['<factor> * <term>', '<factor> / <term>', '<factor>'], + '<factor>': ['<sign-1><factor>', '(<expr>)', '<integer><symbol-1>'], + '<sign>': ['+', '-'], + '<integer>': ['<digit-1>'], + '<digit>': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], + '<symbol>': ['.<integer>'], + '<sign-1>': ['', '<sign>'], + '<symbol-1>': ['', '<symbol>'], + '<digit-1>': ['<digit>', '<digit><digit-1>']} + +``` + +`expr_grammar`具有有趣的属性。 如果我们将其输入`simple_grammar_fuzzer()`,该函数将陷入无限扩展中: + +```py +from [ExpectError](ExpectError.html) import ExpectTimeout + +``` + +```py +with ExpectTimeout(1): + simple_grammar_fuzzer(grammar=expr_grammar, max_nonterminals=3) + +``` + +```py +Traceback (most recent call last): + File "<ipython-input-6-fbcda5f486bb>", line 2, in <module> + simple_grammar_fuzzer(grammar=expr_grammar, max_nonterminals=3) + File "<string>", line 8, in simple_grammar_fuzzer + File "<string>", line 7, in nonterminals + File "/Users/zeller/anaconda3/lib/python3.6/re.py", line 222, in findall + return _compile(pattern, flags).findall(string) + File "/Users/zeller/anaconda3/lib/python3.6/re.py", line 288, in _compile + try: + File "/Users/zeller/anaconda3/lib/python3.6/re.py", line 288, in _compile + try: + File "<string>", line 16, in check_time +TimeoutError (expected) + +``` + +为什么会这样? 问题在于此规则: + +```py +expr_grammar['<factor>'] + +``` + +```py +['<sign-1><factor>', '(<expr>)', '<integer><symbol-1>'] + +``` + +此处,除了`(expr)`以外的任何选择都会增加符号的数量,即使只是暂时的。 由于我们对要扩展的符号数设置了硬性限制,因此扩展`<factor>`剩下的唯一选择是`(<expr>)`,这将导致无限地添加括号。 + +潜在无限扩展的问题只是`simple_grammar_fuzzer()`的问题之一。 更多问题包括: + +1. *效率低下*。 每次迭代时,此模糊器将搜索到目前为止产生的字符串以扩展符号。 随着生产线的增长,这变得效率低下。 + +2. *很难控制。* 如上所述,即使在限制符号数量的情况下,仍然可以获得非常长的字符串,甚至无限长的字符串。 + +让我们通过绘制不同长度的字符串所需的时间来说明这两个问题。 + +```py +from [Grammars](Grammars.html) import simple_grammar_fuzzer + +``` + +```py +from [Grammars](Grammars.html) import START_SYMBOL, EXPR_GRAMMAR, URL_GRAMMAR, CGI_GRAMMAR + +``` + +```py +from [Grammars](Grammars.html) import RE_NONTERMINAL, nonterminals, is_nonterminal + +``` + +```py +from [Timer](Timer.html) import Timer + +``` + +```py +trials = 50 +xs = [] +ys = [] +for i in range(trials): + with Timer() as t: + s = simple_grammar_fuzzer(EXPR_GRAMMAR, max_nonterminals=15) + xs.append(len(s)) + ys.append(t.elapsed_time()) + print(i, end=" ") +print() + +``` + +```py +0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 + +``` + +```py +average_time = sum(ys) / trials +print("Average time:", average_time) + +``` + +```py +Average time: 0.2103420232999997 + +``` + +```py +%matplotlib inline + +import [matplotlib.pyplot](https://docs.python.org/3/library/matplotlib.pyplot.html) as [plt](https://docs.python.org/3/library/plt.html) +plt.scatter(xs, ys) +plt.title('Time required for generating an output') + +``` + +```py +Text(0.5,1,'Time required for generating an output') + +``` + +![]( +) + +我们看到(1)工作量随时间呈二次方增长,并且(2)我们可以轻松产生数万个字符长的输出。 + +为了解决这些问题,我们需要一种*更智能的算法*-一种效率更高的算法,可以更好地控制扩展,并且可以在`expr_grammar`中预见到`(expr)`替代方案会产生 与其他两个相反,无限扩展。 + +## 派生树 + +为了获得更有效的算法*和*更好地控制扩展,我们将对语法产生的字符串使用特殊表示形式。 总体思路是使用*树*结构,该结构随后将进行扩展–所谓的*派生树*。 这种表示形式使我们能够始终跟踪我们的扩展状态-回答问题,例如哪些元素已扩展为其他元素以及哪些符号仍需要扩展。 此外,向树中添加新元素比一次又一次地替换字符串要有效得多。 + +像在编程中使用的其他树一样,派生树(也称为*解析树*或*具体语法树*)由具有其他节点(称为*的*节点*)组成 ]子节点*)作为其*子节点*。 树开始于一个没有父节点的节点; 这称为*根节点*; 没有子节点的节点称为*叶*。 + +在以下步骤中,使用语法章节中的算术语法[来说明派生树的语法扩展过程。 我们从一个树的根节点开始,代表*起始符号* –在我们的例子中是`<start>`。](Grammars.html) + +```py +tree + +``` + +<svg height="23pt" viewBox="0.00 0.00 48.00 23.00" width="48pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g class="graph" id="graph0" transform="scale(1 1) rotate(0) translate(4 19)"><title>root \<start\> + +为了扩展树,我们遍历它,搜索没有子元素的非终结符号$ S $。 因此,$ S $是仍然需要扩展的符号。 然后,我们从语法中选择$ S $的扩展。 然后,将扩展项添加为$ S $的新子项。 对于我们的起始符号``,唯一的扩展名是``,因此我们将其添加为子代。 + +```py +tree + +``` + +root \ \<expr\> \<start\>->\<expr\> + +为了从派生树构造生成的字符串,我们按顺序遍历树,并在树的叶子处收集符号。 在上述情况下,我们获得字符串`""`。 + +要进一步扩展树,我们选择另一个符号进行扩展,并将其扩展添加为新子代。 这将使我们获得``符号,该符号被扩展为` + `,并添加了三个子代。 + +```py +tree + +``` + +root \ \<expr\> \<start\>->\<expr\> \<expr\> \<expr\>->\<expr\> + + \<expr\>->+ \<term\> \<expr\>->\<term\> + +我们重复扩展,直到没有符号可扩展为止: + +```py +tree + +``` + +root \ \<expr\> \<start\>->\<expr\> \<expr\> \<expr\>->\<expr\> + + \<expr\>->+ \<term\> \<expr\>->\<term\> \<term\> \<expr\> ->\<term\> \<factor\> \<term\>->\<factor\> \<factor\> \<term\> ->\<factor\> \<integer\> \<factor\> ->\<integer\> \<digit\> \<integer\> ->\<digit\> 2 2 \<digit\> ->2 \<integer\> \<factor\>->\<integer\> \<digit\> \<integer\>->\<digit\> 2 2 \<digit\>->2 + +现在,我们有了字符串`2 + 2`的表示形式。 但是,与单独的字符串相反,派生树记录*所生成字符串的整个结构*(和生产历史,或*派生*历史)。 它还允许进行简单的比较和操作-例如,将一个子树(子结构)替换为另一子树。 + +## 表示派生树 + +为了表示Python中的派生树,我们使用以下格式。 一个节点是一对 + +```py +(SYMBOL_NAME, CHILDREN) + +``` + +其中`SYMBOL_NAME`是代表节点的字符串(即`""`或`"+"`),`CHILDREN`是子节点的列表。 + +`CHILDREN`可以采用一些特殊值: + +1. `None`作为将来扩展的占位符。 这意味着该节点是*非终端符号*,应进一步扩展。 +2. `[]`(即空白列表),表示没有*个*子级。 这意味着该节点是无法再扩展的*终端符号*。 + +让我们采用一个非常简单的派生树,表示上面的中间步骤` + `。 + +```py +derivation_tree = ("", + [("", + [("", None), + (" + ", []), + ("", None)] + )]) + +``` + +为了更好地理解该树的结构,让我们介绍一个可视化该树的函数。 我们通过算法使用`graphviz`包中的`dot`绘图程序,遍历上述结构。 (除非您对树的可视化非常感兴趣,可以直接跳到下面的示例。) + +```py +from [graphviz](https://docs.python.org/3/library/graphviz.html) import Digraph + +``` + +```py +from [IPython.display](https://ipython.readthedocs.io/en/stable/api/generated/IPython.display.html) import display + +``` + +```py +import [re](https://docs.python.org/3/library/re.html) + +``` + +```py +def dot_escape(s): + """Return s in a form suitable for dot""" + s = re.sub(r'([^a-zA-Z0-9" ])', r"\\\1", s) + return s + +``` + +```py +assert dot_escape("hello") == "hello" +assert dot_escape(", world") == "\\\\, world" +assert dot_escape("\\n") == "\\\\n" + +``` + +尽管我们目前对可视化`derivation_tree`感兴趣,但对可视化过程进行一般化也符合我们的利益。 特别是,如果我们的方法`display_tree()`可以显示*任何*树之类的数据结构,则将很有帮助。 为此,我们定义了一个辅助方法`extract_node()`,该方法从给定的数据结构中提取当前符号和子代。 默认实现只是从任何`derivation_tree`节点中提取符号,子级和注释。 + +```py +def extract_node(node, id): + symbol, children, *annotation = node + return symbol, children, ''.join(str(a) for a in annotation) + +``` + +在可视化树时,通常以不同的方式显示某些节点​​很有用。 例如,有时在未处理节点和已处理节点之间进行区分很有用。 我们定义了一个帮助程序`default_node_attr()`,它提供了基本显示,可以由用户自定义。 + +```py +def default_node_attr(dot, nid, symbol, ann): + dot.node(repr(nid), dot_escape(unicode_escape(symbol))) + +``` + +与节点相似,边缘也可能需要修改。 我们将`default_edge_attr()`定义为可以由用户自定义的帮助程序。 + +```py +def default_edge_attr(dot, start_node, stop_node): + dot.edge(repr(start_node), repr(stop_node)) + +``` + +在可视化一棵树时,有时可能希望更改树的外观。 例如,如果树是从左到右而不是从上到下布置的,则有时更容易查看树。 为此,我们定义了另一个帮助程序`default_graph_attr()`。 + +```py +def default_graph_attr(dot): + dot.attr('node', shape='plain') + +``` + +最后,我们定义了一种方法`display_tree()`,该方法接受这四个函数`extract_node()`,`default_edge_attr()`,`default_node_attr()`和`default_graph_attr()`并使用它们显示树。 + +```py +def display_tree(derivation_tree, + log=False, + extract_node=extract_node, + node_attr=default_node_attr, + edge_attr=default_edge_attr, + graph_attr=default_graph_attr): + + # If we import display_tree, we also have to import its functions + from [graphviz](https://docs.python.org/3/library/graphviz.html) import Digraph + + counter = 0 + + def traverse_tree(dot, tree, id=0): + (symbol, children, annotation) = extract_node(tree, id) + node_attr(dot, id, symbol, annotation) + + if children: + for child in children: + nonlocal counter + counter += 1 + child_id = counter + edge_attr(dot, id, child_id) + traverse_tree(dot, child, child_id) + + dot = Digraph(comment="Derivation Tree") + graph_attr(dot) + traverse_tree(dot, derivation_tree) + if log: + print(dot) + return dot + +``` + +这是我们的树可视化为: + +```py +display_tree(derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 3 + 1->3 4 1->4 + +假设我们要自定义输出,并在其中注释某些节点和边。 这是一种方法`display_annotated_tree()`,它显示带注释的树结构,并从左到右放置图形。 + +```py +def display_annotated_tree(tree, a_nodes, a_edges, log=False): + def graph_attr(dot): + dot.attr('node', shape='plain') + dot.graph_attr['rankdir'] = 'LR' + + def annotate_node(dot, nid, symbol, ann): + if nid in a_nodes: + dot.node(repr(nid), "%s (%s)" % (dot_escape(unicode_escape(symbol)), a_nodes[nid])) + else: + dot.node(repr(nid), dot_escape(unicode_escape(symbol))) + + def annotate_edge(dot, start_node, stop_node): + if (start_node, stop_node) in a_edges: + dot.edge(repr(start_node), repr(stop_node), + a_edges[(start_node, stop_node)]) + else: + dot.edge(repr(start_node), repr(stop_node)) + + return display_tree(tree, log=log, + node_attr=annotate_node, + edge_attr=annotate_edge, + graph_attr=graph_attr) + +``` + +```py +display_annotated_tree(derivation_tree, {3: 'plus'}, {(1, 3): 'op'}, log=False) + +``` + +%3 0 1 0->1 2 1->2 3 +  (plus) 1->3 op 4 1->4 + +如果要查看树中的所有叶子节点,可以使用以下`all_terminals()`函数: + +```py +def all_terminals(tree): + (symbol, children) = tree + if children is None: + # This is a nonterminal symbol not expanded yet + return symbol + + if len(children) == 0: + # This is a terminal symbol + return symbol + + # This is an expanded symbol: + # Concatenate all terminal symbols from all children + return ''.join([all_terminals(c) for c in children]) + +``` + +```py +all_terminals(derivation_tree) + +``` + +```py +' + ' + +``` + +`all_terminals()`函数返回所有叶节点的字符串表示形式。 但是,其中一些叶节点可能是由于非终结符派生空字符串所致。 对于这些,我们要返回空字符串。 因此,我们定义了一个新函数`tree_to_string()`,可从树状结构中检索出原始字符串。 + +```py +def tree_to_string(tree): + symbol, children, *_ = tree + if children: + return ''.join(tree_to_string(c) for c in children) + else: + return '' if is_nonterminal(symbol) else symbol + +``` + +```py +tree_to_string(derivation_tree) + +``` + +```py +' + ' + +``` + +## 扩展节点 + +现在让我们开发一种算法,该算法采用带有未扩展符号的树(例如,上面的`derivation_tree`),然后依次扩展所有这些符号。 与早期的模糊测试类似,我们创建了`Fuzzer`的特殊子类-在本例中为`GrammarFuzzer`。 `GrammarFuzzer`得到一个语法和一个开始符号; 其他参数将在以后用于进一步控制创建并支持调试。 + +```py +from [Fuzzer](Fuzzer.html) import Fuzzer + +``` + +```py +class GrammarFuzzer(Fuzzer): + def __init__(self, grammar, start_symbol=START_SYMBOL, + min_nonterminals=0, max_nonterminals=10, disp=False, log=False): + """Produce strings from `grammar`, starting with `start_symbol`. + If `min_nonterminals` or `max_nonterminals` is given, use them as limits + for the number of nonterminals produced. + If `disp` is set, display the intermediate derivation trees. + If `log` is set, show intermediate steps as text on standard output.""" + + self.grammar = grammar + self.start_symbol = start_symbol + self.min_nonterminals = min_nonterminals + self.max_nonterminals = max_nonterminals + self.disp = disp + self.log = log + self.check_grammar() + +``` + +在下文中,我们将使用已经为[引入`MutationFuzzer`类](MutationFuzzer.html)的技巧,向`GrammarFuzzer`添加更多方法。 构造 + +```py +class GrammarFuzzer(GrammarFuzzer): + def new_method(self, args): + pass + +``` + +允许我们向`GrammarFuzzer`类添加新方法`new_method()`。 (实际上,我们得到了一个新的`GrammarFuzzer`类,该类扩展了旧的类,但是对于我们所有的目的,这都没有关系。) + +使用此技巧,让我们定义一个辅助方法`check_grammar()`,该方法检查给定语法的一致性: + +```py +class GrammarFuzzer(GrammarFuzzer): + def check_grammar(self): + assert self.start_symbol in self.grammar + assert is_valid_grammar( + self.grammar, + start_symbol=self.start_symbol, + supported_opts=self.supported_opts()) + + def supported_opts(self): + return set() + +``` + +现在让我们定义一个辅助方法`init_tree()`,该方法仅使用开始符号来构建树: + +```py +class GrammarFuzzer(GrammarFuzzer): + def init_tree(self): + return (self.start_symbol, None) + +``` + +```py +f = GrammarFuzzer(EXPR_GRAMMAR) +display_tree(f.init_tree()) + +``` + +%3 0 + +接下来,我们将需要一个辅助函数`expansion_to_children()`,它将展开字符串并将其分解为派生树列表-字符串中的每个符号(末端或非末端)一个。 它使用`re.split()`方法将扩展字符串拆分为子节点列表: + +```py +def expansion_to_children(expansion): + # print("Converting " + repr(expansion)) + # strings contains all substrings -- both terminals and nonterminals such + # that ''.join(strings) == expansion + + expansion = exp_string(expansion) + assert isinstance(expansion, str) + + if expansion == "": # Special case: epsilon expansion + return [("", [])] + + strings = re.split(RE_NONTERMINAL, expansion) + return [(s, None) if is_nonterminal(s) else (s, []) + for s in strings if len(s) > 0] + +``` + +```py +expansion_to_children(" + ") + +``` + +```py +[('', None), (' + ', []), ('', None)] + +``` + +*ε扩展*的情况,即像` ::=`一样扩展为空字符串需要特殊处理: + +```py +expansion_to_children("") + +``` + +```py +[('', [])] + +``` + +就像有关语法的[一章中的`nonterminals()`一样,我们提供了将来的扩展,使扩展成为具有额外数​​据的元组(将被忽略)。](Grammars.html) + +```py +expansion_to_children(("+", ["extra_data"])) + +``` + +```py +[('+', []), ('', None)] + +``` + +我们在`GrammarFuzzer`中将这种帮助器实现为一种方法,以便它可以被子类重载: + +```py +class GrammarFuzzer(GrammarFuzzer): + def expansion_to_children(self, expansion): + return expansion_to_children(expansion) + +``` + +这样,我们现在可以在树中获取一些未扩展的节点,选择随机扩展,然后返回新树。 这就是方法`expand_node_randomly()`的工作,它使用辅助函数`choose_node_expansion()`从可能的子级数组中随机选择一个索引。 (`choose_node_expansion()`可以在子类中重载。) + +```py +import [random](https://docs.python.org/3/library/random.html) + +``` + +```py +class GrammarFuzzer(GrammarFuzzer): + def choose_node_expansion(self, node, possible_children): + """Return index of expansion in `possible_children` to be selected. Defaults to random.""" + return random.randrange(0, len(possible_children)) + + def expand_node_randomly(self, node): + (symbol, children) = node + assert children is None + + if self.log: + print("Expanding", all_terminals(node), "randomly") + + # Fetch the possible expansions from grammar... + expansions = self.grammar[symbol] + possible_children = [self.expansion_to_children( + expansion) for expansion in expansions] + + # ... and select a random expansion + index = self.choose_node_expansion(node, possible_children) + chosen_children = possible_children[index] + + # Process children (for subclasses) + chosen_children = self.process_chosen_children(chosen_children, + expansions[index]) + + # Return with new children + return (symbol, chosen_children) + +``` + +通用的`expand_node()`方法可以稍后用于选择不同的扩展策略; 截至目前,它仅使用`expand_node_randomly()`。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def expand_node(self, node): + return self.expand_node_randomly(node) + +``` + +辅助功能`process_chosen_children()`不执行任何操作。 子类可以重载它,以处理选定的子项。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def process_chosen_children(self, chosen_children, expansion): + """Process children after selection. By default, does nothing.""" + return chosen_children + +``` + +`expand_node_randomly()`的工作方式如下: + +```py +f = GrammarFuzzer(EXPR_GRAMMAR, log=True) + +print("Before:") +tree = ("", None) +display_tree(tree) + +``` + +```py +Before: + +``` + +%3 0 + +```py +print("After:") +tree = f.expand_node_randomly(tree) +display_tree(tree) + +``` + +```py +After: +Expanding randomly + +``` + +%3 0 1 0->1 2 0->2 + +## 展开树 + +现在让我们将上述节点扩展应用于树中的某个节点。 为此,我们首先需要在树中搜索未扩展的节点。 `possible_expansions()`计算一棵树中有多少个未扩展符号: + +```py +class GrammarFuzzer(GrammarFuzzer): + def possible_expansions(self, node): + (symbol, children) = node + if children is None: + return 1 + + return sum(self.possible_expansions(c) for c in children) + +``` + +```py +f = GrammarFuzzer(EXPR_GRAMMAR) +print(f.possible_expansions(derivation_tree)) + +``` + +```py +2 + +``` + +如果树有任何未扩展的节点,则方法`any_possible_expansions()`返回True。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def any_possible_expansions(self, node): + (symbol, children) = node + if children is None: + return True + + return any(self.any_possible_expansions(c) for c in children) + +``` + +```py +f = GrammarFuzzer(EXPR_GRAMMAR) +f.any_possible_expansions(derivation_tree) + +``` + +```py +True + +``` + +`expand_tree_once()`是我们的树扩展算法的核心方法。 它首先检查它当前是否正在不扩展的情况下应用于非终端符号。 如果是这样,它将如上所述调用`expand_node()`。 + +如果该节点已经展开(即具有子节点),则检查仍具有未扩展符号的子节点的子集,随机选择其中一个,然后将其自身递归应用于该子节点。 + +`expand_tree_once()`方法在位置处替换子级*,这意味着它实际上使作为参数传递的树发生了变异,而不是返回新树。 这种原位突变使此功能特别有效。 同样,我们使用辅助方法(`choose_tree_expansion()`)从可以扩展的子级列表中返回所选索引。* + +```py +class GrammarFuzzer(GrammarFuzzer): + def choose_tree_expansion(self, tree, children): + """Return index of subtree in `children` to be selected for expansion. Defaults to random.""" + return random.randrange(0, len(children)) + + def expand_tree_once(self, tree): + """Choose an unexpanded symbol in tree; expand it. Can be overloaded in subclasses.""" + (symbol, children) = tree + if children is None: + # Expand this node + return self.expand_node(tree) + + # Find all children with possible expansions + expandable_children = [ + c for c in children if self.any_possible_expansions(c)] + + # `index_map` translates an index in `expandable_children` + # back into the original index in `children` + index_map = [i for (i, c) in enumerate(children) + if c in expandable_children] + + # Select a random child + child_to_be_expanded = \ + self.choose_tree_expansion(tree, expandable_children) + + # Expand in place + children[index_map[child_to_be_expanded]] = \ + self.expand_tree_once(expandable_children[child_to_be_expanded]) + + return tree + +``` + +让我们使用它,从上方扩展两次衍生树。 + +```py +derivation_tree = ("", + [("", + [("", None), + (" + ", []), + ("", None)] + )]) +display_tree(derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 3 + 1->3 4 1->4 + +```py +f = GrammarFuzzer(EXPR_GRAMMAR, log=True) +derivation_tree = f.expand_tree_once(derivation_tree) +display_tree(derivation_tree) + +``` + +```py +Expanding randomly + +``` + +%3 0 1 0->1 2 1->2 3 + 1->3 4 1->4 5 4->5 6 / 4->6 7 4->7 + +```py +derivation_tree = f.expand_tree_once(derivation_tree) +display_tree(derivation_tree) + +``` + +```py +Expanding randomly + +``` + +%3 0 1 0->1 2 1->2 6 + 1->6 7 1->7 3 2->3 4 + 2->4 5 2->5 8 7->8 9 / 7->9 10 7->10 + +我们看到,每一步都会扩展一个符号。 现在所有要做的就是一次又一次地应用它,使树越来越远。 + +## 关闭扩展 + +使用`expand_tree_once()`,我们可以继续扩展树–但是我们如何实际上停止? Luke在[ [Luke *等人*等,2000。](https://doi.org/10.1109/4235.873237)]中引入的关键思想是,在将派生树膨胀到某个最大大小之后,我们*只想应用 将树的大小增加最小的扩展*。 例如,对于``,我们希望将其扩展为``,因为这不会带来进一步的递归(和潜在的规模膨胀)。 对于``,同样,最好将其扩展为``,因为与``相比,树的大小增加较少。 + +为了确定扩展符号的*成本*,我们引入了两个相互依赖的函数: + +* `symbol_cost()`返回符号的所有扩展的最低成本,使用`expansion_cost()`计算每次扩展的成本。 +* `expansion_cost()`返回`expansions`中所有扩展的总和。 如果遍历过程中再次遇到非终结符,则扩展成本为$ \ infty $,表示(可能是无限的)递归。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def symbol_cost(self, symbol, seen=set()): + expansions = self.grammar[symbol] + return min(self.expansion_cost(e, seen | {symbol}) for e in expansions) + + def expansion_cost(self, expansion, seen=set()): + symbols = nonterminals(expansion) + if len(symbols) == 0: + return 1 # no symbol + + if any(s in seen for s in symbols): + return float('inf') + + # the value of a expansion is the sum of all expandable variables + # inside + 1 + return sum(self.symbol_cost(s, seen) for s in symbols) + 1 + +``` + +这里有两个示例:扩展数字的最低成本为1,因为我们必须从其扩展之一中进行选择。 + +```py +f = GrammarFuzzer(EXPR_GRAMMAR) +assert f.symbol_cost("") == 1 + +``` + +但是,扩展``的最小成本为5,因为这是所需的最小扩展数。 (`` $ \ rightarrow $ `` $ \ rightarrow $ `` $ \ rightarrow $ `` $ \ rightarrow $ `` $ \ rightarrow $ 1) + +```py +assert f.symbol_cost("") == 5 + +``` + +现在是`expand_node()`的变体,它考虑了上述成本。 它确定所有子项的最低成本`cost`,然后使用`choose`功能从列表中选择一个子项,默认情况下这是最低成本。 如果多个孩子都具有相同的最低费用,它将在这些孩子之间随机选择。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def expand_node_by_cost(self, node, choose=min): + (symbol, children) = node + assert children is None + + # Fetch the possible expansions from grammar... + expansions = self.grammar[symbol] + + possible_children_with_cost = [(self.expansion_to_children(expansion), + self.expansion_cost( + expansion, {symbol}), + expansion) + for expansion in expansions] + + costs = [cost for (child, cost, expansion) + in possible_children_with_cost] + chosen_cost = choose(costs) + children_with_chosen_cost = [child for (child, child_cost, _) in possible_children_with_cost + if child_cost == chosen_cost] + expansion_with_chosen_cost = [expansion for (_, child_cost, expansion) in possible_children_with_cost + if child_cost == chosen_cost] + + index = self.choose_node_expansion(node, children_with_chosen_cost) + + chosen_children = children_with_chosen_cost[index] + chosen_expansion = expansion_with_chosen_cost[index] + chosen_children = self.process_chosen_children( + chosen_children, chosen_expansion) + + # Return with a new list + return (symbol, chosen_children) + +``` + +快捷方式`expand_node_min_cost()`通过`min()`作为`choose`功能,从而使其以最小的成本扩展了节点。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def expand_node_min_cost(self, node): + if self.log: + print("Expanding", all_terminals(node), "at minimum cost") + + return self.expand_node_by_cost(node, min) + +``` + +现在,我们可以使用此函数来关闭派生树的扩展,将`expand_tree_once()`与上面的`expand_node_min_cost()`用作扩展函数。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def expand_node(self, node): + return self.expand_node_min_cost(node) + +``` + +```py +f = GrammarFuzzer(EXPR_GRAMMAR, log=True) +display_tree(derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 6 + 1->6 7 1->7 3 2->3 4 + 2->4 5 2->5 8 7->8 9 / 7->9 10 7->10 + +```py +if f.any_possible_expansions(derivation_tree): + derivation_tree = f.expand_tree_once(derivation_tree) + display_tree(derivation_tree) + +``` + +```py +Expanding at minimum cost + +``` + +```py +if f.any_possible_expansions(derivation_tree): + derivation_tree = f.expand_tree_once(derivation_tree) + display_tree(derivation_tree) + +``` + +```py +Expanding at minimum cost + +``` + +```py +if f.any_possible_expansions(derivation_tree): + derivation_tree = f.expand_tree_once(derivation_tree) + display_tree(derivation_tree) + +``` + +```py +Expanding at minimum cost + +``` + +我们一直在扩展,直到所有非终端都扩展了。 + +```py +while f.any_possible_expansions(derivation_tree): + derivation_tree = f.expand_tree_once(derivation_tree) + +``` + +```py +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost +Expanding at minimum cost + +``` + +这是最后一棵树: + +```py +display_tree(derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 15 + 1->15 16 1->16 3 2->3 8 + 2->8 9 2->9 4 3->4 5 4->5 6 5->6 7 7 6->7 10 9->10 11 10->11 12 11->12 13 12->13 14 2 13->14 17 16->17 21 / 16->21 22 16->22 18 17->18 19 18->19 20 8 19->20 23 22->23 24 23->24 25 24->25 26 1 25->26 + +我们看到,在每个步骤中,`expand_node_min_cost()`选择一个不增加符号数量的扩展,最终关闭所有打开的扩展。 + +## 节点膨胀 + +尤其是在扩展开始时,我们可能有兴趣让*尽可能多的节点* –也就是说,我们希望扩展使*的更多*非终端扩展。 实际上,这与`expand_node_min_cost()`所提供的完全相反,我们可以实现一种`expand_node_max_cost()`方法,该方法将始终在*成本最高*的节点之间进行选择: + +```py +class GrammarFuzzer(GrammarFuzzer): + def expand_node_max_cost(self, node): + if self.log: + print("Expanding", all_terminals(node), "at maximum cost") + + return self.expand_node_by_cost(node, max) + +``` + +为了说明`expand_node_max_cost()`,我们可以再次重新定义`expand_node()`以使用它,然后使用`expand_tree_once()`显示一些扩展步骤: + +```py +class GrammarFuzzer(GrammarFuzzer): + def expand_node(self, node): + return self.expand_node_max_cost(node) + +``` + +```py +derivation_tree = ("", + [("", + [("", None), + (" + ", []), + ("", None)] + )]) + +``` + +```py +f = GrammarFuzzer(EXPR_GRAMMAR, log=True) +display_tree(derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 3 + 1->3 4 1->4 + +```py +if f.any_possible_expansions(derivation_tree): + derivation_tree = f.expand_tree_once(derivation_tree) + display_tree(derivation_tree) + +``` + +```py +Expanding at maximum cost + +``` + +```py +if f.any_possible_expansions(derivation_tree): + derivation_tree = f.expand_tree_once(derivation_tree) + display_tree(derivation_tree) + +``` + +```py +Expanding at maximum cost + +``` + +```py +if f.any_possible_expansions(derivation_tree): + derivation_tree = f.expand_tree_once(derivation_tree) + display_tree(derivation_tree) + +``` + +```py +Expanding at maximum cost + +``` + +我们看到,每一步,非末端的数量都会增加。 显然,我们必须对此数字进行限制。 + +## 三个扩展阶段 + +现在,我们可以将所有三个阶段放到一个函数`expand_tree()`中,该函数的工作方式如下: + +1. **最大成本扩展。** 使用扩展以最大的代价扩展树,直到我们至少拥有`min_nonterminals`个非终结点。 通过将`min_nonterminals`设置为零,可以轻松跳过此阶段。 +2. **随机扩展。** 继续随机扩展树,直到我们到达`max_nonterminals`非终结点为止。 +3. **最低成本扩展。** 以最小的成本关闭扩展。 + +我们通过使`expand_node`引用要应用的扩展方法来实现这三个阶段。 通过先将`expand_node`(方法参考)设置为`expand_node_max_cost`(即,调用`expand_node()`会调用`expand_node_max_cost()`),然后是`expand_node_randomly`,最后是`expand_node_min_cost`来控制。 在前两个阶段,我们还分别设置了`min_nonterminals`和`max_nonterminals`的最大限制。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def log_tree(self, tree): + """Output a tree if self.log is set; if self.display is also set, show the tree structure""" + if self.log: + print("Tree:", all_terminals(tree)) + if self.disp: + display(display_tree(tree)) + # print(self.possible_expansions(tree), "possible expansion(s) left") + + def expand_tree_with_strategy(self, tree, expand_node_method, limit=None): + """Expand tree using `expand_node_method` as node expansion function + until the number of possible expansions reaches `limit`.""" + self.expand_node = expand_node_method + while ((limit is None + or self.possible_expansions(tree) < limit) + and self.any_possible_expansions(tree)): + tree = self.expand_tree_once(tree) + self.log_tree(tree) + return tree + + def expand_tree(self, tree): + """Expand `tree` in a three-phase strategy until all expansions are complete.""" + self.log_tree(tree) + tree = self.expand_tree_with_strategy( + tree, self.expand_node_max_cost, self.min_nonterminals) + tree = self.expand_tree_with_strategy( + tree, self.expand_node_randomly, self.max_nonterminals) + tree = self.expand_tree_with_strategy( + tree, self.expand_node_min_cost) + + assert self.possible_expansions(tree) == 0 + + return tree + +``` + +让我们在我们的示例中尝试一下。 + +```py +derivation_tree = ("", + [("", + [("", None), + (" + ", []), + ("", None)] + )]) + +f = GrammarFuzzer( + EXPR_GRAMMAR, + min_nonterminals=3, + max_nonterminals=5, + log=True) +derivation_tree = f.expand_tree(derivation_tree) + +``` + +```py +Tree: + +Expanding at maximum cost +Tree: + + +Expanding randomly +Tree: + + +Expanding randomly +Tree: + + +Expanding randomly +Tree: + - + +Expanding randomly +Tree: + * - + +Expanding at minimum cost +Tree: + * - + +Expanding at minimum cost +Tree: + * - + +Expanding at minimum cost +Tree: + * - + +Expanding at minimum cost +Tree: + * - + +Expanding at minimum cost +Tree: + * - + 1 +Expanding at minimum cost +Tree: + * - + 1 +Expanding at minimum cost +Tree: + * - + 1 +Expanding at minimum cost +Tree: 8 + * - + 1 +Expanding at minimum cost +Tree: 8 + * - + 1 +Expanding at minimum cost +Tree: 8 + * - + 1 +Expanding at minimum cost +Tree: 8 + * - + 1 +Expanding at minimum cost +Tree: 8 + * - + 1 +Expanding at minimum cost +Tree: 8 + * - + 1 +Expanding at minimum cost +Tree: 8 + * - + 1 +Expanding at minimum cost +Tree: 8 + * - + 1 +Expanding at minimum cost +Tree: 8 + 8 * - + 1 +Expanding at minimum cost +Tree: 8 + 8 * - 1 + 1 +Expanding at minimum cost +Tree: 8 + 8 * 2 - 1 + 1 + +``` + +```py +display_tree(derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 28 + 1->28 29 1->29 3 2->3 8 + 2->8 9 2->9 4 3->4 5 4->5 6 5->6 7 8 6->7 10 9->10 21 - 9->21 22 9->22 11 10->11 15 * 10->15 16 10->16 12 11->12 13 12->13 14 8 13->14 17 16->17 18 17->18 19 18->19 20 2 19->20 23 22->23 24 23->24 25 24->25 26 25->26 27 1 26->27 30 29->30 31 30->31 32 31->32 33 1 32->33 + +```py +all_terminals(derivation_tree) + +``` + +```py +'8 + 8 * 2 - 1 + 1' + +``` + +## 全部放在一起 + +基于此,我们现在可以定义一个函数`fuzz()`,它像`simple_grammar_fuzzer()`一样简单地采用语法并从中产生一个字符串。 因此,它不再暴露出派生树的复杂性。 + +```py +class GrammarFuzzer(GrammarFuzzer): + def fuzz_tree(self): + # Create an initial derivation tree + tree = self.init_tree() + # print(tree) + + # Expand all nonterminals + tree = self.expand_tree(tree) + if self.log: + print(repr(all_terminals(tree))) + if self.disp: + display(display_tree(tree)) + return tree + + def fuzz(self): + self.derivation_tree = self.fuzz_tree() + return all_terminals(self.derivation_tree) + +``` + +现在,我们可以将其应用到所有定义的语法中(并可视化派生树) + +```py +f = GrammarFuzzer(EXPR_GRAMMAR) +f.fuzz() + +``` + +```py +'(4 + 8) + -4 / 6 * +3 / 3 / 0 + 8 * 5 + 8' + +``` + +调用`fuzz()`之后,可以在`derivation_tree`属性中访问生成的派生树: + +```py +display_tree(f.derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 19 + 1->19 20 1->20 3 2->3 4 ( 3->4 5 3->5 18 ) 3->18 6 5->6 11 + 5->11 12 5->12 7 6->7 8 7->8 9 8->9 10 4 9->10 13 12->13 14 13->14 15 14->15 16 15->16 17 8 16->17 21 20->21 54 + 20->54 55 20->55 22 21->22 28 / 21->28 29 21->29 23 - 22->23 24 22->24 25 24->25 26 25->26 27 4 26->27 30 29->30 34 * 29->34 35 29->35 31 30->31 32 31->32 33 6 32->33 36 35->36 42 / 35->42 43 35->43 37 + 36->37 38 36->38 39 38->39 40 39->40 41 3 40->41 44 43->44 48 / 43->48 49 43->49 45 44->45 46 45->46 47 3 46->47 50 49->50 51 50->51 52 51->52 53 0 52->53 56 55->56 67 + 55->67 68 55->68 57 56->57 61 * 56->61 62 56->62 58 57->58 59 58->59 60 8 59->60 63 62->63 64 63->64 65 64->65 66 5 65->66 69 68->69 70 69->70 71 70->71 72 71->72 73 8 72->73 + +让我们尝试其他语法格式的语法模糊器(及其树)。 + +```py +f = GrammarFuzzer(URL_GRAMMAR) +f.fuzz() + +``` + +```py +'https://user:password@www.google.com?def=6' + +``` + +```py +display_tree(f.derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 4 :// 1->4 5 1->5 11 1->11 13 1->13 3 https 2->3 6 5->6 8 @ 5->8 9 5->9 7 user:password 6->7 10 www.google.com 9->10 12 11->12 14 ? 13->14 15 13->15 16 15->16 17 16->17 19 = 16->19 20 16->20 18 def 17->18 21 20->21 22 6 21->22 + +```py +f = GrammarFuzzer(CGI_GRAMMAR, min_nonterminals=3, max_nonterminals=5) +f.fuzz() + +``` + +```py +'c%2b%f2' + +``` + +```py +display_tree(f.derivation_tree) + +``` + +%3 0 1 0->1 2 1->2 5 1->5 3 2->3 4 c 3->4 6 5->6 13 5->13 7 6->7 8 % 7->8 9 7->9 11 7->11 10 2 9->10 12 b 11->12 14 13->14 15 14->15 16 % 15->16 17 15->17 19 15->19 18 f 17->18 20 2 19->20 + +我们如何对抗`simple_grammar_fuzzer()`? + +```py +trials = 50 +xs = [] +ys = [] +f = GrammarFuzzer(EXPR_GRAMMAR, max_nonterminals=20) +for i in range(trials): + with Timer() as t: + s = f.fuzz() + xs.append(len(s)) + ys.append(t.elapsed_time()) + print(i, end=" ") +print() + +``` + +```py +0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 + +``` + +```py +average_time = sum(ys) / trials +print("Average time:", average_time) + +``` + +```py +Average time: 0.05556378066001343 + +``` + +```py +%matplotlib inline + +import [matplotlib.pyplot](https://docs.python.org/3/library/matplotlib.pyplot.html) as [plt](https://docs.python.org/3/library/plt.html) +plt.scatter(xs, ys) +plt.title('Time required for generating an output') + +``` + +```py +Text(0.5,1,'Time required for generating an output') + +``` + +![]( +) + +我们的测试生成速度要快得多,但输入的内容也要小得多。 我们看到,使用派生树,我们可以更好地控制语法产生。 + +最后,在`simple_grammar_fuzzer()`失败的情况下`GrammarFuzzer`如何与`expr_grammar`一起工作? 它可以正常工作: + +```py +f = GrammarFuzzer(expr_grammar, max_nonterminals=10) +f.fuzz() + +``` + +```py +'((1 + 9) / 2 * 2 / 7 * 3 - 3.1 / 4) * -0' + +``` + +有了`GrammarFuzzer`,我们现在有了坚实的基础,可以在此基础上构建更多的模糊测试器,并从生成软件测试的世界中说明更多令人兴奋的概念。 其中许多甚至不需要编写语法-而是*从当前域中推断*语法,因此即使不编写语法也可以使用基于语法的模糊测试。 敬请关注! + +## 经验教训 + +* *派生树*对于表达输入结构很重要 +* *基于派生树的语法模糊处理* + 1. 比基于字符串的语法模糊测试效率更高, + 2. 更好地控制输入生成,并且 + 3. 有效避免遇到无限扩展。 + +## 后续步骤 + +恭喜你! 您已经达到本书的中心“枢纽”之一。 从这里开始,有大量基于语法模糊的技术。 + +### 扩展语法 + +首先,我们有许多技术可以使所有*以某种形式扩展*语法: + +* [解析和重新组合输入](Parser.html)允许使用现有输入,再次使用派生树 +* [覆盖语法扩展](GrammarCoverageFuzzer.html)允许*组合*覆盖 +* [将*概率*分配给各个扩展](ProbabilisticGrammarFuzzer.html)可对扩展进行额外控制 +* [将*约束*分配给单个扩展](GeneratorGrammarFuzzer.html)允许在单个规则上表达*语义约束*。 + +### 应用语法 + +其次,我们可以*在各种涉及自动学习某种形式的上下文中应用*语法: + +* [模糊化API](APIFuzzer.html) ,从API学习语法 +* [模糊化图形用户界面](WebFuzzer.html),从用户界面中学习语法以进行后续模糊测试 +* [挖掘语法](GrammarMiner.html),学习任意输入格式的语法 + +继续扩大! + +## 背景 + +派生树(通常称为*解析树*)是一种标准数据结构,*解析器*将其分解为输入。 *龙书*(也称为*编译器:原理,技术和工具*)[ [Aho *等人*,2006。](https://www.pearson.com/us/higher-education/program/Aho-Compilers-Principles-Techniques-and-Tools-2nd-Edition/PGM167067.html)讨论了解析。 进入派生树作为编译程序的一部分。 在解析和重组输入时,我们也使用派生树[。](Parser.html) + +本章的主要思想,即扩展到达到符号的限制,然后总是选择最短的路径,源于Luke [ [Luke *等人*,2000。](https://doi.org/10.1109/4235.873237)]。 + +## 练习 + +### 练习1:缓存方法结果 + +跟踪`GrammarFuzzer`表明,某些方法总是以相同的值反复调用。 + +用*缓存*设置类`FasterGrammarFuzzer`,该类检查该方法是否之前已被调用,如果已调用过,则返回先前计算的“记忆”值。 对`expansion_to_children()`执行此操作。 比较优化前后的调用次数。 + +**重要**:对于`expansion_to_children()`,请确保返回的每个列表都是一个单独的副本。 如果返回相同(缓存的)列表,则将干扰`GrammarFuzzer`的就地修改。 为此,请使用Python `copy.deepcopy()`函数。 + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/GrammarFuzzer.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习2:语法预编译 + +某些方法(例如`symbol_cost()`或`expansion_cost()`)返回的值仅取决于语法。 设置一个`EvenFasterGrammarFuzzer()`类,该类在初始化时会预先计算一次这些值,以便以后`symbol_cost()`或`expansion_cost()`的调用仅需要查找这些值。 + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/GrammarFuzzer.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习3:维护要扩展的树 + +在`expand_tree_once()`中,该算法一次又一次遍历树以查找仍可以扩展的非终结点。 通过在树中保留一系列仍可以扩展的非终止符号来加快处理速度。 + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/GrammarFuzzer.ipynb#Exercises) to work on the exercises and see solutions. + +### 练习4:备用随机扩展 + +我们可以定义`expand_node_randomly()`使其仅调用`expand_node_by_cost(node, random.choice)`: + +```py +class ExerciseGrammarFuzzer(GrammarFuzzer): + def expand_node_randomly(self, node): + if self.log: + print("Expanding", all_terminals(node), "randomly by cost") + + return self.expand_node_by_cost(node, random.choice) + +``` + +原始实施和此替代之间有什么区别? + +[Use the notebook](https://mybinder.org/v2/gh/uds-se/fuzzingbook/master?filepath=docs/notebooks/GrammarFuzzer.ipynb#Exercises) to work on the exercises and see solutions. \ No newline at end of file diff --git a/new/fuzzing-book-zh/17.md b/new/fuzzing-book-zh/17.md new file mode 100644 index 0000000000000000000000000000000000000000..97f70c5886122e4d20c5193df5d4a7fd3e0d1304 --- /dev/null +++ b/new/fuzzing-book-zh/17.md @@ -0,0 +1,1566 @@ +# 语法覆盖率 + +> 原文: [https://www.fuzzingbook.org/html/GrammarCoverageFuzzer.html](https://www.fuzzingbook.org/html/GrammarCoverageFuzzer.html) + +[从语法](GrammarFuzzer.html)中产生输入时,规则的所有可能扩展都具有相同的可能性。 然而,对于产生一个全面的测试套件,使*品种*最大化是更有意义的-例如,不要一遍又一遍地重复相同的扩展。 在本章中,我们探索如何系统地*覆盖语法的*元素,以使我们最大限度地提高多样性并且不会漏掉单个元素。 + +**前提条件** + +* 您应该阅读语法的[一章。](Grammars.html) +* 您应该已经阅读[关于有效语法模糊](GrammarFuzzer.html)的章节。 + +## 内容提要 + +要使用本章中提供的代码来[,请编写](Importing.html) + +```py +>>> from [fuzzingbook.GrammarCoverageFuzzer](GrammarCoverageFuzzer.html) import + +``` + +然后利用以下功能。 + +本章介绍`GrammarCoverageFuzzer`,这是一种有效的语法模糊器,它是从[这一章中对有效语法模糊](GrammarFuzzer.html)进行扩展的。 它努力至少覆盖一次所有扩展。 例如,在下面的示例中,区号中的所有数字都不同,行号中的数字也都不同: + +```py +>>> from [Grammars](Grammars.html) import US_PHONE_GRAMMAR +>>> phone_fuzzer = GrammarCoverageFuzzer(US_PHONE_GRAMMAR) +>>> phone_fuzzer.fuzz() +'(521)383-0695' + +``` + +模糊处理后,`expansion_coverage()`方法返回所涵盖的语法扩展的映射。 + +```py +>>> phone_fuzzer.expansion_coverage() +{' -> ', + ' -> 0', + ' -> 1', + ' -> 2', + ' -> 3', + ' -> 5', + ' -> 6', + ' -> 8', + ' -> 9', + ' -> ', + ' -> 3', + ' -> 5', + ' -> ', + ' -> ()-', + ' -> '} + +``` + +随后对`fuzz()`的呼叫将进一步覆盖(例如,覆盖其他区号)。 重新调用`reset()`会清除记录的覆盖范围。 + +由于输入中的此类覆盖范围还会产生更高的代码覆盖范围,因此`GrammarCoverageFuzzer`是`GrammarFuzzer`的推荐扩展。 + +## 覆盖语法元素 + +测试生成的目的是涵盖程序的所有功能-当然希望包括失败的功能。 但是,此功能与输入的结构相关:如果我们无法生成某些输入元素,则也不会触发相关的代码和功能,从而减少了在其中查找错误的机会。 + +例如,请考虑语法[一章中的表达语法`EXPR_GRAMMAR`。](Grammars.html) 。 如果我们不产生负数,那么将不会测试负数。 如果我们不产生浮点数,那么将不会测试浮点数。 因此,我们的目标必须是*涵盖所有可能的扩展*。 + +最大化这种多样性的一种方法是*跟踪*在语法生成过程中发生的扩展:如果我们已经看到了某种扩展,则可以从可能的扩展集中选择其他可能的扩展候选。 在我们的表达语法中考虑以下规则: + +```py +import [fuzzingbook_utils](https://github.com/uds-se/fuzzingbook/tree/master/notebooks/fuzzingbook_utils) + +``` + +```py +from [Grammars](Grammars.html) import EXPR_GRAMMAR, CGI_GRAMMAR, URL_GRAMMAR, START_SYMBOL +from [Grammars](Grammars.html) import is_valid_grammar, extend_grammar + +``` + +```py +EXPR_GRAMMAR[""] + +``` + +```py +['+', '-', '()', '.', ''] + +``` + +假设我们已经在``的第一个扩展中产生了``。 在扩展下一个因子时,我们将标记``扩展已被覆盖,并选择尚未发现的替代方法之一,例如`-`(负数)或`.`(浮点数) 。 只有涵盖了所有替代方案后,我们才可以重新考虑以前涵盖的扩展。 + +### 跟踪语法覆盖率 + +*语法覆盖率*的概念非常容易实现。 我们引入了一个`GrammarCoverageFuzzer`类,该类跟踪当前已实现的语法覆盖率: + +```py +from [GrammarFuzzer](GrammarFuzzer.html) import GrammarFuzzer, all_terminals, nonterminals, display_tree + +``` + +```py +import [random](https://docs.python.org/3/library/random.html) + +``` + +```py +class TrackingGrammarCoverageFuzzer(GrammarFuzzer): + def __init__(self, *args, **kwargs): + # invoke superclass __init__(), passing all arguments + super().__init__(*args, **kwargs) + self.reset_coverage() + + def reset_coverage(self): + self.covered_expansions = set() + + def expansion_coverage(self): + return self.covered_expansions + +``` + +在这组`covered_expansions`中,我们使用函数`expansion_key()`为该对生成一个字符串表示形式,将各个扩展存储为成对的[*符号*,*扩展*)。 + +```py +def expansion_key(symbol, expansion): + """Convert (symbol, children) into a key. `children` can be an expansion string or a derivation tree.""" + if isinstance(expansion, tuple): + expansion = expansion[0] + if not isinstance(expansion, str): + children = expansion + expansion = all_terminals((symbol, children)) + return symbol + " -> " + expansion + +``` + +```py +expansion_key(START_SYMBOL, EXPR_GRAMMAR[START_SYMBOL][0]) + +``` + +```py +' -> ' + +``` + +除了*扩展*之外,我们还可以传递一个子代列表作为参数,然后将其自动转换为字符串。 + +```py +children = [("", None), (" + ", []), ("", None)] +expansion_key("", children) + +``` + +```py +' -> + ' + +``` + +我们可以通过列举所有扩展来计算语法中可能的扩展集。 方法`max_expansion_coverage()`从给定符号(默认:语法开始符号)开始递归遍历语法,并将所有扩展累积在`expansions`中。 使用`max_depth`参数(默认值:$ \ infty $),我们可以控制语法探索的深度。 在本章的后面,我们将需要它。 + +```py +class TrackingGrammarCoverageFuzzer(TrackingGrammarCoverageFuzzer): + def _max_expansion_coverage(self, symbol, max_depth): + if max_depth <= 0: + return set() + + self._symbols_seen.add(symbol) + + expansions = set() + for expansion in self.grammar[symbol]: + expansions.add(expansion_key(symbol, expansion)) + for nonterminal in nonterminals(expansion): + if nonterminal not in self._symbols_seen: + expansions |= self._max_expansion_coverage( + nonterminal, max_depth - 1) + + return expansions + + def max_expansion_coverage(self, symbol=None, max_depth=float('inf')): + """Return set of all expansions in a grammar starting with `symbol`""" + if symbol is None: + symbol = self.start_symbol + + self._symbols_seen = set() + cov = self._max_expansion_coverage(symbol, max_depth) + + if symbol == START_SYMBOL: + assert len(self._symbols_seen) == len(self.grammar) + + return cov + +``` + +我们可以使用`max_expansion_coverage()`来计算表达式语法中的所有扩展: + +```py +expr_fuzzer = TrackingGrammarCoverageFuzzer(EXPR_GRAMMAR) +expr_fuzzer.max_expansion_coverage() + +``` + +```py +{' -> 0', + ' -> 1', + ' -> 2', + ' -> 3', + ' -> 4', + ' -> 5', + ' -> 6', + ' -> 7', + ' -> 8', + ' -> 9', + ' -> ', + ' -> + ', + ' -> - ', + ' -> ()', + ' -> +', + ' -> -', + ' -> ', + ' -> .', + ' -> ', + ' -> ', + ' -> ', + ' -> ', + ' -> * ', + ' -> / '} + +``` + +在扩展过程中,我们可以跟踪看到的扩展。 为此,我们使用`choose_node_expansion()`方法,在[语法模糊器](GrammarFuzzer.html)中扩展单个节点。 + +```py +class TrackingGrammarCoverageFuzzer(TrackingGrammarCoverageFuzzer): + def add_coverage(self, symbol, new_children): + key = expansion_key(symbol, new_children) + + if self.log and key not in self.covered_expansions: + print("Now covered:", key) + self.covered_expansions.add(key) + + def choose_node_expansion(self, node, possible_children): + (symbol, children) = node + index = super().choose_node_expansion(node, possible_children) + self.add_coverage(symbol, possible_children[index]) + return index + +``` + +方法`missing_expansion_coverage()`是一个辅助方法,它返回仍然必须涵盖的扩展: + +```py +class TrackingGrammarCoverageFuzzer(TrackingGrammarCoverageFuzzer): + def missing_expansion_coverage(self): + return self.max_expansion_coverage() - self.expansion_coverage() + +``` + +让我们展示跟踪的工作原理。 为简单起见,让我们仅关注``扩展。 + +```py +digit_fuzzer = TrackingGrammarCoverageFuzzer( + EXPR_GRAMMAR, start_symbol="", log=True) +digit_fuzzer.fuzz() + +``` + +```py +Tree: +Expanding randomly +Now covered: -> 9 +Tree: 9 +'9' + +``` + +```py +'9' + +``` + +```py +digit_fuzzer.fuzz() + +``` + +```py +Tree: +Expanding randomly +Now covered: -> 0 +Tree: 0 +'0' + +``` + +```py +'0' + +``` + +```py +digit_fuzzer.fuzz() + +``` + +```py +Tree: +Expanding randomly +Now covered: -> 5 +Tree: 5 +'5' + +``` + +```py +'5' + +``` + +到目前为止,这是一组涵盖的扩展: + +```py +digit_fuzzer.expansion_coverage() + +``` + +```py +{' -> 0', ' -> 5', ' -> 9'} + +``` + +这是我们可以涵盖的所有扩展的集合: + +```py +digit_fuzzer.max_expansion_coverage() + +``` + +```py +{' -> 0', + ' -> 1', + ' -> 2', + ' -> 3', + ' -> 4', + ' -> 5', + ' -> 6', + ' -> 7', + ' -> 8', + ' -> 9'} + +``` + +这是缺少的覆盖范围: + +```py +digit_fuzzer.missing_expansion_coverage() + +``` + +```py +{' -> 1', + ' -> 2', + ' -> 3', + ' -> 4', + ' -> 6', + ' -> 7', + ' -> 8'} + +``` + +平均来说,在涵盖所有扩展之后,我们必须产生多少个字符? + +```py +def average_length_until_full_coverage(fuzzer): + trials = 50 + + sum = 0 + for trial in range(trials): + # print(trial, end=" ") + fuzzer.reset_coverage() + while len(fuzzer.missing_expansion_coverage()) > 0: + s = fuzzer.fuzz() + sum += len(s) + + return sum / trials + +``` + +```py +digit_fuzzer.log = False +average_length_until_full_coverage(digit_fuzzer) + +``` + +```py +28.4 + +``` + +对于完整表达式,这需要更长的时间: + +```py +expr_fuzzer = TrackingGrammarCoverageFuzzer(EXPR_GRAMMAR) +average_length_until_full_coverage(expr_fuzzer) + +``` + +```py +138.12 + +``` + +### 覆盖语法扩展 + +现在让我们不仅跟踪覆盖范围,而且实际上*产生*覆盖范围。 这个想法如下: + +1. 我们确定尚未发现的孩子(在`uncovered_children`中) +2. 如果所有孩子都被覆盖,我们将退回到原始方法(即,随机选择一个扩展) +3. 否则,我们从未发现的孩子中选择一个孩子,并将其标记为覆盖。 + +为此,我们引入了一个新的模糊器`SimpleGrammarCoverageFuzzer`,它在`choose_node_expansion()`方法中实现了该策略。 + +```py +class SimpleGrammarCoverageFuzzer(TrackingGrammarCoverageFuzzer): + def choose_node_expansion(self, node, possible_children): + # Prefer uncovered expansions + (symbol, children) = node + uncovered_children = [c for (i, c) in enumerate(possible_children) + if expansion_key(symbol, c) not in self.covered_expansions] + index_map = [i for (i, c) in enumerate(possible_children) + if c in uncovered_children] + + if len(uncovered_children) == 0: + # All expansions covered - use superclass method + return self.choose_covered_node_expansion(node, possible_children) + + # Select from uncovered nodes + index = self.choose_uncovered_node_expansion(node, uncovered_children) + + return index_map[index] + +``` + +为子类提供了两种方法`choose_covered_node_expansion()`和`choose_uncovered_node_expansion()`: + +```py +class SimpleGrammarCoverageFuzzer(SimpleGrammarCoverageFuzzer): + def choose_uncovered_node_expansion(self, node, possible_children): + return TrackingGrammarCoverageFuzzer.choose_node_expansion( + self, node, possible_children) + + def choose_covered_node_expansion(self, node, possible_children): + return TrackingGrammarCoverageFuzzer.choose_node_expansion( + self, node, possible_children) + +``` + +通过返回到目前为止涵盖的扩展集,我们可以多次调用模糊器,每次都增加语法覆盖率。 例如,使用`EXPR_GRAMMAR`语法产生数字,模糊器产生的数字比另一数字大: + +```py +f = SimpleGrammarCoverageFuzzer(EXPR_GRAMMAR, start_symbol="") +f.fuzz() + +``` + +```py +'5' + +``` + +```py +f.fuzz() + +``` + +```py +'2' + +``` + +```py +f.fuzz() + +``` + +```py +'1' + +``` + +Here's the set of covered expansions so far: + +```py +f.expansion_coverage() + +``` + +```py +{' -> 1', ' -> 2', ' -> 5'} + +``` + +让我们再模糊一些。 我们看到,每次迭代都覆盖了另一个扩展: + +```py +for i in range(7): + print(f.fuzz(), end=" ") + +``` + +```py +0 9 7 4 8 3 6 + +``` + +最后,涵盖所有扩展: + +```py +f.missing_expansion_coverage() + +``` + +```py +set() + +``` + +让我们将其应用于更复杂的语法-例如,完整表达语法。 我们看到,经过几次迭代,我们涵盖了每个数字,运算符和扩展: + +```py +f = SimpleGrammarCoverageFuzzer(EXPR_GRAMMAR) +for i in range(10): + print(f.fuzz()) + +``` + +```py ++(0.31 / (5) / 9 + 4 * 6 / 3 - 8 - 7) * -2 ++++2 / 87360 +((4) * 0 - 1) / -9.6 + 7 / 6 + 1 * 8 + 7 * 8 +++++26 / -64.45 +(8 / 1 / 6 + 9 + 7 + 8) * 1.1 / 0 * 1 +7.7 +++(3.5 / 3) - (-4 + 3) / (8 / 0) / -4 * 2 / 1 ++(90 / --(28 * 8 / 5 + 5 / (5 / 8))) - +9.36 / 2.5 * (5 * (7 * 6 * 5) / 8) +9.11 / 7.28 +1 / (9 - 5 * 6) / 6 / 7 / 7 + 1 + 1 - 7 * -3 + +``` + +同样,所有扩展都包括在内: + +```py +f.missing_expansion_coverage() + +``` + +```py +set() + +``` + +我们看到,与随机方法相比,我们的策略在实现覆盖率方面更为有效: + +```py +average_length_until_full_coverage(SimpleGrammarCoverageFuzzer(EXPR_GRAMMAR)) + +``` + +```py +52.28 + +``` + +## 远见卓识 + +为单个规则选择扩展是一个好的开始; 但是,如下面的示例所示,这还不够。 我们将覆盖范围的[一章应用于CGI语法的覆盖范围模糊器:](Coverage.html) + +```py +CGI_GRAMMAR + +``` + +```py +{'': [''], + '': ['', ''], + '': ['', '', ''], + '': ['+'], + '': ['%'], + '': ['0', + '1', + '2', + '3', + '4', + '5', + '6', + '7', + '8', + '9', + 'a', + 'b', + 'c', + 'd', + 'e', + 'f'], + '': ['0', '1', '2', '3', '4', '5', 'a', 'b', 'c', 'd', 'e', '-', '_']} + +``` + +```py +f = SimpleGrammarCoverageFuzzer(CGI_GRAMMAR) +for i in range(10): + print(f.fuzz()) + +``` + +```py +c ++%a6++ ++- ++ +++ +%18%b7 ++e +_ +d2+%e3 +%d0 + +``` + +经过10次迭代,我们仍然发现了许多扩展: + +```py +f.missing_expansion_coverage() + +``` + +```py +{' -> 2', + ' -> 4', + ' -> 5', + ' -> 9', + ' -> c', + ' -> f', + ' -> 0', + ' -> 1', + ' -> 3', + ' -> 4', + ' -> 5', + ' -> a', + ' -> b'} + +``` + +为什么会这样? 问题在于,在CGI语法中,`hexdigit`规则中要涵盖的变体数量最多。 但是,我们首先需要*达到*这种扩展。 扩展``符号时,我们可以在三种可能的扩展之间进行选择: + +```py +CGI_GRAMMAR[""] + +``` + +```py +['', '', ''] + +``` + +如果已经涵盖了所有三个扩展,则上面的`choose_node_expansion()`将随机选择一个-即使选择``时可能需要覆盖更多扩展。 + +我们需要的是一个更好的策略,如果后续有更多未发现的扩展,即使``被覆盖,也将选择``。 W. Burkhardt [ [Burkhardt *等人*,1967。](https://doi.org/10.1007/BF02235512)]首先以“最短路径选择”的名称讨论了这种策略: + +> 此版本从几种开发选择中选择了该语法单元,该语法单元从最短路径开始仍然有一个未使用的单元。 + +这是我们将在后续步骤中实现的。 + +### 确定每个符号的最大覆盖范围 + +为了解决此问题,我们引入了一个基于`SimpleGrammarCoverageFuzzer`的新类`GrammarCoverageFuzzer`,但具有更好的策略。 首先,我们需要计算从特定符号可以达到的*最大扩展集*,正如我们已经在`max_expansion_coverage()`中实现的那样。 我们的想法是稍后计算该集合的*交集*和已经涵盖的展开,以便我们可以偏爱带有非空交集的那些展开。 + +第一步-计算符号可以达到的最大扩展集-已经实现。 通过将`symbol`参数传递给`max_expansion_coverage()`,我们可以计算每个符号的可能扩展: + +```py +f = SimpleGrammarCoverageFuzzer(EXPR_GRAMMAR) +f.max_expansion_coverage('') + +``` + +```py +{' -> 0', + ' -> 1', + ' -> 2', + ' -> 3', + ' -> 4', + ' -> 5', + ' -> 6', + ' -> 7', + ' -> 8', + ' -> 9', + ' -> ', + ' -> '} + +``` + +```py +f.max_expansion_coverage('') + +``` + +```py +{' -> 0', + ' -> 1', + ' -> 2', + ' -> 3', + ' -> 4', + ' -> 5', + ' -> 6', + ' -> 7', + ' -> 8', + ' -> 9'} + +``` + +### 确定尚未发现的孩子 + +现在我们可以开始实现`GrammarCoverageFuzzer`。 计算`max_expansion_coverage()`可以让我们确定每个孩子的*失踪覆盖率*。 为此,我们*从可以获得的覆盖范围中减去*已经看到的覆盖范围(`expansion_coverage()`)。 + +```py +class GrammarCoverageFuzzer(SimpleGrammarCoverageFuzzer): + def _new_child_coverage(self, children, max_depth): + new_cov = set() + for (c_symbol, _) in children: + if c_symbol in self.grammar: + new_cov |= self.max_expansion_coverage( + c_symbol, max_depth) + return new_cov + + def new_child_coverage(self, symbol, children, max_depth=float('inf')): + """Return new coverage that would be obtained by expanding (symbol, children)""" + new_cov = self._new_child_coverage(children, max_depth) + new_cov.add(expansion_key(symbol, children)) + new_cov -= self.expansion_coverage() # -= is set subtraction + return new_cov + +``` + +让我们说明`new_child_coverage()`。 我们再次开始模糊测试,随机选择扩展。 + +```py +f = GrammarCoverageFuzzer(EXPR_GRAMMAR, start_symbol="", log=True) +f.fuzz() + +``` + +```py +Tree: +Expanding randomly +Now covered: -> 2 +Tree: 2 +'2' + +``` + +```py +'2' + +``` + +这是我们目前的报道: + +```py +f.expansion_coverage() + +``` + +```py +{' -> 2'} + +``` + +当我们查看``的单个扩展可能性时,我们看到所有扩展都提供了额外的覆盖范围,*除了*才适用。 + +```py +for expansion in EXPR_GRAMMAR[""]: + children = f.expansion_to_children(expansion) + print(expansion, f.new_child_coverage("", children)) + +``` + +```py +0 {' -> 0'} +1 {' -> 1'} +2 set() +3 {' -> 3'} +4 {' -> 4'} +5 {' -> 5'} +6 {' -> 6'} +7 {' -> 7'} +8 {' -> 8'} +9 {' -> 9'} + +``` + +这意味着无论何时选择扩展,我们都可以使用`new_child_coverage()`并在提供最大新(看不见)覆盖范围的扩展中进行选择。 + +### 自适应前瞻 + +当选择一个孩子时,我们不会期望获得最大的总体覆盖范围,因为这会导致扩展,而许多未发现的可能性将完全主导其他扩展。 相反,我们的目标是采用*广度优先*策略,首先涵盖到达给定深度的所有扩展,然后才寻找更大的深度。 方法`new_coverages()`是此策略的核心:从最大深度(`max_depth`)为零开始,它会增加深度,直到找到至少一个未发现的扩展为止。 + +```py +class GrammarCoverageFuzzer(GrammarCoverageFuzzer): + def new_coverages(self, node, possible_children): + """Return coverage to be obtained for each child at minimum depth""" + (symbol, children) = node + for max_depth in range(len(self.grammar)): + new_coverages = [ + self.new_child_coverage( + symbol, c, max_depth) for c in possible_children] + max_new_coverage = max(len(new_coverage) + for new_coverage in new_coverages) + if max_new_coverage > 0: + # Uncovered node found + return new_coverages + + # All covered + return None + +``` + +### 全部在一起 + +现在,我们可以定义`choose_node_expansion()`来使用此策略:首先,我们确定要获得的可能覆盖范围(使用`new_coverages()`); 然后,我们(随机地)选择运动范围最大的孩子。 + +```py +class GrammarCoverageFuzzer(GrammarCoverageFuzzer): + def choose_node_expansion(self, node, possible_children): + (symbol, children) = node + new_coverages = self.new_coverages(node, possible_children) + + if new_coverages is None: + # All expansions covered - use superclass method + return self.choose_covered_node_expansion(node, possible_children) + + max_new_coverage = max(len(cov) for cov in new_coverages) + + children_with_max_new_coverage = [c for (i, c) in enumerate(possible_children) + if len(new_coverages[i]) == max_new_coverage] + index_map = [i for (i, c) in enumerate(possible_children) + if len(new_coverages[i]) == max_new_coverage] + + # Select a random expansion + new_children_index = self.choose_uncovered_node_expansion( + node, children_with_max_new_coverage) + new_children = children_with_max_new_coverage[new_children_index] + + # Save the expansion as covered + key = expansion_key(symbol, new_children) + + if self.log: + print("Now covered:", key) + self.covered_expansions.add(key) + + return index_map[new_children_index] + +``` + +现在我们的模糊器已经完成。 让我们将其应用于一系列示例。 在表达式上,它可以快速覆盖所有数字和运算符: + +```py +f = GrammarCoverageFuzzer(EXPR_GRAMMAR, min_nonterminals=3) +f.fuzz() + +``` + +```py +'-4.02 / (1) * +3 + 5.9 / 7 * 8 - 6' + +``` + +```py +f.max_expansion_coverage() - f.expansion_coverage() + +``` + +```py +set() + +``` + +平均而言,它比简单策略还快: + +```py +average_length_until_full_coverage(GrammarCoverageFuzzer(EXPR_GRAMMAR)) + +``` + +```py +50.74 + +``` + +在CGI语法上,只需几次迭代即可覆盖所有字母和数字: + +```py +f = GrammarCoverageFuzzer(CGI_GRAMMAR, min_nonterminals=5) +while len(f.max_expansion_coverage() - f.expansion_coverage()) > 0: + print(f.fuzz()) + +``` + +```py +%18%d03 +%c3%94%7f+cd +%a6%b5%e2%5e%4c-54e01a2 +%5eb%7cb_ec%a0+ + +``` + +通过比较CGI语法的随机,仅扩展和深度预见策略,也可以看到这种改进: + +```py +average_length_until_full_coverage(TrackingGrammarCoverageFuzzer(CGI_GRAMMAR)) + +``` + +```py +211.34 + +``` + +```py +average_length_until_full_coverage(SimpleGrammarCoverageFuzzer(CGI_GRAMMAR)) + +``` + +```py +68.64 + +``` + +```py +average_length_until_full_coverage(GrammarCoverageFuzzer(CGI_GRAMMAR)) + +``` + +```py +40.38 + +``` + +## 上下文[的覆盖范围](#Coverage-in-Context) + +有时,语法元素会在多个地方使用。 例如,在我们的表达式语法中,``符号用于整数以及浮点数: + +```py +EXPR_GRAMMAR[""] + +``` + +```py +['+', '-', '()', '.', ''] + +``` + +如上所定义,我们的覆盖产品将确保覆盖所有``扩展(即所有``扩展)。 但是,在语法中所有出现的``时,单个数字都是*分布*。 如果我们基于覆盖的模糊器产生`1234.56`和`7890`,那么我们将完全覆盖所有数字扩展。 但是,上述``扩展中的`.`和``仅单独覆盖了一部分数字。 如果浮点数和整数具有不同的读取功能,则我们希望对所有这些功能进行全数字测试; 也许我们还希望对浮点数的整个和小数部分进行测试,每个数字都包含数字。 + +如果我们可以假定该符号的所有出现都得到相同的对待,则忽略使用符号的上下文(在我们的示例中,``上下文中``和``的各种用法)可能很有用。 但是,如果不是,则一种确保符号的出现独立于其他出现而被系统地覆盖的方法是将该出现分配给新符号,该符号是旧符号的*副本*。 我们将首先展示如何手动创建此类重复项,然后介绍一种自动执行此操作的专用功能。 + +### 手动扩展文法以覆盖上下文 + +如上所述,一种实现上下文覆盖的简单方法是通过*复制*符号及其引用的规则。 例如,我们可以将`.`替换为`.`,并赋予``和``与原始``相同的定义。 这意味着不仅将覆盖``的所有扩展,而且还将覆盖``和``的所有扩展。 + +让我们用实际代码说明这一点: + +```py +dup_expr_grammar = extend_grammar(EXPR_GRAMMAR, + { + "": ["+", "-", "()", ".", ""], + "": ["", ""], + "": ["", ""], + "": + ["0", "1", "2", "3", "4", + "5", "6", "7", "8", "9"], + "": + ["0", "1", "2", "3", "4", + "5", "6", "7", "8", "9"] + } + ) + +``` + +```py +assert is_valid_grammar(dup_expr_grammar) + +``` + +如果现在在扩展语法上运行基于覆盖率的模糊器,那么我们将覆盖正整数的所有数字,以及浮点数的整数和小数部分的所有数字: + +```py +f = GrammarCoverageFuzzer(dup_expr_grammar, start_symbol="") +for i in range(10): + print(f.fuzz()) + +``` + +```py +-(43.76 / 8.0 * 5.5 / 6.9 * 6 / 4 + +03) +(90.1 - 1 * 7.3 * 9 + 5 / 8 / 7) +2.8 +1.2 +10.4 +2 +4386 +7 +0 +08929.4302 + +``` + +我们将看到我们的“有远见”的覆盖率模糊器是如何专门生成浮点数的,该浮点数覆盖整个和小数部分的所有数字。 + +### 以编程方式扩展文法覆盖上下文 + +如果我们想增强上下文的覆盖范围,则手动调整语法可能不是理想的选择,因为对语法的任何更改都必须复制在所有重复项中。 取而代之的是,我们引入了一个将为我们做重复的功能。 + +函数`duplicate_context()`接受语法,语法中的符号以及该符号的扩展名(`None`或未提供:符号的所有扩展名),并且它将扩展名更改为引用所有原始引用规则的副本 。 这个想法是我们以 + +```py +dup_expr_grammar = extend_grammar(EXPR_GRAMMAR) +duplicate_context(dup_expr_grammar, "", ".") + +``` + +并获得与上述手动更改类似的结果。 + +这是代码: + +```py +from [Grammars](Grammars.html) import new_symbol, unreachable_nonterminals +from [GrammarFuzzer](GrammarFuzzer.html) import expansion_to_children + +``` + +```py +def duplicate_context(grammar, symbol, expansion=None, depth=float('inf')): + """Duplicate an expansion within a grammar. + + In the given grammar, take the given expansion of the given symbol + (if expansion is omitted: all symbols), and replace it with a + new expansion referring to a duplicate of all originally referenced rules. + + If depth is given, limit duplication to `depth` references (default: unlimited) + """ + orig_grammar = extend_grammar(grammar) + _duplicate_context(grammar, orig_grammar, symbol, + expansion, depth, seen={}) + + # After duplication, we may have unreachable rules; delete them + for nonterminal in unreachable_nonterminals(grammar): + del grammar[nonterminal] + +``` + +大部分工作都在此辅助功能中进行。 附加参数`seen`跟踪已扩展的符号,并避免无限递归。 + +```py +import [copy](https://docs.python.org/3/library/copy.html) + +``` + +```py +def _duplicate_context(grammar, orig_grammar, symbol, expansion, depth, seen): + for i in range(len(grammar[symbol])): + if expansion is None or grammar[symbol][i] == expansion: + new_expansion = "" + for (s, c) in expansion_to_children(grammar[symbol][i]): + if s in seen: # Duplicated already + new_expansion += seen[s] + elif c == [] or depth == 0: # Terminal symbol or end of recursion + new_expansion += s + else: # Nonterminal symbol - duplicate + # Add new symbol with copy of rule + new_s = new_symbol(grammar, s) + grammar[new_s] = copy.deepcopy(orig_grammar[s]) + + # Duplicate its expansions recursively + # {**seen, **{s: new_s}} is seen + {s: new_s} + _duplicate_context(grammar, orig_grammar, new_s, expansion=None, + depth=depth - 1, seen={**seen, **{s: new_s}}) + new_expansion += new_s + + grammar[symbol][i] = new_expansion + +``` + +这是我们上面的`duplicate_context()`工作原理示例,现在有了结果。 我们让它在表达式语法中复制`.`扩展名,并获得一个带有`.`扩展名的新语法,其中``和``都引用原始规则的副本: + +```py +dup_expr_grammar = extend_grammar(EXPR_GRAMMAR) +duplicate_context(dup_expr_grammar, "", ".") +dup_expr_grammar + +``` + +```py +{'': [''], + '': [' + ', ' - ', ''], + '': [' * ', ' / ', ''], + '': ['+', + '-', + '()', + '.', + ''], + '': ['', ''], + '': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], + '': ['', ''], + '': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], + '': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], + '': ['', ''], + '': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], + '': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']} + +``` + +就像上面一样,使用这样的语法进行覆盖模糊处理现在将覆盖许多上下文中的数字。 准确地说,有五个上下文:正则整数,以及浮点数的一位和多位整数和小数部分。 + +```py +f = GrammarCoverageFuzzer(dup_expr_grammar, start_symbol="") +for i in range(10): + print(f.fuzz()) + +``` + +```py +(57.5) +2 ++-(1 / 3 + 6 / 0 - 7 * 59 * 3 + 8 * 4) +374.88 +5.709 +0.93 +01.1 +892.27 +219.50 +6.636 + +``` + +`depth`参数控制复制应进行的深度。 将`depth`设置为1只会复制下一条规则: + +```py +dup_expr_grammar = extend_grammar(EXPR_GRAMMAR) +duplicate_context(dup_expr_grammar, "", ".", depth=1) +dup_expr_grammar + +``` + +```py +{'': [''], + '': [' + ', ' - ', ''], + '': [' * ', ' / ', ''], + '': ['+', + '-', + '()', + '.', + ''], + '': ['', ''], + '': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], + '': ['', ''], + '': ['', '']} + +``` + +```py +assert is_valid_grammar(dup_expr_grammar) + +``` + +默认情况下,`depth`设置为$ \ infty $,表示无限复制。 真正的无界重复可能会导致诸如`EXPR_GRAMMAR`之类的递归语法出现问题,因此一旦将`duplicate_context()`设置为不再重复的符号。 尽管如此,如果我们将其应用于所有 ``扩展的*重复项,我们将获得不少于296条规则的语法:* + +```py +dup_expr_grammar = extend_grammar(EXPR_GRAMMAR) +duplicate_context(dup_expr_grammar, "") + +``` + +```py +assert is_valid_grammar(dup_expr_grammar) +len(dup_expr_grammar) + +``` + +```py +292 + +``` + +这使我们可以扩展将近2000个范围: + +```py +f = GrammarCoverageFuzzer(dup_expr_grammar) +len(f.max_expansion_coverage()) + +``` + +```py +1981 + +``` + +再重复一遍,既使语法又提高了覆盖率要求: + +```py +dup_expr_grammar = extend_grammar(EXPR_GRAMMAR) +duplicate_context(dup_expr_grammar, "") +duplicate_context(dup_expr_grammar, "") +len(dup_expr_grammar) + +``` + +```py +594 + +``` + +```py +f = GrammarCoverageFuzzer(dup_expr_grammar) +len(f.max_expansion_coverage()) + +``` + +```py +3994 + +``` + +在这一点上,可以单独涵盖很多上下文,例如,加法中元素的乘法: + +```py +dup_expr_grammar[""] + +``` + +```py +[' + ', ' - ', ''] + +``` + +```py +dup_expr_grammar[""] + +``` + +```py +[' * ', ' / ', ''] + +``` + +```py +dup_expr_grammar[""] + +``` + +```py +['+', + '-', + '()', + '.', + ''] + +``` + +产生的语法可能不再对人类维护有用; 但是运行覆盖率驱动的模糊器(例如`GrammarCoverageFuzzer()`)将可以覆盖所有情况下的所有这些扩展。 如果您想覆盖大量上下文中的元素,那么`duplicate_context()`和覆盖率驱动的模糊器是您的朋友。 + +## 通过覆盖语法来覆盖代码 + +有无上下文:通过系统地覆盖所有输入元素,我们可以在输入中获得更大的种类-但这是否会转化为更广泛的程序行为? 毕竟,这些行为是我们要涵盖的,包括意外行为。 + +在语法中,有些元素直接对应于程序功能。 处理算术表达式的程序将具有直接由各个元素触发的功能-例如,由`+`存在触发的加法功能,由`-`存在触发的减法和由`-`存在触发的浮点算术 输入中的浮点数。 + +输入结构和功能之间的这种联系导致语法覆盖范围和代码覆盖范围之间具有很强的*相关性。 换句话说:如果我们可以实现较高的语法覆盖率,那么这也将导致较高的代码覆盖率。* + +### CGI语法 + +让我们在我们的一种语法中探索这种关系,例如,关于覆盖范围的[章中的CGI解码器。 我们计算映射`coverages`,其中在`coverages[x]` = `{y_1, y_2, ...}`中,`x`是获得的语法覆盖率,`y_n`是从第`n`次运行获得的代码覆盖率。](Coverage.html) + +我们首先计算最大覆盖率,如关于覆盖率的[一章:](Coverage.html) + +```py +from [Coverage](Coverage.html) import Coverage, cgi_decode + +``` + +```py +with Coverage() as cov_max: + cgi_decode('+') + cgi_decode('%20') + cgi_decode('abc') + try: + cgi_decode('%?a') + except: + pass + +``` + +现在,我们进行实验: + +```py +f = GrammarCoverageFuzzer(CGI_GRAMMAR, max_nonterminals=2) +coverages = {} + +trials = 100 +for trial in range(trials): + f.reset_coverage() + overall_cov = set() + max_cov = 30 + + for i in range(10): + s = f.fuzz() + with Coverage() as cov: + cgi_decode(s) + overall_cov |= cov.coverage() + + x = len(f.expansion_coverage()) * 100 / len(f.max_expansion_coverage()) + y = len(overall_cov) * 100 / len(cov_max.coverage()) + if x not in coverages: + coverages[x] = [] + coverages[x].append(y) + +``` + +我们计算`y`值的平均值: + +```py +xs = list(coverages.keys()) +ys = [sum(coverages[x]) / len(coverages[x]) for x in coverages] + +``` + +并创建散点图: + +```py +%matplotlib inline + +``` + +```py +import [matplotlib.pyplot](https://docs.python.org/3/library/matplotlib.pyplot.html) as [plt](https://docs.python.org/3/library/plt.html) + +``` + +```py +import [matplotlib.ticker](https://docs.python.org/3/library/matplotlib.ticker.html) as [mtick](https://docs.python.org/3/library/mtick.html) + +``` + +```py +ax = plt.axes(label="coverage") +ax.yaxis.set_major_formatter(mtick.PercentFormatter()) +ax.xaxis.set_major_formatter(mtick.PercentFormatter()) + +plt.xlim(0, max(xs)) +plt.ylim(0, max(ys)) + +plt.title('Coverage of cgi_decode() vs. grammar coverage') +plt.xlabel('grammar coverage (expansions)') +plt.ylabel('code coverage (lines)') +plt.scatter(xs, ys); + +``` + +![]( +) + +我们看到语法覆盖率越高,代码覆盖率越高。 + +这也将转化为约0.9的相关系数,表明相关性很强: + +```py +import [numpy](https://docs.python.org/3/library/numpy.html) as [np](https://docs.python.org/3/library/np.html) + +``` + +```py +np.corrcoef(xs, ys) + +``` + +```py +array([[1\. , 0.81663071], + [0.81663071, 1\. ]]) + +``` + +Spearman等级相关性也证实了这一点: + +```py +from [scipy.stats](https://docs.python.org/3/library/scipy.stats.html) import spearmanr + +``` + +```py +spearmanr(xs, ys) + +``` + +```py +SpearmanrResult(correlation=0.937547293248041, pvalue=1.0928720949027369e-09) + +``` + +### URL语法 + +让我们在URL语法上重复此实验。 除了交换语法和功能外,我们使用与上述相同的代码: + +```py +try: + from [urlparse](https://docs.python.org/3/library/urlparse.html) import urlparse # Python 2 +except ImportError: + from [urllib.parse](https://docs.python.org/3/library/urllib.parse.html) import urlparse # Python 3 + +``` + +再次,我们首先计算最大覆盖率,如关于覆盖率的[一章所述,进行有根据的猜测:](Coverage.html) + +```py +with Coverage() as cov_max: + urlparse("http://foo.bar/path") + urlparse("https://foo.bar#fragment") + urlparse("ftp://user:password@foo.bar?query=value") + urlparse("ftps://127.0.0.1/?x=1&y=2") + +``` + +这是实际的实验: + +```py +f = GrammarCoverageFuzzer(URL_GRAMMAR, max_nonterminals=2) +coverages = {} + +trials = 100 +for trial in range(trials): + f.reset_coverage() + overall_cov = set() + + for i in range(20): + s = f.fuzz() + with Coverage() as cov: + urlparse(s) + overall_cov |= cov.coverage() + + x = len(f.expansion_coverage()) * 100 / len(f.max_expansion_coverage()) + y = len(overall_cov) * 100 / len(cov_max.coverage()) + if x not in coverages: + coverages[x] = [] + coverages[x].append(y) + +``` + +```py +xs = list(coverages.keys()) +ys = [sum(coverages[x]) / len(coverages[x]) for x in coverages] + +``` + +```py +ax = plt.axes(label="coverage") +ax.yaxis.set_major_formatter(mtick.PercentFormatter()) +ax.xaxis.set_major_formatter(mtick.PercentFormatter()) + +plt.xlim(0, max(xs)) +plt.ylim(0, max(ys)) + +plt.title('Coverage of urlparse() vs. grammar coverage') +plt.xlabel('grammar coverage (expansions)') +plt.ylabel('code coverage (lines)') +plt.scatter(xs, ys); + +``` + +![]( +) + +在这里,我们的相关系数甚至超过了0.95: + +```py +np.corrcoef(xs, ys) + +``` + +```py +array([[1\. , 0.94110679], + [0.94110679, 1\. ]]) + +``` + +This is also confirmed by the Spearman rank correlation: + +```py +spearmanr(xs, ys) + +``` + +```py +SpearmanrResult(correlation=1.0, pvalue=0.0) + +``` + +我们得出的结论是:如果要获得较高的代码覆盖率,则首先争取较高的语法覆盖率是一个好主意。 + +### 这会一直有效吗? + +对于CGI和URL示例观察到的相关性并不适用于每个程序和每个结构。 + +#### 等效元素 + +首先,即使某个语法元素将它们视为不同的符号,它们也会被程序统一处理。 例如,在URL的主机名中,我们可以有许多不同的字符,尽管URL处理程序将它们完全相同。 同样,单个数字一旦组合成一个数字,其影响就小于数字本身的值。 因此,实现数字或字符的多样性不一定会在功能上产生很大的差异。 + +如上所述,可以通过*取决于元素的上下文*区分元素并覆盖每种上下文的替代方案来解决此问题。 关键是确定需要多样性的环境,而不是不需要多样性的环境。 + +#### 深度数据处理 + +其次,数据的处理方式可能会有很大的不同。 考虑到*媒体播放器*的输入,该输入由压缩的媒体数据组成。 在处理媒体数据时,媒体播放器将显示行为上的差异(特别是在其输出中),但是无法通过媒体数据的各个元素直接触发这些差异。 同样,在大量输入上训练的*机器学习器*通常不会通过输入的单个语法元素来控制其行为。 (嗯,可以,但是然后,我们将不需要机器学习者。)在“深度”数据处理的这些情况下,在语法上实现结构覆盖不一定会导致代码覆盖。 + +解决此问题的一种方法不仅是实现*语法*,而且实际上是*语义*变体。 在[关于带约束的模糊化](GeneratorGrammarFuzzer.html)的章节中,我们将看到如何专门生成和过滤输入值,尤其是数值。 这样的生成器也可以在上下文中应用,从而可以分别控制输入的每个方面。 同样,在以上示例中,*输入的某些*部分仍可以在结构上覆盖:*元数据*(例如媒体播放器的作者姓名或作曲者)或*配置数据[* (例如机器学习者的设置)可以并且应该被系统地涵盖; 我们将在“配置模糊” 一章中看到如何完成此操作。 + +## 经验教训 + +* 快速实现*语法覆盖率*会产生各种各样的输入。 +* 复制语法规则允许覆盖特定*上下文*中的元素。 +* 实现语法覆盖率可以帮助获得*代码覆盖率*。 + +## 后续步骤 + +从这里,您可以学习如何 + +* [使用语法覆盖系统地测试配置](ConfigurationFuzzer.html)。 + +## 背景 + +确保语法中的每个扩展至少使用一次的想法可以追溯到Burkhardt [ [Burkhardt *等人*,1967。](https://doi.org/10.1007/BF02235512)],稍后由Paul Purdom [[重新发现。 Purdom *等*,1972。](https://doi.org/10.1007/BF01932308)。 语法覆盖率和代码覆盖率之间的关系是由Nikolas Havrikov发现的,他在其博士学位论文中对此进行了探讨。 + +## 练习 + +### 练习1:测试ls + +考虑用于列出目录内容的Unix `ls`程序。 创建用于调用`ls`的语法: + +```py +LS_EBNF_GRAMMAR = { + '': ['-'], + '': ['