Rust 过程宏:用 syn Fold 优雅替换 Panic

Procedural macros 是操作 Rust 代码的强大工具。编写这些宏的程序员通常会使用像 syn 和 quote 这样的库来解析和输出标记流。然而,在更复杂的用例中,syn 库提供的标准工具可能无法满足所有需求。有时,标准工具的功能显得捉襟见肘,导致代码变得脆弱且充满重复。
本文将通过一个玩具示例来揭示这些不足之处,即我们将替换函数中的每个 panic 为 Err。首先,我们将展示通常的代码写法。然后,我们将引入 Fold trait,展示它如何使这种操作的代码变得更加优雅。
示例用例:替换 panic
syn 作为 Rust 中解析过程宏输入的标准库,其功能丰富,能够助力开发者高效地生成和转换代码。其标准功能在处理单一或简单的递归操作时表现良好,但在面对复杂多样的场景时,开发者往往需要自行处理各种可能出现的情况,这无疑增加了工作量和出错的可能性。
当我们面对需要编写大量重复代码以处理不同情况时,可能会开始质疑选择 syn 是否明智。为了克服这一挑战,我们可以转向 syn 库中的 Fold trait。尽管这个 trait 被隐藏在某个特性标志之下,但它在递归地改变代码结构时表现出了强大的能力。Fold trait 提供了多种方法,允许开发者在输入的特定部分进行 “挂钩” 操作。
为了更直观地展示 Fold trait 的实际应用,我们可以参考《Write Powerful Rust Macros》一书中的例子。在这个例子中,我们展示了如何使用过程宏将函数中的 panic 调用替换为返回 Err 枚举变体的操作。以下是 panic_to_result 宏的一个简化版代码片段,它展示了这一转换过程的具体实现:
#[panic_to_result] // use our macro
fn create_person_with_result(name: String, age: u32) -> Result<Person, String> {
if age > 30 {
panic!("I hope I die before I get old"); // <- panic will be replaced by an Err
}
Ok(Person {
name,
age,
})
}
fn main() {
// the assertion shows we got back an Err instead of a panic!
assert!(create_person_with_result("name".to_string(), 31).is_err());
}
在现代编程领域中,各种编程语言在处理错误时都展现出了独特的风格。其中,Rust 语言以其对代数数据类型的深度依赖而脱颖而出。值得注意的是,我们并非旨在将宏应用于所有可能的输入情况。实际上,本书所提供的代码更侧重于识别和处理那些存在于 if 语句内部的 panic 情况。这种设计选择极具实用性,因为这正是我们示例中 panic 出现的典型场景。通过以下宏实现的代码片段,你可以清晰地看到这一点:
match expression {
// check the if expressions for panics
Expr::If(mut ex_if) => {
let new_statements: Vec<Stmt> = // modify existing statements
ex_if.then_branch.stmts = new_statements; // and put them inside the if
Stmt::Expr(Expr::If(ex_if), token)
},
// return all other expressions without modification
_ => Stmt::Expr(expression, token)
}
Fold trait
syn 库提供了一项强大的工具,即 Fold trait,它尤其适用于我们需要递归遍历输入语法树(AST)的场景。Fold 隐藏在特性标志之后,但根据官方文档描述:
“
Foldtrait 用于遍历并转换拥有权的语法树节点。其每个方法都可以被重写,以定制在转换相应类型节点时的行为。”这一描述凸显了其潜在的有用性。尽管 syn 库中还有另一个特性标志隐藏的 trait,即 Visit,它与Fold类似,但使用树的引用(borrow)并不返回任何结果,因此并不适合我们当前的需求。
Fold 允许我们访问程序 AST 中的每个节点。由于它拥有对语法树的所有权,我们可以对这些节点进行修改,并最终得到一个按我们意愿改造后的树。在我们的案例中,我们的目标是遍历 AST 树,将每个 panic 调用替换为 Err 表达式。你将发现,使用 Fold trait 所需的代码量竟异常之少。
接下来,让我们通过运行 cargo init --lib 命令来创建一个新的 Rust 库,并将其转换为过程宏。这可以通过在 Cargo.toml 文件中设置 proc-macro = true 来实现。此外,我们还需要添加一些必要的依赖项,以支持我们的宏实现。
[dependencies]
quote = "1.0.33"
syn = { version = "2.0.39", features = ["fold", "full"]}
[lib]
proc-macro = true
接下来,我们定义入口点函数 panic_to_result,它是一个属性宏。属性宏的作用在于将其返回的代码(以令牌流的形式)直接替换原有的代码。因此,我们在此生成的输出将完全取代被标记函数的定义。
panic_to_result 首先会将输入转换为一个 ItemFn 类型,这表示我们期望的输入是一个函数定义。随后,它利用一个自定义的结构和 fold_item_fn 方法来折叠输入,并将结果以 TokenStream 的形式返回。最后,我们将这个 TokenStream 传递给 quote 宏,以便生成最终的替换代码。
use proc_macro::TokenStream;
use quote::quote;
#[proc_macro_attribute]
pub fn panic_to_result(_attr: TokenStream, input: TokenStream) -> TokenStream {
let item: ItemFn = syn::parse(input).unwrap(); // parse the input
let result = ChangePanicIntoResult.fold_item_fn(item); // fold it
quote!(#result).into() // and return the result
}
fn extract_panic_content(mac: &Macro) -> Option<TokenStream2> {
let does_panic = mac.path.segments.iter()
.any(|v| v.ident.to_string().eq("panic"));
if does_panic {
Some(mac.tokens.clone())
} else {
None
}
}
最后,利用 parse2 的巧妙之处,生成的令牌被顺利转换为一个语句,并由函数返回。在此过程中,值得注意的是,这里并不需要显式指定类型规范,因为 Rust 编译器会根据函数的输出类型进行自动推断。当不存在宏或 panic 调用时,我们则直接返回现有的 Stmt 对象。最后,通过调用 fold::fold_stmt,我们确保了 syn 库能够继续对语句进行折叠处理,从而完成整个转换过程。
use quote::quote;
use syn::{fold, ItemFn, Macro, Stmt};
use syn::fold::Fold;
struct ChangePanicIntoResult; // the struct that we were calling in the entry point
impl Fold for ChangePanicIntoResult {
fn fold_stmt(&mut self, stmt: Stmt) -> Stmt {
let new_statement: Stmt = match stmt {
Stmt::Macro(ref mac) => {
let output = extract_panic_content(&mac.mac); // helper to get the panic message
output
.map(|t| quote! {
return Err(#t.to_string());
})
.map(syn::parse2)
.map(Result::unwrap)
.unwrap_or(stmt)
}
// panics should be inside a 'Macro', so in every other case we return
_ => stmt
};
// keep folding
fold::fold_stmt(self, new_statement)
}
}
这确实可能引发一系列更深层次的问题。或许你此刻正疑惑,为何我们没有实现一个 fold_macro 功能(如果它存在的话)。毕竟,在 syn 库中,panic 被解析为一个 Macro。事实上,这曾是我最初的设想!然而,随着对问题的深入理解,我意识到这样的操作实际上并不可行。原因是,如果我们尝试对一个宏进行操作,并将其替换为一个 Err 表达式,那么这样的替换结果本身就不再是一个宏了。更遗憾的是,fold_macro 的定义明确要求我们必须返回一个宏,这使得我们的设想无法实现。
完整示例
让我们深入探究一下我们的代码在实际运行时的效果。我特地对之前的示例进行了调整,加入了循环结构。在我们的主函数中,我们将对三种可能的路径进行详尽的测试。
use fold_macro::panic_to_result;
#[derive(Debug)]
pub struct Person {
name: String,
age: u32,
}
#[panic_to_result]
fn create_person_with_result(name: String, age: u32) -> Result<Person, String> {
// 'if' works
if age > 30 && age < 50 {
panic!("I hope I die before I get old");
}
// but now loop does as well
loop {
if age > 50 {
panic!("This person is old... very old");
}
break
}
Ok(Person {
name,
age,
})
}
fn main() {
let first = create_person_with_result("name".to_string(), 20);
println!("{first:?}");
let second = create_person_with_result("name".to_string(), 40);
println!("{second:?}");
let third = create_person_with_result("name".to_string(), 51);
println!("{third:?}");;
}
Ok(Person { name: "name", age: 20 }) Err("I hope I die before I get old") Err("This person is old... very old")
尽管这并非一个全面完善的错误处理宏解决方案,但它确实为解决特定问题提供了一个颇具启发性的示例。该宏的局限性在于,它目前仅适用于那些已经设计为返回 Result 类型的函数。然而,这并不影响它作为一个展示 Fold trait 和自定义代码如何结合实现强大功能的出色案例。
总结
在本文中,我们深入探讨了如何借助 Fold trait 编写高级宏来遍历并修改 Rust 代码。syn crate 提供的标准工具集使得我们能够以简洁高效的方式转换函数。举例来说,我们成功地利用这些工具将 panic 调用替换为 Err 表达式。然而,此前缺乏一种优雅且自动化的方法来递归遍历整个函数,并在每个适用的位置执行更改。
Fold 和 Visit trait 的出现,打破了这一局限。尽管它们隐藏在特性标志之后,但为我们提供了强大的工具。Fold trait 尤其适用于操作函数的抽象语法树(AST),因此非常符合我们的用例。它提供了多种方法,这些方法尽管带有基本的默认实现,但却极具实用性,能够处理给定类型的每个出现。比如,fold_macro 方法允许我们操纵函数中的每个宏。此外,fold_stmt 方法帮助我们以最小的努力遍历整个函数的内容,从而轻松地更改每个 panic。
原文链接:
https://www.infoq.com/articles/rust-procedural-macros-replace-panic/
本文文字及图片出自 InfoQ
你也许感兴趣的:
- Git 采用 SHA-256、Rust、LLM 等技术动态
- 即将推出的适用于内核开发的Rust语言特性
- 编程语言 Rust 与 Carbon 的对比
- Rust 难在哪里?
- Rust 赋能:意想不到的开发效率跃升
- 降低Rust的学习难度的方法
- 在纯Rust中实现SIMD加速算法的经验教训
- Linux 6.16 带来了更多的 Rust 支持、更快的文件系统以及改进的机密内存支持
- 我最大的困扰:在Rust中同时支持异步和同步代码
- C++不是遗留负担,Rust也非万能解药

你对本文的反应是: