สถาปัตยกรรม Compilation Pipeline ของ Rust

📅 วันที่เผยแพร่: 2026-02-22

สำหรับ Rust Developer การสั่ง cargo build เพื่อให้ได้ Executable file ที่ทำงานได้รวดเร็วและปลอดภัยแบบ Memory-safe โดยไม่ต้องอาศัย Garbage Collector ถือเป็นเรื่องปกติในชีวิตประจำวัน แต่ภายใต้กระบวนการนั้น สถาปัตยกรรมของ rustc (Rust Compiler) ถูกออกแบบมาอย่างเป็นระบบผ่าน Multi-stage Pipeline ที่ทำหน้าที่ตรวจสอบโค้ดอย่างเข้มงวดในแต่ละระดับ ก่อนหน้านี้มี topic compiler ช้า งั้นเรามาดูว่า Source Code ของเราผ่านกระบวนการอะไรบ้างกว่าจะกลายเป็น Machine Code เพื่อจะได้เห็นภาพว่า Compiler ทำอะไรบ้าง

Front-end: Parsing และ AST

กระบวนการเริ่มต้นที่ระดับ Front-end Compiler จะรับ Raw text code เข้ามาทำกระบวนการ Parsing โดยแยกแยะองค์ประกอบออกเป็น Tokens (เช่น Keywords และ Identifiers ต่างๆ) จากนั้นนำมาจัดเรียงเป็นโครงสร้าง Abstract Syntax Tree (AST) ในขั้นตอนนี้ Compiler จะจัดการกับ Expansion ด้วย เช่น การขยาย Macros หรือการทำ Desugaring โครงสร้างอย่าง for-loops ให้อยู่ในรูปแบบที่ Compiler จัดการได้ง่ายขึ้น

Lowering to HIR (High-Level Intermediate Representation)

เนื่องจาก AST ยังยึดติดกับรูปแบบ Syntax ของ Source code มากเกินไป rustc จึงทำการ “Lower” (ลดระดับโครงสร้าง) AST ลงมาเป็น High-Level Intermediate Representation (HIR) ใน State นี้ Compiler จะเริ่มทำ Semantic Analysis เบื้องต้น ได้แก่ Name Resolution เพื่อสแกนหาและระบุตัวแปรหรือฟังก์ชันทั้งหมดใน Scope และ Type Checking ซึ่งจะตรวจสอบความถูกต้องของการใช้งาน Types หากมี Typo หรือ Type Mismatch จะถูก Report Error ตั้งแต่ขั้นตอนนี้

หัวใจสำคัญ: MIR (Mid-Level Intermediate Representation)

เมื่อผ่านการตรวจสอบเบื้องต้น HIR จะถูก Lower ลงอีกขั้นกลายเป็น Mid-Level Intermediate Representation (MIR) ซึ่งออกแบบมาเฉพาะสำหรับการทำ Complex Analysis MIR คือหัวใจสำคัญของ Rust เพราะมันทำหน้าที่เป็น Input หลักให้กับ Borrow Checker ในขั้นตอนนี้ rustc จะบังคับใช้กฎ Ownership, Borrowing และ Lifetimes อย่างเคร่งครัด

นอกจากนี้ยังมีกระบวนการ Lifetime Elision ที่ Compiler จะพยายามอนุมาน (Infer) ความสัมพันธ์ของ Lifetime โดยอัตโนมัติ เพื่อลดภาระการเขียน Generic Lifetime Annotations ที่ไม่จำเป็น การวิเคราะห์แบบ Static ในระดับ MIR นี้เอง ที่ทำให้ Rust สามารถป้องกันปัญหา Dangling References และการันตี Memory Safety ได้ตั้งแต่ตอน Compile

Backend: LLVM IR และ Optimization

เมื่อ Code ผ่าน Verification ด้านความปลอดภัยทั้งหมดจาก MIR แล้ว rustc จะทำหน้าที่ประหนึ่ง Front-end ที่ส่งต่อหน้าที่ให้กับ Backend อย่าง LLVM MIR จะถูกแปลงไปเป็น LLVM IR (Intermediate Representation ของ LLVM) จากนั้น LLVM จะทำหน้าที่รัน Optimization Passes จำนวนมาก เพื่อปรับแต่งโครงสร้างโค้ดให้ทำงานได้รวดเร็วและใช้ทรัพยากรอย่างมีประสิทธิภาพที่สุด (นี่คือเหตุผลหลักของ Performance ในโปรแกรม Rust) ท้ายที่สุด LLVM จะแปล Optimized IR ให้กลายเป็น Machine Code (Object code) ที่เฉพาะเจาะจงกับ Architecture ของเครื่องปลายทาง

Credit & Reference:

Rust Feed

สถาปัตยกรรม Compilation Pipeline ของ Rust

Front-end: Parsing และ AST

Lowering to HIR (High-Level Intermediate Representation)

หัวใจสำคัญ: MIR (Mid-Level Intermediate Representation)

Backend: LLVM IR และ Optimization

Linking: ขั้นตอนสุดท้ายสู่ Final Executable

Summary Pipeline

บทสรุป

Keyboard shortcuts

Rust Feed