实战指南：如何在Linux驱动开发中正确使用queue_work函数

张开发

• 2026/4/21 11:57:19 • 15 分钟阅读

分享文章

实战指南如何在Linux驱动开发中正确使用queue_work函数在Linux内核开发中异步任务处理是驱动工程师必须掌握的技能之一。想象一下当你正在开发一个需要响应硬件中断的驱动程序同时又不想让中断处理程序ISR承担过多耗时操作时该怎么办这就是queue_work函数大显身手的场景。作为workqueue机制的核心接口它允许你将任务推迟到内核线程中异步执行既保证了实时性又避免了阻塞关键执行路径。本文将深入剖析queue_work的实际应用场景从基础用法到高级技巧再到那些只有踩过坑才知道的调试经验。无论你是刚开始接触内核开发的工程师还是需要优化现有驱动性能的老手都能在这里找到实用的解决方案。我们会特别关注那些文档中很少提及但实际开发中经常遇到的陷阱比如并发控制、内存管理以及性能调优等实际问题。1. workqueue机制与queue_work基础在深入queue_work之前我们需要理解Linux内核中的workqueue机制。简单来说workqueue是一种将任务推迟执行的机制它创建了一组内核线程称为worker线程专门用于执行这些延迟的任务。与softirq和tasklet不同workqueue在进程上下文中运行这意味着它可以睡眠也可以使用调度器。queue_work函数的基本原型如下bool queue_work(struct workqueue_struct *wq, struct work_struct *work);它的作用是将一个预定义的工作项work加入到指定的工作队列wq中等待worker线程取出执行。返回值表示是否成功加入队列false表示该work已经在队列中。关键数据结构struct workqueue_struct代表一个工作队列可以理解为任务池struct work_struct代表一个具体的工作项包含要执行的函数典型的使用流程如下创建工作队列或使用系统预定义的初始化工作项并绑定处理函数在适当的时候如中断处理程序中调用queue_workworker线程会在后续某个时间点执行你的处理函数2. queue_work的实战应用场景2.1 中断下半部处理在中断处理中最常见的应用场景是将耗时操作从ISR移到workqueue中执行。考虑一个网络驱动收到数据包的情况static void eth_rx_handler(struct work_struct *work) { // 处理数据包的耗时操作 process_packet(); } DECLARE_WORK(eth_rx_work, eth_rx_handler); irqreturn_t eth_interrupt(int irq, void *dev_id) { // 读取中断状态寄存器 u32 status readl(reg_base REG_STATUS); if (status RX_INT) { // 快速处理硬件相关操作 queue_packet_to_buffer(); // 将耗时处理推迟 queue_work(eth_wq, eth_rx_work); } return IRQ_HANDLED; }这种模式保证了ISR的快速执行同时不丢失任何数据。2.2 延迟任务执行有时我们需要在特定事件发生后执行某个操作但不希望阻塞当前执行流程。例如在设备探测完成后需要初始化某些慢速硬件static void slow_init_handler(struct work_struct *work) { // 可能涉及I2C/SPI通信等慢速操作 init_hardware(); } struct work_struct slow_init_work; int probe(struct platform_device *pdev) { // 初始化工作项 INIT_WORK(slow_init_work, slow_init_handler); // 快速完成探测 register_device(); // 将慢速初始化推迟 queue_work(system_wq, slow_init_work); return 0; }2.3 并发任务处理对于多核系统可以利用queue_work_on指定任务在特定CPU上执行// 将工作项分配到当前CPU queue_work_on(smp_processor_id(), wq, work); // 或者轮询分配 static atomic_t next_cpu ATOMIC_INIT(0); int cpu atomic_inc_return(next_cpu) % nr_cpu_ids; queue_work_on(cpu, wq, work);这种方法可以有效利用多核性能特别适合数据处理类任务。3. 高级使用技巧与最佳实践3.1 工作队列选择策略Linux内核提供了几种工作队列选择队列类型特点适用场景系统默认队列(system_wq)共享资源省内存通用任务不特别耗时高优先级队列(system_highpri_wq)更高调度优先级实时性要求较高的任务自定义队列独立线程池隔离影响专用、耗时或特殊需求任务创建自定义队列的方法// 创建普通优先级的工作队列 struct workqueue_struct *wq alloc_workqueue(my_wq, WQ_MEM_RECLAIM, 0); // 创建高优先级工作队列 struct workqueue_struct *hi_wq alloc_workqueue(my_hi_wq, WQ_HIGHPRI | WQ_MEM_RECLAIM, 0);最佳实践对于短时任务1ms使用系统共享队列对于可能阻塞的任务使用自定义队列实时性要求高的任务使用高优先级队列3.2 内存与并发安全在使用queue_work时内存管理需要特别注意work结构体生命周期必须保证在work执行完成前不被释放共享数据访问work可能在任何时候被执行需要适当的锁保护一个常见的错误模式void interrupt_handler(void) { struct data *d kmalloc(sizeof(*d), GFP_ATOMIC); INIT_WORK(d-work, handler); queue_work(wq, d-work); // 危险如果handler执行前interrupt_handler再次被调用... } static void handler(struct work_struct *work) { struct data *d container_of(work, struct data, work); // 使用d kfree(d); }更安全的做法是使用引用计数struct data { struct work_struct work; atomic_t refcnt; }; static void handler(struct work_struct *work) { struct data *d container_of(work, struct data, work); // 使用d if (atomic_dec_and_test(d-refcnt)) kfree(d); } void interrupt_handler(void) { struct data *d kmalloc(sizeof(*d), GFP_ATOMIC); atomic_set(d-refcnt, 1); INIT_WORK(d-work, handler); queue_work(wq, d-work); // 其他地方可能也需要访问d atomic_inc(d-refcnt); // ... if (atomic_dec_and_test(d-refcnt)) kfree(d); }3.3 性能调优技巧批量处理合并多个小任务struct batch_work { struct work_struct work; struct list_head items; }; static void batch_handler(struct work_struct *work) { struct batch_work *bw container_of(work, struct batch_work, work); struct item *item, *tmp; list_for_each_entry_safe(item, tmp, bw-items, list) { process_item(item); list_del(item-list); kfree(item); } } void enqueue_item(struct item *item) { static DEFINE_SPINLOCK(lock); static struct batch_work bw; static bool initialized; if (!initialized) { INIT_WORK(bw.work, batch_handler); INIT_LIST_HEAD(bw.items); initialized true; } spin_lock(lock); list_add_tail(item-list, bw.items); if (list_is_singular(bw.items)) { queue_work(wq, bw.work); } spin_unlock(lock); }延迟合并使用queue_delayed_work避免频繁执行static struct delayed_work dw; static void delayed_handler(struct work_struct *work) { // 处理累积的任务 process_accumulated_items(); } void trigger_processing(void) { // 延迟100ms执行期间多次触发也只执行一次 queue_delayed_work(wq, dw, msecs_to_jiffies(100)); }4. 常见问题与调试技巧4.1 典型错误模式重复入队同一个work结构体在未执行完前再次入队// 错误示例 void irq_handler(void) { static struct work_struct work; static bool initialized; if (!initialized) { INIT_WORK(work, handler); initialized true; } queue_work(wq, work); // 可能在handler执行前被多次调用 }内存泄漏忘记释放work关联的数据结构死锁在work处理函数中等待被当前线程持有的锁4.2 调试工具与技术ftrace跟踪# 启用workqueue事件跟踪 echo 1 /sys/kernel/debug/tracing/events/workqueue/enable # 查看跟踪结果 cat /sys/kernel/debug/tracing/trace_pipeproc文件系统# 查看工作队列状态 cat /proc/sys/kernel/workqueue/*动态调试#include linux/dynamic_debug.h static void work_handler(struct work_struct *work) { dynamic_dev_dbg(dev, Work executing on CPU %d\n, smp_processor_id()); // ... }4.3 性能监控使用perf工具分析workqueue性能# 记录workqueue相关事件 perf record -e workqueue:* -a # 生成报告 perf report关键指标工作项执行时间分布工作队列饱和度worker线程调度延迟在实际项目中我发现最有效的调试方法是在work处理函数开始处添加唯一的标识符这样在日志或oops消息中可以快速定位问题源头。例如static void my_work_handler(struct work_struct *work) { static atomic_t counter ATOMIC_INIT(0); int id atomic_inc_return(counter); pr_debug(Work %d start on CPU %d\n, id, smp_processor_id()); // ... pr_debug(Work %d end\n, id); }

更多文章

前端开发 2026/4/21 11:56:31

考研政治81分，英语78分：基础差的我靠这些资料和笨方法逆袭

考研公共课高分逆袭指南：从零基础到政治81分、英语78分的实战路径当考研成绩单上赫然显示政治81分、英语78分时，连我自己都有些难以置信——毕竟我的起点是政治零基础、英语六级低分飘过的状态。这段逆袭经历让我深刻体会到：公共课高分并非天…

MS-Swift实战：LoRA原理核心参数（r/alpha）调参指南（适配Qwen-1.8B医疗场景） 本文基于MS-Swift框架实战，聚焦LoRA微调中最关键的两个参数lora\_rank \(r\)和lora\_alpha，从原理拆解到实战落地&…

张开发

前端开发 2026/4/21 11:51:22

想要让AI创作成为副业，该如何选择稳定又效率的平台？

在如今万物皆可AI的时代，大家或许都想过利用AI来当副业的心思写文案、画插画、做视频等；听起来动动手指就能赚钱。但现实往往是找不到方向就容易放弃；做副业，本质是做生意。既然是生意，稳定和效率就是关键。一、稳定才…

张开发

实战指南：如何在Linux驱动开发中正确使用queue_work函数

最新文章

3分钟搞定AI短视频批量生成：MoneyPrinterPlus零基础配置指南

AT32F413 PWM调光避坑指南：TMR3_CH2重映射到PB5的配置细节与常见问题排查

【EF Core 10向量搜索实战指南】：零基础集成Azure AI Search与PGVector，3步实现语义检索生产就绪

从CAN报文到故障码：一次完整的UDS 19服务诊断请求是如何被处理的？

Python全栈入门到实战【进阶篇 12】Python多进程编程：从入门到实战（附CPU密集型任务实战）

别再搞混了！Altium Designer里TopLayer、Mechanical、KeepOut这些层到底怎么用？

推荐文章

工业通信协议：Modbus与OPC UA的解析与实现

Verilog仿真翻车现场：Testbench里这些‘坑’你踩过几个？（含$monitor、defparam避坑指南）

Python自动化新手福音：用uiautomator2+Weditor搞定安卓APP元素定位（保姆级避坑）

Path of Building完全指南：5步掌握流放之路最强Build规划工具

保姆级避坑指南：在Ubuntu 16.04上搞定Kinect v2驱动与ORB-SLAM2环境搭建

Java CompletableFuture 并发链式任务管理

相关文章

分享文章

更多文章

考研政治81分，英语78分：基础差的我靠这些资料和笨方法逆袭

Dify API响应延迟骤降73%：生产环境实测的4层缓存穿透防护策略

Zotero-GPT插件5大秘籍：用AI思维重塑文献管理新范式

如何将微信聊天变成永恒记忆：WeChatMsg让你的数字对话永不消失

VoiceFixer：三分钟学会AI音频修复，让模糊录音重获新生

原神帧率解锁完全指南：5步安全突破60FPS限制，畅享极致流畅体验

3步掌握抖音批量下载：从零构建自动化采集方案

Spring Boot 4.0 Agent-Ready 架构最佳实践（JVM Agent × Spring Native × OpenTelemetry 深度协同）

别再只调陀螺仪了！用OpenCV实现基于透视变换的EIS防抖，实测效果媲美手机

从一次诡异的通话失败说起：深度复盘SIP OPTIONS消息在NAT穿透和会话保活中的那些坑

【MS-Swift实战】：LoRA原理+核心参数（r/alpha）调参指南（适配Qwen-1.8B医疗场景）

想要让AI创作成为副业，该如何选择稳定又效率的平台？