0
收藏
微博
微信
复制链接

多线程开发的设计思路

2025-02-24 15:10
139

前段时间,有小伙伴私信我,希望我能出一期关于多线程开发思路的文章,抱歉,最近事情太多,拖更了这么久。其实关于多线程相关的文章,我更新了不少,也梳理过多线程开发的13条建议:

  1. 使用标准库中的并行算法:C  标准库中有大量算法,在C  17后,有60多个算法支持并行执行,可设置ExecutionPolicy策略。尽量使用这些并行算法,没必要自己写个多线程相关算法。

  2. 可更多使用C  11的std::thread,而不是pthread,推荐std::thread没啥别的性能方面的原因,只是因为使用起来很方便。

    1. std::thread配合lambda表达式创建个线程运行,很方便!

    2. thread对象直接join或者detach,很方便!

    3. 使用thread再配合mutex的std::unique_lock和std::lock_guard使用,很方便!

    4. 使用thread再配合条件变量使用,很方便!

    5. 使用std::this_thread::sleep_for(xxx)休眠某段时间,很方便!

  3. 在使用std::thread时,确保在生命周期结束前,std::thread对象不是可结合的,即确保对象调用了join()或者detach()。否者程序会crash。

    1. C  20的std::jthread就解决了这个问题,jthread在析构函数中会自动join()。其实不使用C  20,我们也可以自己封装一个std::thread的wrapper,来解决这种问题。

  4. 使用sleep(xxx)永远解决不了任何时序相关的bug,一定要使用条件变量来保证时序。

  5. 不要迷信多线程,我们要明确知道,为什么要使用多线程,是为了更高的性能?还是为了不阻塞当前线程?还是有其他考虑?想清楚利弊,最好能综合做出评估后再决定。

  6. 最好的同步就是没有同步:尽可能使用更合理的方式设计线程,让所有的线程在使用共享数据时只读不写,或者只写入其他线程不会读取的部分,或者确保数据的所有权是单线程模式,同一时刻只会有一个线程在访问这块数据,那么多线程编码就会简单很多,不会有任何数据竞争,也不会出现死锁等问题。

  7. 先考虑原子类型再考虑锁:通过原子类型或原子操作更方便编写没有数据竞争和死锁的代码,因为他们能自动处理同步问题。如果不能使用原子类型或原子操作,那再考虑使用互斥锁来保护临界区。

  8. 先确保解决了同步问题,再考虑优化:典型的就是普通互斥锁和读写锁的问题,很多人上来就使用读写锁,追求更高的性能,除非读操作比写操作频繁的多,否则读写锁并不会提高多少性能,我看见过很多使用读写锁导致出现同步问题的案例。所以,开始写代码时还是消停的使用普通锁吧,真正需要优化时再考虑使用其他手段。

  9. 使用RAII锁对象:使用lock_guard、unique_lock、shared_lock或scoped_lock等RAII类来管理锁,这样可以确保一定会释放锁。降低出现死锁的风险,但我们也要了解,如果真的出现了死锁,我们要如何定位?

  10. 尽快释放锁:当需要通过锁保护共享数据时,务必尽快释放锁,尽可能缩小锁控制的粒度,明确哪些数据需要加锁,哪些根本就不需要,不要无脑加锁。因为当一个线程持有一个锁时,会使得其他线程阻塞等待这个锁,这可能会降低程序的性能。

  11. 使用线程池:动态频繁的创建和销毁大量的线程会导致性能下降。这种情况下,最好使用线程池来重用已有的线程,我之前写过如何撸一个线程池的文章,大家可以去看看。

  12. 如果真的需要共享数据,尽量使用通信方式,而非共享内存方式。可使用队列,通信队列如果需要可考虑使用阻塞队列,而不是while(!queue.empty()) { xxx }。

  13. 做好日志记录:使用多线程程序很容易出现各种问题,而且问题还不稳定复现,复现的时机多数时候还不一样,一定要做好日志记录,确保出现问题时有据可查,可快速分析出问题所在。


嗯,上面是两年前的开发心得,经过两年时间,我又多了四年的开发经验,关于多线程又有了一点新的感受。

fc0ee3218c7f424b03652258de36fa.jpg

那就是更推荐使用strand模型了,strand 和上面13条中的第12条核心思想一致,它是asio中引入的一个概念,内部基于消息队列和线程池完成了异步的操作。

那它有什么特点呢?它会确保提交到这个strand上的异步操作,都在一个特定的线程上,按顺序执行。重点在于顺序两字,任务顺序执行,就保证了这些任务不会因为并发而导致数据竞争问题。

所以,它保证了所有的操作都是线程安全的,不需要额外的同步机制,尽管它的操作是顺序执行,但它本质还是异步任务,可以满足我们异步执行的需求,又避免了数据竞争问题。

strand使用方法?大体就是 strand.post(function); 这种形式,只要你维护一些strand的对象即可,比如你有多类操作,那IO操作可以放在io_strand上调度,UI操作可以放在ui_strand上调度,网络操作可以放在net_strand上调度,具体strand是什么类型,完全由你自己定义和分配。

067eee08e4459257fba23763855329.jpg

在哪里可以找到strand?它的底层原理大体就是线程池 消息队列,你可以考虑自己实现一个简易的strand模型,然后使用,在工程上肯定没问题,我自己实现的strand在公司项目上已经运行了一年多,还未收到负面的反馈。或者你也可以使用boost::asio、folly、chromium中的strand。

具体可以参考下方链接:

  • https://live.boost.org/doc/libs/1_68_0/doc/html/boost_asio/overview/core/strands.html

  • https://github.com/facebook/folly/blob/main/folly/executors/StrandExecutor.h

  • https://github.com/chromium/chromium/blob/main/base/task/single_thread_task_runner.h

登录后查看更多
0
评论 0
收藏
侵权举报
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表凡亿课堂立场。文章及其配图仅供工程师学习之用,如有内容图片侵权或者其他问题,请联系本站作侵删。

热门评论0

相关文章

程序喵大人

分享C++、Rust技术