前段时间,有小伙伴私信我,希望我能出一期关于多线程开发思路的文章,抱歉,最近事情太多,拖更了这么久。其实关于多线程相关的文章,我更新了不少,也梳理过多线程开发的13条建议:
使用标准库中的并行算法:C 标准库中有大量算法,在C 17后,有60多个算法支持并行执行,可设置ExecutionPolicy策略。尽量使用这些并行算法,没必要自己写个多线程相关算法。
可更多使用C 11的std::thread,而不是pthread,推荐std::thread没啥别的性能方面的原因,只是因为使用起来很方便。
std::thread配合lambda表达式创建个线程运行,很方便!
thread对象直接join或者detach,很方便!
使用thread再配合mutex的std::unique_lock和std::lock_guard使用,很方便!
使用thread再配合条件变量使用,很方便!
使用std::this_thread::sleep_for(xxx)休眠某段时间,很方便!
在使用std::thread时,确保在生命周期结束前,std::thread对象不是可结合的,即确保对象调用了join()或者detach()。否者程序会crash。
C 20的std::jthread就解决了这个问题,jthread在析构函数中会自动join()。其实不使用C 20,我们也可以自己封装一个std::thread的wrapper,来解决这种问题。
使用sleep(xxx)永远解决不了任何时序相关的bug,一定要使用条件变量来保证时序。
不要迷信多线程,我们要明确知道,为什么要使用多线程,是为了更高的性能?还是为了不阻塞当前线程?还是有其他考虑?想清楚利弊,最好能综合做出评估后再决定。
最好的同步就是没有同步:尽可能使用更合理的方式设计线程,让所有的线程在使用共享数据时只读不写,或者只写入其他线程不会读取的部分,或者确保数据的所有权是单线程模式,同一时刻只会有一个线程在访问这块数据,那么多线程编码就会简单很多,不会有任何数据竞争,也不会出现死锁等问题。
先考虑原子类型再考虑锁:通过原子类型或原子操作更方便编写没有数据竞争和死锁的代码,因为他们能自动处理同步问题。如果不能使用原子类型或原子操作,那再考虑使用互斥锁来保护临界区。
先确保解决了同步问题,再考虑优化:典型的就是普通互斥锁和读写锁的问题,很多人上来就使用读写锁,追求更高的性能,除非读操作比写操作频繁的多,否则读写锁并不会提高多少性能,我看见过很多使用读写锁导致出现同步问题的案例。所以,开始写代码时还是消停的使用普通锁吧,真正需要优化时再考虑使用其他手段。
使用RAII锁对象:使用lock_guard、unique_lock、shared_lock或scoped_lock等RAII类来管理锁,这样可以确保一定会释放锁。降低出现死锁的风险,但我们也要了解,如果真的出现了死锁,我们要如何定位?
尽快释放锁:当需要通过锁保护共享数据时,务必尽快释放锁,尽可能缩小锁控制的粒度,明确哪些数据需要加锁,哪些根本就不需要,不要无脑加锁。因为当一个线程持有一个锁时,会使得其他线程阻塞等待这个锁,这可能会降低程序的性能。
使用线程池:动态频繁的创建和销毁大量的线程会导致性能下降。这种情况下,最好使用线程池来重用已有的线程,我之前写过如何撸一个线程池的文章,大家可以去看看。
如果真的需要共享数据,尽量使用通信方式,而非共享内存方式。可使用队列,通信队列如果需要可考虑使用阻塞队列,而不是while(!queue.empty()) { xxx }。
做好日志记录:使用多线程程序很容易出现各种问题,而且问题还不稳定复现,复现的时机多数时候还不一样,一定要做好日志记录,确保出现问题时有据可查,可快速分析出问题所在。
嗯,上面是两年前的开发心得,经过两年时间,我又多了四年的开发经验,关于多线程又有了一点新的感受。
那就是更推荐使用strand模型了,strand 和上面13条中的第12条核心思想一致,它是asio中引入的一个概念,内部基于消息队列和线程池完成了异步的操作。
那它有什么特点呢?它会确保提交到这个strand上的异步操作,都在一个特定的线程上,按顺序执行。重点在于顺序两字,任务顺序执行,就保证了这些任务不会因为并发而导致数据竞争问题。
所以,它保证了所有的操作都是线程安全的,不需要额外的同步机制,尽管它的操作是顺序执行,但它本质还是异步任务,可以满足我们异步执行的需求,又避免了数据竞争问题。
strand使用方法?大体就是 strand.post(function); 这种形式,只要你维护一些strand的对象即可,比如你有多类操作,那IO操作可以放在io_strand上调度,UI操作可以放在ui_strand上调度,网络操作可以放在net_strand上调度,具体strand是什么类型,完全由你自己定义和分配。
在哪里可以找到strand?它的底层原理大体就是线程池 消息队列,你可以考虑自己实现一个简易的strand模型,然后使用,在工程上肯定没问题,我自己实现的strand在公司项目上已经运行了一年多,还未收到负面的反馈。或者你也可以使用boost::asio、folly、chromium中的strand。
具体可以参考下方链接:
https://live.boost.org/doc/libs/1_68_0/doc/html/boost_asio/overview/core/strands.html
https://github.com/facebook/folly/blob/main/folly/executors/StrandExecutor.h
https://github.com/chromium/chromium/blob/main/base/task/single_thread_task_runner.h