多线程开发的设计思路-凡亿课堂

前段时间，有小伙伴私信我，希望我能出一期关于多线程开发思路的文章，抱歉，最近事情太多，拖更了这么久。其实关于多线程相关的文章，我更新了不少，也梳理过多线程开发的13条建议：

使用标准库中的并行算法：C 标准库中有大量算法，在C 17后，有60多个算法支持并行执行，可设置ExecutionPolicy策略。尽量使用这些并行算法，没必要自己写个多线程相关算法。
可更多使用C 11的std::thread，而不是pthread，推荐std::thread没啥别的性能方面的原因，只是因为使用起来很方便。
1. std::thread配合lambda表达式创建个线程运行，很方便！
2. thread对象直接join或者detach，很方便！
3. 使用thread再配合mutex的std::unique_lock和std::lock_guard使用，很方便！
4. 使用thread再配合条件变量使用，很方便！
5. 使用std::this_thread::sleep_for(xxx)休眠某段时间，很方便！
在使用std::thread时，确保在生命周期结束前，std::thread对象不是可结合的，即确保对象调用了join()或者detach()。否者程序会crash。
1. C 20的std::jthread就解决了这个问题，jthread在析构函数中会自动join()。其实不使用C 20，我们也可以自己封装一个std::thread的wrapper，来解决这种问题。
使用sleep(xxx)永远解决不了任何时序相关的bug，一定要使用条件变量来保证时序。
不要迷信多线程，我们要明确知道，为什么要使用多线程，是为了更高的性能？还是为了不阻塞当前线程？还是有其他考虑？想清楚利弊，最好能综合做出评估后再决定。
最好的同步就是没有同步：尽可能使用更合理的方式设计线程，让所有的线程在使用共享数据时只读不写，或者只写入其他线程不会读取的部分，或者确保数据的所有权是单线程模式，同一时刻只会有一个线程在访问这块数据，那么多线程编码就会简单很多，不会有任何数据竞争，也不会出现死锁等问题。
先考虑原子类型再考虑锁：通过原子类型或原子操作更方便编写没有数据竞争和死锁的代码，因为他们能自动处理同步问题。如果不能使用原子类型或原子操作，那再考虑使用互斥锁来保护临界区。
先确保解决了同步问题，再考虑优化：典型的就是普通互斥锁和读写锁的问题，很多人上来就使用读写锁，追求更高的性能，除非读操作比写操作频繁的多，否则读写锁并不会提高多少性能，我看见过很多使用读写锁导致出现同步问题的案例。所以，开始写代码时还是消停的使用普通锁吧，真正需要优化时再考虑使用其他手段。
使用RAII锁对象：使用lock_guard、unique_lock、shared_lock或scoped_lock等RAII类来管理锁，这样可以确保一定会释放锁。降低出现死锁的风险，但我们也要了解，如果真的出现了死锁，我们要如何定位？
尽快释放锁：当需要通过锁保护共享数据时，务必尽快释放锁，尽可能缩小锁控制的粒度，明确哪些数据需要加锁，哪些根本就不需要，不要无脑加锁。因为当一个线程持有一个锁时，会使得其他线程阻塞等待这个锁，这可能会降低程序的性能。
使用线程池：动态频繁的创建和销毁大量的线程会导致性能下降。这种情况下，最好使用线程池来重用已有的线程，我之前写过如何撸一个线程池的文章，大家可以去看看。
如果真的需要共享数据，尽量使用通信方式，而非共享内存方式。可使用队列，通信队列如果需要可考虑使用阻塞队列，而不是while(!queue.empty()) { xxx }。
做好日志记录：使用多线程程序很容易出现各种问题，而且问题还不稳定复现，复现的时机多数时候还不一样，一定要做好日志记录，确保出现问题时有据可查，可快速分析出问题所在。

嗯，上面是两年前的开发心得，经过两年时间，我又多了四年的开发经验，关于多线程又有了一点新的感受。

那就是更推荐使用strand模型了，strand 和上面13条中的第12条核心思想一致，它是asio中引入的一个概念，内部基于消息队列和线程池完成了异步的操作。

那它有什么特点呢？它会确保提交到这个strand上的异步操作，都在一个特定的线程上，按顺序执行。重点在于顺序两字，任务顺序执行，就保证了这些任务不会因为并发而导致数据竞争问题。

所以，它保证了所有的操作都是线程安全的，不需要额外的同步机制，尽管它的操作是顺序执行，但它本质还是异步任务，可以满足我们异步执行的需求，又避免了数据竞争问题。

strand使用方法？大体就是 strand.post(function); 这种形式，只要你维护一些strand的对象即可，比如你有多类操作，那IO操作可以放在io_strand上调度，UI操作可以放在ui_strand上调度，网络操作可以放在net_strand上调度，具体strand是什么类型，完全由你自己定义和分配。

在哪里可以找到strand？它的底层原理大体就是线程池消息队列，你可以考虑自己实现一个简易的strand模型，然后使用，在工程上肯定没问题，我自己实现的strand在公司项目上已经运行了一年多，还未收到负面的反馈。或者你也可以使用boost::asio、folly、chromium中的strand。

具体可以参考下方链接：

https://live.boost.org/doc/libs/1_68_0/doc/html/boost_asio/overview/core/strands.html
https://github.com/facebook/folly/blob/main/folly/executors/StrandExecutor.h
https://github.com/chromium/chromium/blob/main/base/task/single_thread_task_runner.h

登录后查看更多