面临思维转变:
1、当前线程可能随时会被切换出去,或者说被抢占了。
2、多线程程序中事件的发生顺序不再有全局统一的先后关系。
bool running = false; //全局标志
void threadFunc()
{
while(running)
{
//get task from queue
}
}
void start()
{
muduo::Thread t(threadFunc);
t.start();
running = true; //应该放到t.start()之前。
}
11个基本的Pthreads函数是:
2个:线程的创建和等待结束(join)。封装为muduo::Thread。
4个:mutex的创建、销毁、加锁、解锁。封装为muduo::MutexLock。
5个:条件变量的创建、销毁、等待、通知、广播。封装为:muduo::Condition。
有些可以酌情使用:
pthread_once,封装为muduo::Singleton<T>。其实不如直接使用全局变量。
pthread_key*,封装为muduo::ThreadLocal<T>。可以考虑用__thread替换之。
不建议使用:
pthread_rwlock,读写锁通常应慎用。muduo没有封装读写锁,
sem_*,避免用信号量(semaphore)。它的功能与条件变量重合,但容易用错。
pthread_{cancel,kill}。程序中出现则通常意味着设计出了问题。
pthread_self函数用于返回当前进程的标识符。其类型为pthread_t。
Pthreads提供了pthread_equal函数用于对比两个线程标识符是否相等。
在linux中,建议使用gettid(2)的返回值作为线程id。
好处:
1、类型是pid_t。
2、直接表示内核的任务调度id,在/proc/tid或/proc/pid/task/tid中可以找到
3、在其他系统工具中也可以定位到具体某一个线程。
4、任何实况都是全局唯一的。
5、0是非法值。操作系统第一个进程init的pid是1。
muduo::CurrentThread::tid()采用办法是用__thread变量缓存gettid(2)的返回值。
boost::this_thread::get_id()也可以。
程序执行fork(2)那么子进程会不会看到stale的缓存??
解决办法用pthread_atfork()注册一个回调,用于清空缓存的线程id。//muduo/base/CurrentThread.h和Thread.cc
线程的创建和销毁守则:
1、程序库不应该在未提前告知的情况下创建自己的“背景线程”。
2、尽量用相同的方式创建线程,例如muduo::Thread。
3、在进入main()函数之前不要启动线程。
4、程序中线程的创建最后能在初始化阶段全部完成。
线程数可以从/proc/pid/status中拿到。
利用muduo::ThreadPool和muduo::EventLoop能把计算任务和IO任务分配到已有的线程。
线程销毁:
1、自然死亡。从线程主函数返回,线程正常退出。
2、非正常死亡。从线程主函数抛出异常或线程触发segfault信号等非法操作。
3、自杀。在线程中调用pthread_exit()来立刻退出线程。
4、他杀。其他线程调用pthread_cancel()来强制终止某个线程。
pthread_kill()是往线程发信号。
exit()退出时会析构全局变量。
需要主动结束线程可以考虑使用_exit(2)系统调用。它不会试图析构全局变量,但也 不会执行其他任何清理工作。比如flush标准输出。
__thread关键字是GCC内置的线程局部存储设施。
__thread使用规则:只能用于修饰POD类型,不能修饰class类型。因为无法调用构造析构函数。__thread可以用于修饰全局变量、函数内的静态变量,但是不能用于修饰函数局部变量或class的普通成员变量。另外__thread变量的初始化只能用于编译器常量。
__thread string* t_obj1(“hello world”));//错误,不能调用对象构造函数。
__thread string* t_obj2 = new string;//错误,初始化必须用于编译期常量。
__thread string* t_obj = NULL;//正确,需要手动初始化并销毁对象。
__thread变量是每个线程有一份独立实体。各个线程变量互不干扰。还可以修饰“值可能会变,带有全局性,但是又不值得用全局锁保护。”的变量。
如果用到thread local的class对象,可以考虑使用muduo::ThreadLocal<T>和muduo::ThreadLocalSinglenton<T>这两个class,它能在线程退出时销毁class对象。
多线程同时操作同一个socket文件描述符问题:
1、如果一个线程正在阻塞地read(2)某个socket,而另一个线程close(2)了此socket。
2、如果一个线程正在阻塞地accept(2)某个socket,而另一个线程close(2)了此socket。
3、更糟糕的是,一个线程正在阻塞地read(2)某个socket,而另一个线程close(2)了此socket,第三个线程有恰好open(2)了另一个文件描述符,其fd号码正好与前面的socket相同,这样程序逻辑就混乱了。
用RAII,用Socket对象包装文件描述符。
资源管理和生命对象周期统一起来(RAII)。
读写问题:
1、如果两个线程同时read同一个TCP socket,两个线程几乎同时各自收到的一部分数据,如何把数据拼接成完整的消息?如何知道那部分数据先到达?
2、如果两个线程同时write同一个TCP socket,每个线程都只发出去半条消息,接收方收到的数据如何处理?
3、如果给每个TCP socket配一把锁,让同时只能有一个线程读或写此socket,似乎可以“解决”问题,但这样还不如直接始终让同一个线程来操作此socket来的简单。
4、对于非阻塞IO,情况一样,而且收发消息得 完整性与原子性几乎不可能用锁来保证,因为这样会阻塞其他IO线程。
遵循原则:每个文件描述符只由一个线程操作。
RAII遇到fork()
int main()
{
Foo foo; //调用构造函数
fork(); //fork两个进程
foo.doit(); //在父子进程中使用foo,析构函数会被调用两次,父进程和子进程各一次。
}
子进程不会继承:
1、父进程的内存锁:mlcok(2),mlockall(2)
2、父进程的文件锁:fcntl(2)
3、父进程的某些定时器,setitimer(2),alarm(2),timer_create(2)等等
4、其他。见man 2 fork
多线程与fork()
fork()之后子进程中只有一个线程,其他线程都消失了。
多线程与signal