赞
踩
严格意义上来说,条件变量的主要作用不是处理线程同步,而是进行线程的阻塞。如果在多线程程序中只使用条件变量无法实现线程的同步,必须要配合互斥锁来使用。虽然条件变量和互斥锁都能阻塞线程,但是二者的效果是不一样的,二者的区别如下:
一般情况下条件变量用于处理生产者和消费者模型,并且和互斥锁配合使用。条件变量类型对应的类型为 pthread_cond_t,这样就可以定义一个条件变量类型的变量了:
pthread_cond_t cond;
被条件变量阻塞的线程的线程信息会被记录到这个变量中,以便在解除阻塞的时候使用。
条件变量操作函数函数原型如下:
#include <pthread.h>
pthread_cond_t cond;
// 条件变量初始化
int pthread_cond_init(pthread_cond_t *restrict cond,
const pthread_condattr_t *restrict attr);
// 销毁释放资源
int pthread_cond_destroy(pthread_cond_t *cond);
参数如下:
cond: 条件变量的地址
attr: 条件变量属性,一般使用默认属性,指定为 NULL
// 线程阻塞函数, 哪个线程调用这个函数, 哪个线程就会被阻塞
int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);
通过函数原型可以看出,该函数在阻塞线程的时候,需要一个互斥锁参数,这个互斥锁主要功能是进行线程同步,让线程顺序进入临界区,避免出现数共享资源的数据混乱。该函数会对这个互斥锁做以下几件事情:
在阻塞线程时候,如果线程已经对互斥锁 mutex 上锁,那么会将这把锁打开,这样做是为了避免死锁
当线程解除阻塞的时候,函数内部会帮助这个线程再次将这个 mutex 互斥锁锁上,继续向下访问临界区
// 表示的时间是从1971.1.1到某个时间点的时间, 总长度使用秒/纳秒表示
struct timespec {
time_t tv_sec; /* Seconds */
long tv_nsec; /* Nanoseconds [0 .. 999999999] */
};
// 将线程阻塞一定的时间长度, 时间到达之后, 线程就解除阻塞了
int pthread_cond_timedwait(pthread_cond_t *restrict cond,
pthread_mutex_t *restrict mutex, const struct timespec *restrict abstime);
这个函数的前两个参数和 pthread_cond_wait 函数是一样的,第三个参数表示线程阻塞的时长,但是需要额外注意一点:struct timespec 这个结构体中记录的时间是从1971.1.1到某个时间点的时间,总长度使用秒/纳秒表示。因此赋值方式相对要麻烦一点:
time_t mytim = time(NULL); // 1970.1.1 0:0:0 到当前的总秒数
struct timespec tmsp;
tmsp.tv_nsec = 0;
tmsp.tv_sec = time(NULL) + 100; // 线程阻塞100s
// 唤醒阻塞在条件变量上的线程, 至少有一个被解除阻塞
int pthread_cond_signal(pthread_cond_t *cond);
// 唤醒阻塞在条件变量上的线程, 被阻塞的线程全部解除阻塞
int pthread_cond_broadcast(pthread_cond_t *cond);
调用上面两个函数中的任意一个,都可以换线被 pthread_cond_wait 或者 pthread_cond_timedwait 阻塞的线程,区别就在于 pthread_cond_signal 是唤醒至少一个被阻塞的线程(总个数不定),pthread_cond_broadcast 是唤醒所有被阻塞的线程。
生产者和消费者模型的组成:
场景描述:使用条件变量实现生产者和消费者模型,生产者有 5 个,往链表头部添加节点,消费者也有 5 个,删除链表头部的节点。
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <pthread.h> // 链表的节点 struct Node { int number; struct Node* next; }; // 定义条件变量, 控制消费者线程 pthread_cond_t cond; // 互斥锁变量 pthread_mutex_t mutex; // 指向头结点的指针 struct Node * head = NULL; // 生产者的回调函数 void* producer(void* arg) { // 一直生产 while(1) { pthread_mutex_lock(&mutex); // 创建一个链表的新节点 struct Node* pnew = (struct Node*)malloc(sizeof(struct Node)); // 节点初始化 pnew->number = rand() % 1000; // 节点的连接, 添加到链表的头部, 新节点就新的头结点 pnew->next = head; // head指针前移 head = pnew; printf("+++producer, number = %d, tid = %ld\n", pnew->number, pthread_self()); pthread_mutex_unlock(&mutex); // 生产了任务, 通知消费者消费 pthread_cond_broadcast(&cond); // 生产慢一点 sleep(rand() % 3); } return NULL; } // 消费者的回调函数 void* consumer(void* arg) { while(1) { pthread_mutex_lock(&mutex); // 一直消费, 删除链表中的一个节点 // if(head == NULL) // 这样写有bug while(head == NULL) { // 任务队列, 也就是链表中已经没有节点可以消费了 // 消费者线程需要阻塞 // 线程加互斥锁成功, 但是线程阻塞在这行代码上, 锁还没解开 // 其他线程在访问这把锁的时候也会阻塞, 生产者也会阻塞 ==> 死锁 // 这函数会自动将线程拥有的锁解开 pthread_cond_wait(&cond, &mutex); // 当消费者线程解除阻塞之后, 会自动将这把锁锁上 // 这时候当前这个线程又重新拥有了这把互斥锁 } // 取出链表的头结点, 将其删除 struct Node* pnode = head; printf("--consumer: number: %d, tid = %ld\n", pnode->number, pthread_self()); head = pnode->next; free(pnode); pthread_mutex_unlock(&mutex); sleep(rand() % 3); } return NULL; } int main() { // 初始化条件变量 pthread_cond_init(&cond, NULL); pthread_mutex_init(&mutex, NULL); // 创建5个生产者, 5个消费者 pthread_t ptid[5]; pthread_t ctid[5]; for(int i=0; i<5; ++i) { pthread_create(&ptid[i], NULL, producer, NULL); } for(int i=0; i<5; ++i) { pthread_create(&ctid[i], NULL, consumer, NULL); } // 释放资源 for(int i=0; i<5; ++i) { // 阻塞等待子线程退出 pthread_join(ptid[i], NULL); } for(int i=0; i<5; ++i) { pthread_join(ctid[i], NULL); } // 销毁条件变量 pthread_cond_destroy(&cond); pthread_mutex_destroy(&mutex); return 0; }
代码分析:
void* consumer(void* arg) { while(1) { pthread_mutex_lock(&mutex); // 一直消费, 删除链表中的一个节点 if(head == NULL) // 这样写有bug { pthread_cond_wait(&cond, &mutex); } // 取出链表的头结点, 将其删除 struct Node* pnode = head; printf("--consumer: number: %d, tid = %ld\n", pnode->number, pthread_self()); head = pnode->next; free(pnode); pthread_mutex_unlock(&mutex); sleep(rand() % 3); } return NULL; } /* 为什么在第7行使用if 有bug: 当任务队列为空, 所有的消费者线程都会被这个函数阻塞 pthread_cond_wait(&cond, &mutex); 也就是阻塞在代码的第9行 当生产者生产了1个节点, 调用 pthread_cond_broadcast(&cond); 唤醒了所有阻塞的线程 - 有一个消费者线程通过 pthread_cond_wait()加锁成功, 其余没有加锁成功的线程继续阻塞 - 加锁成功的线程向下运行, 并成功删除一个节点, 然后解锁 - 没有加锁成功的线程解除阻塞继续抢这把锁, 另外一个子线程加锁成功 - 但是这个线程删除链表节点的时候链表已经为空了, 后边访问这个空节点的时候就会出现段错误 解决方案: - 需要循环的对链表是否为空进行判断, 需要将if 该成 while */
信号量用在多线程多任务同步的,一个线程完成了某一个动作就通过信号量告诉别的线程,别的线程再进行某些动作。信号量不一定是锁定某一个资源,而是流程上的概念,比如:有 A,B 两个线程,B 线程要等 A 线程完成某一任务以后再进行自己下面的步骤,这个任务并不一定是锁定某一资源,还可以是进行一些计算或者数据处理之类。
信号量(信号灯)与互斥锁和条件变量的主要不同在于” 灯” 的概念,灯亮则意味着资源可用,灯灭则意味着不可用。信号量主要阻塞线程,不能完全保证线程安全,如果要保证线程安全,需要信号量和互斥锁一起使用。
信号量和条件变量一样用于处理生产者和消费者模型,用于阻塞生产者线程或者消费者线程的运行。信号的类型为 sem_t 对应的头文件为 <semaphore.h>:
#include <semaphore.h>
sem_t sem;
Linux 提供的信号量操作函数原型如下:
#include <semaphore.h>
// 初始化信号量/信号灯
int sem_init(sem_t *sem, int pshared, unsigned int value);
// 资源释放, 线程销毁之后调用这个函数即可
// 参数 sem 就是 sem_init() 的第一个参数
int sem_destroy(sem_t *sem);
参数:
// 参数 sem 就是 sem_init() 的第一个参数
// 函数被调用sem中的资源就会被消耗1个, 资源数-1
int sem_wait(sem_t *sem);
当线程调用这个函数,并且 sem 中的资源数 >0,线程不会阻塞,线程会占用 sem 中的一个资源,因此资源数 - 1,直到 sem 中的资源数减为 0 时,资源被耗尽,因此线程也就被阻塞了。
// 参数 sem 就是 sem_init() 的第一个参数
// 函数被调用sem中的资源就会被消耗1个, 资源数-1
int sem_trywait(sem_t *sem);
当线程调用这个函数,并且 sem 中的资源数 >0,线程不会阻塞,线程会占用 sem 中的一个资源,因此资源数 - 1,直到 sem 中的资源数减为 0 时,资源被耗尽,但是线程不会被阻塞,直接返回错误号,因此可以在程序中添加判断分支,用于处理获取资源失败之后的情况。
// 表示的时间是从1971.1.1到某个时间点的时间, 总长度使用秒/纳秒表示
struct timespec {
time_t tv_sec; /* Seconds */
long tv_nsec; /* Nanoseconds [0 .. 999999999] */
};
// 调用该函数线程获取sem中的一个资源,当资源数为0时,线程阻塞,在阻塞abs_timeout对应的时长之后,解除阻塞。
// abs_timeout: 阻塞的时间长度, 单位是s, 是从1970.1.1开始计算的
int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout);
该函数的参数 abs_timeout 和 pthread_cond_timedwait 的最后一个参数是一样的,使用方法不再过多赘述。当线程调用这个函数,并且 sem 中的资源数 >0,线程不会阻塞,线程会占用 sem 中的一个资源,因此资源数 - 1,直到 sem 中的资源数减为 0 时,资源被耗尽,线程被阻塞,当阻塞指定的时长之后,线程解除阻塞。
// 调用该函数给sem中的资源数+1
int sem_post(sem_t *sem);
调用该函数会将 sem 中的资源数 +1,如果有线程在调用 sem_wait、sem_trywait、sem_timedwait 时因为 sem 中的资源数为 0 被阻塞了,这时这些线程会解除阻塞,获取到资源之后继续向下运行。
// 查看信号量 sem 中的整形数的当前值, 这个值会被写入到sval指针对应的内存中
// sval是一个传出参数
int sem_getvalue(sem_t *sem, int *sval);
通过这个函数可以查看 sem 中现在拥有的资源个数,通过第二个参数 sval 将数据传出,也就是说第二个参数的作用和返回值是一样的。
由于生产者和消费者是两类线程,并且在还没有生成之前是不能进行消费的,在使用信号量处理这类问题的时候可以定义两个信号量,分别用于记录生产者和消费者线程拥有的总资源数。
// 生产者线程 sem_t psem; // 消费者线程 sem_t csem; // 信号量初始化 sem_init(&psem, 0, 5); // 5个生产者可以同时生产 sem_init(&csem, 0, 0); // 消费者线程没有资源, 因此不能消费 // 生产者线程 // 在生产之前, 从信号量中取出一个资源 sem_wait(&psem); // 生产者商品代码, 有商品了, 放到任务队列 ...... ...... ...... // 通知消费者消费,给消费者信号量添加资源,让消费者解除阻塞 sem_post(&csem); // 消费者线程 // 消费者需要等待生产, 默认启动之后应该阻塞 sem_wait(&csem); // 开始消费 ...... ...... ...... // 消费完成, 通过生产者生产,给生产者信号量添加资源 sem_post(&psem);
通过上面的代码可以知道,初始化信号量的时候没有消费者分配资源,消费者线程启动之后由于没有资源自然就被阻塞了,等生产者生产出产品之后,再给消费者分配资源,这样二者就可以配合着完成生产和消费流程了。
场景描述:使用信号量实现生产者和消费者模型,生产者有 5 个,往链表头部添加节点,消费者也有 5 个,删除链表头部的节点。
如果生产者和消费者线程使用的信号量对应的总资源数为 1,那么不管线程有多少个,可以工作的线程只有一个,其余线程由于拿不到资源,都被迫阻塞了
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <semaphore.h> #include <pthread.h> // 链表的节点 struct Node { int number; struct Node* next; }; // 生产者线程信号量 sem_t psem; // 消费者线程信号量 sem_t csem; // 互斥锁变量 pthread_mutex_t mutex; // 指向头结点的指针 struct Node * head = NULL; // 生产者的回调函数 void* producer(void* arg) { // 一直生产 while(1) { // 生产者拿一个信号灯 sem_wait(&psem); // 创建一个链表的新节点 struct Node* pnew = (struct Node*)malloc(sizeof(struct Node)); // 节点初始化 pnew->number = rand() % 1000; // 节点的连接, 添加到链表的头部, 新节点就新的头结点 pnew->next = head; // head指针前移 head = pnew; printf("+++producer, number = %d, tid = %ld\n", pnew->number, pthread_self()); // 通知消费者消费, 给消费者加信号灯 sem_post(&csem); // 生产慢一点 sleep(rand() % 3); } return NULL; } // 消费者的回调函数 void* consumer(void* arg) { while(1) { sem_wait(&csem); // 取出链表的头结点, 将其删除 struct Node* pnode = head; printf("--consumer: number: %d, tid = %ld\n", pnode->number, pthread_self()); head = pnode->next; free(pnode); // 通知生产者生成, 给生产者加信号灯 sem_post(&psem); sleep(rand() % 3); } return NULL; } int main() { // 初始化信号量 // 生产者和消费者拥有的信号灯的总和为1 sem_init(&psem, 0, 1); // 生成者线程一共有1个信号灯 sem_init(&csem, 0, 0); // 消费者线程一共有0个信号灯 // 创建5个生产者, 5个消费者 pthread_t ptid[5]; pthread_t ctid[5]; for(int i=0; i<5; ++i) { pthread_create(&ptid[i], NULL, producer, NULL); } for(int i=0; i<5; ++i) { pthread_create(&ctid[i], NULL, consumer, NULL); } // 释放资源 for(int i=0; i<5; ++i) { pthread_join(ptid[i], NULL); } for(int i=0; i<5; ++i) { pthread_join(ctid[i], NULL); } sem_destroy(&psem); sem_destroy(&csem); return 0; }
通过测试代码可以得到如下结论:如果生产者和消费者使用的信号量总资源数为 1,那么不会出现生产者线程和消费者线程同时访问共享资源的情况,不管生产者和消费者线程有多少个,它们都是顺序执行的。
如果生产者和消费者线程使用的信号量对应的总资源数为大于 1,这种场景下出现的情况就比较多了:
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <semaphore.h> #include <pthread.h> // 链表的节点 struct Node { int number; struct Node* next; }; // 生产者线程信号量 sem_t psem; // 消费者线程信号量 sem_t csem; // 互斥锁变量 pthread_mutex_t mutex; // 指向头结点的指针 struct Node * head = NULL; // 生产者的回调函数 void* producer(void* arg) { // 一直生产 while(1) { // 生产者拿一个信号灯 sem_wait(&psem); // 加锁, 这句代码放到 sem_wait()上边, 有可能会造成死锁 pthread_mutex_lock(&mutex); // 创建一个链表的新节点 struct Node* pnew = (struct Node*)malloc(sizeof(struct Node)); // 节点初始化 pnew->number = rand() % 1000; // 节点的连接, 添加到链表的头部, 新节点就新的头结点 pnew->next = head; // head指针前移 head = pnew; printf("+++producer, number = %d, tid = %ld\n", pnew->number, pthread_self()); pthread_mutex_unlock(&mutex); // 通知消费者消费 sem_post(&csem); // 生产慢一点 sleep(rand() % 3); } return NULL; } // 消费者的回调函数 void* consumer(void* arg) { while(1) { sem_wait(&csem); pthread_mutex_lock(&mutex); struct Node* pnode = head; printf("--consumer: number: %d, tid = %ld\n", pnode->number, pthread_self()); head = pnode->next; // 取出链表的头结点, 将其删除 free(pnode); pthread_mutex_unlock(&mutex); // 通知生产者生成, 给生产者加信号灯 sem_post(&psem); sleep(rand() % 3); } return NULL; } int main() { // 初始化信号量 sem_init(&psem, 0, 5); // 生成者线程一共有5个信号灯 sem_init(&csem, 0, 0); // 消费者线程一共有0个信号灯 // 初始化互斥锁 pthread_mutex_init(&mutex, NULL); // 创建5个生产者, 5个消费者 pthread_t ptid[5]; pthread_t ctid[5]; for(int i=0; i<5; ++i) { pthread_create(&ptid[i], NULL, producer, NULL); } for(int i=0; i<5; ++i) { pthread_create(&ctid[i], NULL, consumer, NULL); } // 释放资源 for(int i=0; i<5; ++i) { pthread_join(ptid[i], NULL); } for(int i=0; i<5; ++i) { pthread_join(ctid[i], NULL); } sem_destroy(&psem); sem_destroy(&csem); pthread_mutex_destroy(&mutex); return 0; }
在编写上述代码的时候还有一个需要注意是事项,不管是消费者线程的处理函数还是生产者线程的处理函数内部有这么两行代码:
// 消费者
sem_wait(&csem);
pthread_mutex_lock(&mutex);
// 生产者
sem_wait(&csem);
pthread_mutex_lock(&mutex);
这两行代码的调用顺序是不能颠倒的,如果颠倒过来就有可能会造成死锁,下面来分析一种死锁的场景:
void* producer(void* arg) { // 一直生产 while(1) { pthread_mutex_lock(&mutex); // 生产者拿一个信号灯 sem_wait(&psem); ...... ...... // 通知消费者消费 sem_post(&csem); pthread_mutex_unlock(&mutex); // 生产慢一点 sleep(rand() % 3); } return NULL; } // 消费者的回调函数 void* consumer(void* arg) { while(1) { pthread_mutex_lock(&mutex); sem_wait(&csem); ...... ...... // 通知生产者生成, 给生产者加信号灯 sem_post(&psem); pthread_mutex_unlock(&mutex); sleep(rand() % 3); } return NULL; } int main() { // 初始化信号量 sem_init(&psem, 0, 5); // 生成者线程一共有5个信号灯 sem_init(&csem, 0, 0); // 消费者线程一共有0个信号灯 ...... ...... return 0; }
在上面的代码中,初始化状态下消费者线程没有任务信号量资源,假设某一个消费者线程先运行,调用 pthread_mutex_lock(&mutex); 对互斥锁加锁成功,然后调用 sem_wait(&csem); 由于没有资源,因此被阻塞了。其余的消费者线程由于没有抢到互斥锁,因此被阻塞在互斥锁上。对应生产者线程第一步操作也是调用 pthread_mutex_lock(&mutex);,但是这时候互斥锁已经被消费者线程锁上了,所有生产者都被阻塞,到此为止,多余的线程都被阻塞了,程序产生了死锁。
文章作者: 苏丙榅
文章链接: https://subingwen.com/linux/thread-sync/
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。