使用x86汇编语言实现信号量

Question

使用x86汇编语言实现信号量

c++assemblyconcurrencyoperating-systemsemaphore

3

我对信号量实现方案很感兴趣，我了解到在x86中，我们可以使用“lock前缀”来实现原子操作，并想用它来实现互斥锁。我知道C++ 11现在有标准互斥锁，但我想自己实现。以下是我的代码：

#include <iostream>
#include <thread>
#include <vector>

struct Semaphore
{
private:
    int s;
public:
    Semaphore( int s ) : s(s){}
    void wait()
    {
        int *p = &s;
        _asm
        {
            mov eax, p
            lock dec DWORD PTR [eax]
    begin : mov ebx, DWORD PTR [eax]
            cmp ebx, 0
            jl begin
        };
    }

    void signal()
    {
        int *p = &s;
        _asm
        {
            mov eax, p
            lock inc DWORD PTR [eax]
        };
    }
} s(1);

void print()
{
    s.wait();
    std::cout << "Print Thread " << std::this_thread::get_id() << std::endl;
    s.signal();
}

int main( int argc, char* argv )
{
    std::vector< std::thread > vec;
    int n = 3;
    for( int i = 0; i < n; ++i ) vec.push_back( std::thread( print ) );
    for( int i = 0; i < n; ++i ) vec[i].join();

    return 0;
}

问题在于，当有两个线程时，代码可以正常运行，但是在有3个线程的情况下，程序似乎陷入了死锁状态，有人能解释一下为什么吗？或者给我一些关于如何在x86机器上实现它的建议？

- JavaBeta

就像Antti所说的那样，如果没有操作系统的支持，你是无法实现任何合理的信号量的。 - Martin James

一个合适的互斥锁或信号量无法完全在用户空间中实现，因为它需要与操作系统的调度程序进行通信。 - Kerrek SB

4个回答

2

您编写的代码并不是一个合适的信号量实现。信号量应将等待任务放入信号量的等待队列中；在此之后，直到该信号量再次被发信号为止，其代码不会运行；当信号量被发信号时，等待线程将被唤醒。信号量的一半代码位于内核中，如何访问它的详细信息在线程库实现中。因此，在C++中正确地实现信号量需要做一些更复杂的事情。或者您可以编写自己的操作系统。

另外，您没有说出您使用的编译器，但有可能您的编译器过于激进地优化了asm子句。

- Antti Haapala -- Слава Україні

2

这里涉及到多个问题，以下是其中两个：

你的wait()例程无条件地减少计数器。如果有两个等待者，则计数将为-2，并且在任何等待者停止等待之前，你需要两个信号。
信号量代码完全依赖于调度程序。因此，根据调度程序和等待者和发信者的优先级，等待任务（它们是忙循环）完全有可能永远不会让出另一个执行上下文。

希望这可以帮到你。

- Sparky

0

是的，我承认在没有操作系统或机器的帮助下无法实现自己的版本，所以我尝试使用C++11标准来实现一个版本，并且我发现斯坦福大学的一门课程提供了一个解决方案，我想与任何需要的人分享，这里是链接：http://www.stanford.edu/class/cs110/lectures/18-threading-and-semaphores.html#(3)。

- JavaBeta

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Jerry Coffin · Accepted Answer

你的wait实际上是一个自旋锁——当锁被争用时，它会（尝试）使用100%的CPU资源直到其他线程释放信号量。很不幸，因为它正在使用100%的CPU资源，这将阻止其他线程获得CPU时间，从而导致类似死锁的情况。

猜测你可能在双核CPU上运行。在这种情况下，即使自旋锁处于紧密循环中浪费CPU时间，其他线程也可以全速运行。当你的线程数超过可用CPU核心时，事情就会变得非常拖沓。

如果你有充分理由相信信号量会很快清除（在这种情况下，你希望避免任务切换的开销），自旋锁可以很有用。然而，在典型情况下，你想限制“自旋”所花费的时间，这样你的循环看起来会像：

        mov ecx, 100
begin : mov ebx, DWORD PTR [eax]
        test ebx, ebx
        loopnz begin

然后，在它跳出循环后，您检查信号量是否已清除，或者是否达到了您的限制（在这种情况下为100次迭代）。如果达到了限制，您将调用调度程序以让其他线程运行（并在此线程再次运行时重新尝试等待）。