将C++指针与LLVM JIT代码共享

5
我希望大部分程序都是普通编译的C++程序。该程序使用一块连续的内存作为堆栈。堆栈的顶部由普通指针维护。
我想与通过LLVM JIT生成的代码共享该指针。例如,给定:
llvm::InitializeNativeTarget();

llvm::LLVMContext ctx;
std::unique_ptr<llvm::Module> uptr_module = llvm::make_unique<llvm::Module>( "lt", ctx );
llvm::Module *const module = uptr_module.get();

int *const stack = new int[100];
int *top = stack;                 // I want this pointer to be shared with JIT'd code

llvm::Function *const func = llvm::cast<llvm::Function>(
    module->getOrInsertFunction( "func", llvm::Type::getVoidTy( ctx ), (llvm::Type*)0 )
);
llvm::BasicBlock *const block = llvm::BasicBlock::Create( ctx, "entry", func );

pointerInc( &top, block );        // Increment the pointer in JIT'd code

llvm::ReturnInst::Create( ctx, block );
llvm::verifyFunction( *func, &llvm::outs() );
llvm::verifyModule( *module, &llvm::outs() );
module->dump();

llvm::EngineBuilder eb( std::move( uptr_module ) );
llvm::ExecutionEngine *const exec = eb.create();
assert( exec );

void *const func_ptr = exec->getPointerToFunction( func );
assert( func_ptr );
typedef void (*PFv_v)();
(*(PFv_v)func_ptr)();             // Call JIT'd function

pointerInc()会将JIT代码插入当前的BasicBlock以增加toppointerInc()代码如下:

// Convert a raw C++ pointer into an LLVM Constant*.
template<typename T>
inline llvm::Value* ptrToValue( T **pptr, llvm::LLVMContext &ctx ) {
    return return llvm::ConstantInt::get( llvm::Type::getInt64Ty( ctx ), (uint64_t)pptr );
}

void pointerInc( llvm::Constant *pptrAsInt64, llvm::ConstantInt *sizeof_T,
                 llvm::BasicBlock *block ) {
    llvm::LLVMContext &ctx = block->getContext();

    llvm::Constant *const intToPtr8 = llvm::ConstantExpr::getIntToPtr(
        pptrAsInt64, llvm::PointerType::getUnqual( llvm::Type::getInt8Ty( ctx ) )
    );

    llvm::GetElementPtrInst *const inc =
        llvm::GetElementPtrInst::Create( intToPtr8, sizeof_T, "inc", block );

    llvm::CastInst *const cast = llvm::CastInst::CreatePointerCast(
        inc, llvm::Type::getInt64Ty( ctx ), "cast", block
    );

    llvm::Constant *const intToPtr64 = llvm::ConstantExpr::getIntToPtr(
        pptrAsInt64, llvm::PointerType::getUnqual( llvm::Type::getInt64Ty( ctx ) )
    );

    llvm::StoreInst *const store = new llvm::StoreInst( cast, intToPtr64, false, block );
    store->setAlignment( 8 );
}

template<typename T>
inline void pointerInc( T **pptr, llvm::BasicBlock *block ) {
    llvm::LLVMContext &ctx = block->getContext();
    llvm::ConstantInt *const sizeof_T =
        llvm::ConstantInt::get( llvm::Type::getInt64Ty( ctx ), sizeof( T ) );
    pointerInc( ptrToValue( pptr, ctx ), sizeof_T, block );
}

很遗憾,这样做行不通。更准确地说,是 pointerInc() 的主体有问题。这段代码实际上是从 LLVM C++ API 代码中派生出来的,由 llc 在一个普通的 C++ 程序上生成,该程序增加了一个指针。

运行时,该程序会打印:

&p = 140734551679784
--------------------
; ModuleID = 'lt'

define void @func() {
entry:
  %inc = getelementptr i8* inttoptr (i64 140734551679784 to i8*), i64 4
  %cast = ptrtoint i8* %inc to i64
  store i64 %cast, i64* inttoptr (i64 140734551679784 to i64*), align 8
  ret void
}
Segmentation fault: 11 (core dumped)

有两个问题:

  1. 这是否正确?我能否做到我想要的,即与JIT'd代码共享原始C ++指针?
  2. 为什么会出现核心转储?

即使我使JIT'd函数为空,代码仍然在调用该函数的行处出现核心转储。 LLVM JIT设置代码看起来像我见过的所有示例,所以我不知道哪里出了问题。

需要一点帮助?


更新

如果我更改已弃用的行:

void *const func_ptr = exec->getPointerToFunction( func );

转到新行:

uint64_t const func_ptr = exec->getFunctionAddress( "func" );

如果func_ptr为空,则意味着函数指针无效。

我在这里写过类似的东西:http://eli.thegreenplace.net/2015/calling-back-into-python-from-llvmlite-jited-code -- 它使用了LLVM的Python绑定,但主要思想是相同的--让JIT代码意识到主程序中的某些内容。 - Eli Bendersky
我认为它们不够相似。你似乎正在从JIT编译的代码中调用一个函数。我只想从JIT编译的代码中增加一个指针。 - Paul J. Lucas
你可以在一些 LLVM-dev 邮件列表上或者一些 LLVM IRC 频道 上提问。你也可以使用其他技术:GCCJITlibjitasmjit,等等;并且你可以列出产生的汇编代码以更好地理解它。 - Basile Starynkevitch
@PaulJ.Lucas:确切地说,这是一种从JIT回到主机代码的方法。实现一个主机端函数来增加指针。从JIT中调用它。完成。此外,似乎你无论做什么都无法让JIT正常工作? - Eli Bendersky
1个回答

2

在更多地尝试了使用更好的C++代码来输入到lcc的过程中,我已经让它正常工作:

llvm::Value* pointerToPointer( void *ptr, llvm::BasicBlock *block ) {
    using namespace llvm;
    LLVMContext &ctx = block->getContext();
    ConstantInt *const ptrAsInt =
        ConstantInt::get( IntegerType::get( ctx, 64 ), (uint64_t)ptr );
    PointerType *const Int8Ptr_type = Type::getInt8PtrTy( ctx );
    PointerType *const Int8PtrPtr_type = PointerType::getUnqual( Int8Ptr_type );
    return new IntToPtrInst( ptrAsInt, Int8PtrPtr_type, "pptr", block );
}

void pointerInc( llvm::Value *pptr, llvm::ConstantInt *sizeof_T,
                llvm::BasicBlock *block ) {
    using namespace llvm;
    LLVMContext &ctx = block->getContext();

    LoadInst *const ptr = new LoadInst( pptr, "ptr", block );
    ptr->setAlignment( sizeof(void*) );

    GetElementPtrInst *const inc =
        GetElementPtrInst::Create( ptr, sizeof_T, "inc", block );

    StoreInst *const store = new StoreInst( inc, pptr, block );
    store->setAlignment(sizeof(void*));
}

template<typename T>
inline void pointerInc( T **pptr, llvm::BasicBlock *block ) {
    using namespace llvm;
    LLVMContext &ctx = block->getContext();
    ConstantInt *const sizeof_T = ConstantInt::get(
        IntegerType::get( ctx, 64 ), (uint64_t)sizeof( T )
    );
    pointerInc( pointerToPointer( pptr, block ), sizeof_T, block );
}

然而,只有通过以下方式调用JIT编译的函数时,程序才能成功运行:
vector<GenericValue> noargs;
exec->runFunction( func, noargs );

使用getFunctionAddress()getPointerToFunction()都会导致核心转储。对此我仍然没有答案。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接