如何使用Netlink套接字与内核模块通信?

53

我正在尝试编写一个与用户进程使用netlink通信的Linux内核模块。我使用netlink是因为我想要通信的用户程序只能使用套接字,而我无法更改它以添加ioctl()或其他内容。

然而,我无法弄清楚如何做到这一点!我找到了一些旧的示例,比如this one,但这些示例对于当前的内核版本已经不再有效。我还看过this SO question,但这里的示例使用libnl进行套接字操作,而我想坚持使用标准的套接字函数(由sys/socket.h定义)。请问有人可以指导我一下,提供一些教程、指南或其他可以帮助我理解netlink接口和用法的资源吗?我将非常感激一个可行的示例;没有太复杂的东西,只是一个非常基本的示例,展示如何从用户程序的套接字建立与内核套接字的连接,然后从用户进程向内核发送数据,并从内核接收返回的数据。

请不要告诉我去看内核代码。我已经在做了,但这需要很长时间,而我剩下的时间很少。
经过多次尝试,我有以下代码,可以从用户程序发送消息到内核,但内核到用户程序的消息(使用netlink_unicast())无法正常工作。它不仅不能正常工作,而且会导致系统挂起,然后我必须重新启动机器。请问有没有人可以帮忙看一下,告诉我问题出在哪里?在以下代码中,netlink_unicast()调用被注释了。为了让内核向用户程序发送消息,应该将其取消注释。

用户程序

#include <sys/socket.h>  
#include <linux/netlink.h>  
#define NETLINK_USER 31  
#define MAX_PAYLOAD 1024  /* maximum payload size*/  

struct sockaddr_nl src_addr, dest_addr;  
struct nlmsghdr *nlh = NULL;  
struct iovec iov;  
int sock_fd;  
struct msghdr msg;  
 
void main()  
{  
    sock_fd=socket(PF_NETLINK, SOCK_RAW, NETLINK_USER);  
    if(sock_fd<0)  
        return -1;  

    memset(&src_addr, 0, sizeof(src_addr));  
    src_addr.nl_family = AF_NETLINK;  
    src_addr.nl_pid = getpid();  /* self pid */  
    /* interested in group 1<<0 */  
    bind(sock_fd, (struct sockaddr*)&src_addr,  
      sizeof(src_addr));  

    memset(&dest_addr, 0, sizeof(dest_addr));  
    memset(&dest_addr, 0, sizeof(dest_addr));  
    dest_addr.nl_family = AF_NETLINK;  
    dest_addr.nl_pid = 0;   /* For Linux Kernel */  
    dest_addr.nl_groups = 0; /* unicast */  

    nlh = (struct nlmsghdr *)malloc(  
                          NLMSG_SPACE(MAX_PAYLOAD));  
    memset(nlh, 0, NLMSG_SPACE(MAX_PAYLOAD));  
    nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);  
    nlh->nlmsg_pid = getpid();  
    nlh->nlmsg_flags = 0;  

    strcpy(NLMSG_DATA(nlh), "Hello");  

    iov.iov_base = (void *)nlh;  
    iov.iov_len = nlh->nlmsg_len;  
    msg.msg_name = (void *)&dest_addr;  
    msg.msg_namelen = sizeof(dest_addr);  
    msg.msg_iov = &iov;  
    msg.msg_iovlen = 1;  

    printf("Sending message to kernel\n");  
    sendmsg(sock_fd,&msg,0);  
    printf("Waiting for message from kernel\n");  

    /* Read message from kernel */  
    recvmsg(sock_fd, &msg, 0);  
    printf(" Received message payload: %s\n",  
        NLMSG_DATA(nlh));  
    close(sock_fd);  
}

内核代码

#include <linux/module.h>  
#include <linux/kernel.h>  
#include <linux/init.h>  
#include <net/sock.h>  
#include <linux/socket.h>  
#include <linux/net.h>  
#include <asm/types.h>  
#include <linux/netlink.h>  
#include <linux/skbuff.h>  
 
#define NETLINK_USER 31  

struct sock *nl_sk = NULL;  

static void hello_nl_recv_msg(struct sk_buff *skb)  
{
        struct nlmsghdr *nlh;  
        int pid;  

        printk(KERN_INFO "Entering: %s\n", __FUNCTION__);  

        nlh=(struct nlmsghdr*)skb->data;  
        printk(KERN_INFO "Netlink received msg payload: %s\n",
            (char*)NLMSG_DATA(nlh));  
        pid = nlh->nlmsg_pid; /*pid of sending process */  
        NETLINK_CB(skb).dst_group = 0; /* not in mcast group */  
        NETLINK_CB(skb).pid = 0;      /* from kernel */  
        //NETLINK_CB(skb).groups = 0; /* not in mcast group */  
        //NETLINK_CB(skb).dst_pid = pid;  
        printk("About to send msg bak:\n");  
        //netlink_unicast(nl_sk,skb,pid,MSG_DONTWAIT);  

}  

static int __init hello_init(void)  
{  

        printk("Entering: %s\n",__FUNCTION__);  
        nl_sk=netlink_kernel_create(&init_net, NETLINK_USER, 0,
               hello_nl_recv_msg, NULL, THIS_MODULE);  
        if(!nl_sk)  
        {   
                printk(KERN_ALERT "Error creating socket.\n");  
                return -10;  
        }  
        return 0;  
}  

static void __exit hello_exit(void)  
{

        printk(KERN_INFO "exiting hello module\n");  
        netlink_kernel_release(nl_sk);  
}  

module_init(hello_init);  
module_exit(hello_exit);  

1
这怎么可能呢,有10个人将其标记为收藏,但只有5个人点赞它? - Donal Lafferty
我知道有点晚了,但是这本书(第二章)也讨论了netlink套接字:http://www.amazon.com/Linux-Kernel-Networking-Implementation-Experts/dp/143026196X - holgac
只要在全局范围内定义了 struct msghdr msg;,此用户程序就能正常工作。但是一旦我将其移动到函数内部(例如 main 函数),用户程序就无法正常工作,sendmsg 返回 -1 并设置 errno 为错误代码 105(ENOBUFS - 没有可用的缓冲区空间)。有人能解释一下为什么在此程序中只有在全局范围内定义 msghdr 才能正常工作吗? - Unglued
4个回答

68

在阅读内核源代码后,我最终成功地让netlink套接字对我起作用。下面是Netlink套接字基础的示例,即打开Netlink套接字、读写并关闭它。

内核模块

#include <linux/module.h>
#include <net/sock.h> 
#include <linux/netlink.h>
#include <linux/skbuff.h> 
#define NETLINK_USER 31

struct sock *nl_sk = NULL;

static void hello_nl_recv_msg(struct sk_buff *skb)
{

    struct nlmsghdr *nlh;
    int pid;
    struct sk_buff *skb_out;
    int msg_size;
    char *msg = "Hello from kernel";
    int res;

    printk(KERN_INFO "Entering: %s\n", __FUNCTION__);

    msg_size = strlen(msg);

    nlh = (struct nlmsghdr *)skb->data;
    printk(KERN_INFO "Netlink received msg payload:%s\n", (char *)nlmsg_data(nlh));
    pid = nlh->nlmsg_pid; /*pid of sending process */

    skb_out = nlmsg_new(msg_size, 0);
    if (!skb_out) {
        printk(KERN_ERR "Failed to allocate new skb\n");
        return;
    }

    nlh = nlmsg_put(skb_out, 0, 0, NLMSG_DONE, msg_size, 0);
    NETLINK_CB(skb_out).dst_group = 0; /* not in mcast group */
    strncpy(nlmsg_data(nlh), msg, msg_size);

    res = nlmsg_unicast(nl_sk, skb_out, pid);
    if (res < 0)
        printk(KERN_INFO "Error while sending bak to user\n");
}

static int __init hello_init(void)
{

    printk("Entering: %s\n", __FUNCTION__);
    //nl_sk = netlink_kernel_create(&init_net, NETLINK_USER, 0, hello_nl_recv_msg, NULL, THIS_MODULE);
    struct netlink_kernel_cfg cfg = {
        .input = hello_nl_recv_msg,
    };

    nl_sk = netlink_kernel_create(&init_net, NETLINK_USER, &cfg);
    if (!nl_sk) {
        printk(KERN_ALERT "Error creating socket.\n");
        return -10;
    }

    return 0;
}

static void __exit hello_exit(void)
{

    printk(KERN_INFO "exiting hello module\n");
    netlink_kernel_release(nl_sk);
}

module_init(hello_init); module_exit(hello_exit);

MODULE_LICENSE("GPL");

用户程序

#include <linux/netlink.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/socket.h>
#include <unistd.h>

#define NETLINK_USER 31

#define MAX_PAYLOAD 1024 /* maximum payload size*/
struct sockaddr_nl src_addr, dest_addr;
struct nlmsghdr *nlh = NULL;
struct iovec iov;
int sock_fd;
struct msghdr msg;

int main()
{
    sock_fd = socket(PF_NETLINK, SOCK_RAW, NETLINK_USER);
    if (sock_fd < 0)
        return -1;

    memset(&src_addr, 0, sizeof(src_addr));
    src_addr.nl_family = AF_NETLINK;
    src_addr.nl_pid = getpid(); /* self pid */

    bind(sock_fd, (struct sockaddr *)&src_addr, sizeof(src_addr));

    memset(&dest_addr, 0, sizeof(dest_addr));
    dest_addr.nl_family = AF_NETLINK;
    dest_addr.nl_pid = 0; /* For Linux Kernel */
    dest_addr.nl_groups = 0; /* unicast */

    nlh = (struct nlmsghdr *)malloc(NLMSG_SPACE(MAX_PAYLOAD));
    memset(nlh, 0, NLMSG_SPACE(MAX_PAYLOAD));
    nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);
    nlh->nlmsg_pid = getpid();
    nlh->nlmsg_flags = 0;

    strcpy(NLMSG_DATA(nlh), "Hello");

    iov.iov_base = (void *)nlh;
    iov.iov_len = nlh->nlmsg_len;
    msg.msg_name = (void *)&dest_addr;
    msg.msg_namelen = sizeof(dest_addr);
    msg.msg_iov = &iov;
    msg.msg_iovlen = 1;

    printf("Sending message to kernel\n");
    sendmsg(sock_fd, &msg, 0);
    printf("Waiting for message from kernel\n");

    /* Read message from kernel */
    recvmsg(sock_fd, &msg, 0);
    printf("Received message payload: %s\n", NLMSG_DATA(nlh));
    close(sock_fd);
}

关于神奇常量NETLINK_USER 31的相关讨论:Can I have more than 32 netlink sockets in kernelspace?


2
你能否也添加README文件,以便其他人可以构建/运行和测试此代码,并提供反馈。谢谢。 - Raulp
1
如何编译?在编译时是否有任何选项可提供? - duslabo
1
能否使用用户=31运行?我只能让它在用户=0的情况下工作。 - lang2
1
能否在函数中使用netlink_kernel_create(),而不是内核初始化中?这样,该函数就能监听来自用户空间的消息了。 - user1252280
你不应该释放 skb_out 吗?我刚写了一个类似的内核模块,当我尝试 kfree_skb(skb_out) 时它会崩溃。 - Abhishek Sagar
@AbhishekSagar 你不应该释放skb_out。nlmsg_unicast在底层会自动为您释放它。另请参见https://dev59.com/UmLVa4cB1Zd3GeqPyads@binW 在用户程序中的sendmsg(...)之后添加free(nlh)以避免内存泄漏。另请参见https://stackoverflow.com/questions/21831121/ - TekuConcept

9
只是为了防止有人不知道如何编译,请谷歌“如何编译和加载内核模块”。
参考http://www.cyberciti.biz/tips/compiling-linux-kernel-module.html
获取要编译模块的内核源代码http://kernel.org
或者,如果您正在运行所需的内核,则只需更新您的头即可。
# apt-get install kernel-headers-$(uname -r)

创建一个makefile,例如:
obj-m = hello.o
KVERSION = $(shell uname -r)
all:
        make -C /lib/modules/$(KVERSION)/build M=$(PWD) modules
clean:
        make -C /lib/modules/$(KVERSION)/build M=$(PWD) clean

制作后会得到一堆文件,其中*.ko是需要加载到您的内核中的,运行即可。
# insmod hello.ko

如果使用lsmod检查所有已加载的模块,您将找到自己的模块,最有可能看到:

hello       12575  0 

在我们的情况下,编译和运行用户代码:

gcc hello.c -o hello.o
./hello.o

如果一切顺利,使用binW的代码你将得到以下消息:
Sending message to kernel
Waiting for message from kernel
 Received message payload: Hello from kernel

最后,可以使用以下命令移除该模块:

# rmmod hello

7

对于3.2内核,这对我有效。对于3.6及以上版本的内核,需要在netlink_kernel_create函数上进行一些更改。

 struct netlink_kernel_cfg cfg = {
                .groups = 1,
                .input = hello_nl_recv_msg,
        };
        printk("Entering: %s\n", __FUNCTION__);
        nl_sk = netlink_kernel_create(&init_net, NETLINK_USER, &cfg);

0

你需要在客户端代码中包含以下头文件:

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

我已经修复了。请考虑删除这个答案。 - Ciro Santilli OurBigBook.com

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接