datetime:2022/12/19 19:31
author:nzb

网络字节序与主机字节序

1.网络字节序与主机字节序

在Linux网络编程中,经常碰到网络字节序与主机字节序的相互转换。说到网络字节序与主机字节序需要清晰了解以下几个概念。

字节序,顾名思义,指字节在内存中存储的顺序。比如一个int32_t类型的数值占用4个字节,这4个字节在内存中的排列顺序就是字节序。字节序有两种:

  • (1)小端字节序(Little endinan),数值低位存储在内存的低地址,高位存储在内存的高地址;
  • (2)大端字节序(Big endian),数值高位存储在内存的低地址,低位存储在内存的高地址。

下面以32位位宽数值0x12345678为例,小端字节序与大端字节序具体的存储区别如下所示:

  • 主机字节序,即CPU存储数据时采用的字节顺序。不同的CPU设计时采用的字节序是不同的,谈到字节序的问题,必然牵涉到两大CPU派系。 那就是Motorola的PowerPC系列CPU和Intel的x86与x86_64(该指令集由AMD率先设计推出)系列CPU。 PowerPC系列采用大端字节序(big endian)方式存储数据,而x86与x86_64系列则采用小端字节序(little endian)方式存储数据。 平常大多数PC与服务器如果使用的是Intel与AMD CPU,一般都是小端字节序(little endian)

  • 网络字节序,是TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释。 网络字节顺序采用大端字节序(big endian)排序方式。

如何具体判断本机的主机字节序呢?参考如下代码:

//@ret:返回0小端字节序,返回1大端字节序
int dGetHostByteOrder()
{
    uint32_t a = 0x12345678;  
    uint8_t *p = (uint8_t *)(&a);  
    if(*p==0x78)
    {
        return 0
    }
    else
    {
        return 1;
    }
}

2.网络字节序与主机字节序的相互转换

2.1常用系统调用

Linux socket网络编程中,经常会使用下面四个C标准库函数进行字节序间的转换。

#include <arpa/inet.h>

uint32_t htonl(uint32_t hostlong);        //把uint32_t类型(4字节)从主机序转换到网络序, host to network long
uint16_t htons(uint16_t hostshort);        //把uint16_t类型(2字节)从主机序转换到网络序,host to network short
uint32_t ntohl(uint32_t netlong);        //把uint32_t类型从网络序转换到主机序
uint16_t ntohs(uint16_t netshort);        //把uint16_t类型从网络序转换到主机序

2.2 64位数值的转换

现在如果需要对64位类型数据进行主机字节序与网络字节序的转换,没有现成系统API可用,可以通过下面两种方法进行转换:

2.2.1使用移位

//主机序转网络序
unsigned long long htonll(unsigned long long val)
{
    if(__BYTE_ORDER == __LITTLE_ENDIAN)  
    {
         return (((unsigned long long )htonl((int)((val << 32) >> 32))) << 32) | (unsigned int)htonl((int)(val >> 32));  
    }  
    else if (__BYTE_ORDER == __BIG_ENDIAN)  
    {  
         return val;  
    }  
}  

//网络序转主机序
unsigned long long ntohll(unsigned long long val)  
{  
    if (__BYTE_ORDER == __LITTLE_ENDIAN)
    {
        return (((unsigned long long )ntohl((int)((val << 32) >> 32))) << 32) | (unsigned int)ntohl((int)(val >> 32));  
    }  
    else if (__BYTE_ORDER == __BIG_ENDIAN)  
    {  
        return val;  
    }
 }

2.2.2使用联合体union

根据联合体的特性:联合中所有成员引用的是内存中相同的位置,其长度为最长成员的长度。

typedef struct {  
    unsigned int u32_h;  
    unsigned int u32_l;  
}Int64_t;  

typedef union {  
    unsigned long long u64;  
    Int64_t st64;  
}Convert64_t;

//主机序转网络序
unsigned long long htonll(unsigned long long val)
{  
    if (__BYTE_ORDER == __LITTLE_ENDIAN)
    {
        Convert64_t box_in, box_out;  

        box_in.u64 = val;  
        box_out.st64.u32_h = htonl(box_in.st64.u32_l);  
        box_out.st64.u32_l = htonl(box_in.st64.u32_h);  
        return box_out.u64;
    }
    else if (__BYTE_ORDER == __BIG_ENDIAN)  
    {  
        return val;
    }
}

//网络序转主机序
unsigned long long ntohll(unsigned long long val)  
{
    if (__BYTE_ORDER == __LITTLE_ENDIAN)
    {
        Convert64_t box_in, box_out;  

        box_in.u64 = val;  
        box_out.st64.u32_h = ntohl(box_in.st64.u32_l);  
        box_out.st64.u32_l = ntohl(box_in.st64.u32_h);  
        return box_out.u64;
    }
    else if(__BYTE_ORDER == __BIG_ENDIAN)
    {
        return val;
    }
}

2.2.3使用编译器内置函数

#ifdef WIN32
#define ntohll(x)     _byteswap_uint64 (x)
#define htonll(x)     _byteswap_uint64 (x)
#else
#if __BYTE_ORDER == __BIG_ENDIAN
#define ntohll(x)       (x)
#define htonll(x)       (x)
#else 
#if __BYTE_ORDER == __LITTLE_ENDIAN
#define ntohll(x)     __bswap_64 (x)
#define htonll(x)     __bswap_64 (x)
#endif 
#endif  
#endif

results matching ""

    No results matching ""