C语言编程中的联合体union入门学习教程

 更新时间:2015年12月02日 17:59:41   作者:海子  
这篇文章主要介绍了C语言编程中的联合体union入门学习教程,也是C语言入门学习中的基础知识,需要的朋友可以参考下

联合体(union)在C语言中是一个特殊的数据类型,能够存储不同类型的数据在同一个内存位置。可以定义一个联合体使用许多成员,但只有一个部件可以包含在任何时候给定的值。联合体会提供使用相同的存储器位置供多用途的有效方式。

定义联合体
要定义联合体,必须使用union语句很相似于定义结构。联合体声明中定义了一个新的数据类型,程序不止一个成员。联合体声明的格式如下:

union [union tag]
{
  member definition;
  member definition;
  ...
  member definition;
} [one or more union variables]; 

union标签是可选的,每个成员的定义是一个正常的变量定义,如 int i; 和 float f; 或任何其他有效的变量的定义。在联合体定义的结尾,最后分号之前,可以指定一个或多个变量的联合,但它是可选的。这里定义一个名为数据联合类型有三个成员 i, f, 和 str:

union Data
{
  int i;
  float f;
  char str[20];
} data; 

现在,数据类型的变量可以存储的整数,一个浮点数,或字符的字符串。这意味着一个单可变结构即相同的存储单元可用于存储多个类型的数据。可以使用任何内置或用户定义的数据类型根据需要在联合里面。

通过union所占用的内存将大到足以容纳联合体的最大成员。例如,在上面的例子中的数据类型将占用20个字节的存储空间,因为这是通过文字串所占用的最大空间。以下将显示由上述联合共占用内存大小的例子:

#include <stdio.h>
#include <string.h>
 
union Data
{
  int i;
  float f;
  char str[20];
};
 
int main( )
{
  union Data data;    

  printf( "Memory size occupied by data : %d
", sizeof(data));

  return 0;
}

让我们编译和运行上面的程序,这将产生以下结果:

Memory size occupied by data : 20

访问联合体成员
要访问联合体的任何成员,我们使用成员访问运算符(.)。成员访问运算符编码为联合体变量名和成员,访问时使用union关键字定义联合体类型的变量。以下为例子来解释联合体的用法:

#include <stdio.h>
#include <string.h>
 
union Data
{
  int i;
  float f;
  char str[20];
};
 
int main( )
{
  union Data data;    

  data.i = 10;
  data.f = 220.5;
  strcpy( data.str, "C Programming");

  printf( "data.i : %d
", data.i);
  printf( "data.f : %f
", data.f);
  printf( "data.str : %s
", data.str);

  return 0;
}

让我们编译和运行上面的程序,这将产生以下结果:

data.i : 1917853763
data.f : 4122360580327794860452759994368.000000
data.str : C Programming

在这里,我们可以看到,联合体成员i 和f 值被损坏,因为分配给变量终值已占用的内存位置,如果str成员的值被很好的打印的原因。现在,让我们来再一次看看同样的例子,我们将使用一个变量在同一时间,它是联合体的主要目的:

#include <stdio.h>
#include <string.h>
 
union Data
{
  int i;
  float f;
  char str[20];
};
 
int main( )
{
  union Data data;    

  data.i = 10;
  printf( "data.i : %d
", data.i);
  
  data.f = 220.5;
  printf( "data.f : %f
", data.f);
  
  strcpy( data.str, "C Programming");
  printf( "data.str : %s
", data.str);

  return 0;
}

让我们编译和运行上面的程序,这将产生以下结果:

data.i : 10
data.f : 220.500000
data.str : C Programming

这里,所有的成员都得到打印得非常好,因为一个部件被一次使用。

应用场合
当多个数据需要共享内存或者多个数据每次只取其一时,可以利用联合体(union)。在C Programming Language 一书中对于联合体是这么描述的:

     1)联合体是一个结构;

     2)它的所有成员相对于基地址的偏移量都为0;

     3)此结构空间要大到足够容纳最"宽"的成员;

     4)其对齐方式要适合其中所有的成员;

下面解释这四条描述:

     由于联合体中的所有成员是共享一段内存的,因此每个成员的存放首地址相对于于联合体变量的基地址的偏移量为0,即所有成员的首地址都是一样的。为了使得所有成员能够共享一段内存,因此该空间必须足够容纳这些成员中最宽的成员。对于这句“对齐方式要适合其中所有的成员”是指其必须符合所有成员的自身对齐方式。

下面举例说明:

如联合体

union U
{
  char s[9];
  int n;
  double d;
};

s占9字节,n占4字节,d占8字节,因此其至少需9字节的空间。然而其实际大小并不是9,用运算符sizeof测试其大小为16.这是因为这里存在字节对齐的问题,9既不能被4整除,也不能被8整除。因此补充字节到16,这样就符合所有成员的自身对齐了。从这里可以看出联合体所占的空间不仅取决于最宽成员,还跟所有成员有关系,即其大小必须满足两个条件:1)大小足够容纳最宽的成员;2)大小能被其包含的所有基本数据类型的大小所整除。

测试程序:

/*测试联合体 2011.10.3*/

#include <iostream>
using namespace std;

union U1
{
  char s[9];
  int n;
  double d;
};

union U2
{
  char s[5];
  int n;
  double d;
};

int main(int argc, char *argv[])
{
  U1 u1;
  U2 u2;
  printf("%d\n",sizeof(u1));
  printf("%d\n",sizeof(u2));
  printf("0x%x\n",&u1);
  printf("0x%x\n",&u1.s);
  printf("0x%x\n",&u1.n);
  printf("0x%x\n",&u1.d);
  u1.n=1;
  printf("%d\n",u1.s[0]);
  printf("%lf\n",u1.d);
  unsigned char *p=(unsigned char *)&u1;
  printf("%d\n",*p);
  printf("%d\n",*(p+1));
  printf("%d\n",*(p+2));
  printf("%d\n",*(p+3));
  printf("%d\n",*(p+4));
  printf("%d\n",*(p+5));
  printf("%d\n",*(p+6));
  printf("%d\n",*(p+7));
  return 0;
}

输出结果为:

16
8
0x22ff60
0x22ff60
0x22ff60
0x22ff60
1
0.000000
1
0
0
0
48
204
64
0
请按任意键继续. . .

对于sizeof(u1)=16。因为u1中s占9字节,n占4字节,d占8字节,因此至少需要9字节。其包含的基本数据类型为char,int,double分别占1,4,8字节,为了使u1所占空间的大小能被1,4,8整除,则需填充字节以到16,因此sizeof(u1)=16.

对于sizeof(u2)=8。因为u2中s占5字节,n占4字节,d占8字节,因此至少需要8字节。其包含的基本数据类型为char,int,double分别占1,4,8字节,为了使u2所占空间的大小能被1,4,8整除,不需填充字节,因为8本身就能满足要求。因此sizeof(u2)=8。

从打印出的每个成员的基地址可以看出,联合体中每个成员的基地址都相同,等于联合体变量的首地址。

对u1.n=1,将u1的n赋值为1后,则该段内存的前4个字节存储的数据为00000001 00000000 00000000 00000000

因此取s[0]的数据表示取第一个单元的数据,其整型值为1,所以打印出的结果为1.

至于打印出的d为0.000000愿意如下。由于已知该段内存前4字节的单元存储的数据为00000001 00000000 00000000 00000000,从上面打印结果48,204,64,0可以知道后面4个字节单元中的数据为00110000 11001100 01000000 00000000,因此其表示的二进 制浮点数为

00000000 01000000 11001100 00110000 00000000 00000000 00000000 00000001

对于double型数据,第63位0为符号位,62-52 00000000100为阶码,0000 11001100 00110000 00000000 00000000 00000000 00000001为尾数,根据其值知道尾数值约为0,而阶码为4-1023=-1019,因此其表示的浮点数为1.0*2^(-1019)=0.00000000000......,因此输出结果为0.000000。

相关文章

  • C语言中static和auto用法详解

    C语言中static和auto用法详解

    大家好,本篇文章主要讲的是C语言中static和auto用法详解,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下
    2022-01-01
  • 浅谈关于指针作为参数并改变它的值的问题

    浅谈关于指针作为参数并改变它的值的问题

    这篇文章介绍了关于指针作为参数并改变它的值的问题,有需要的朋友可以参考一下
    2013-10-10
  • C++ qsort函数排序与冒泡模拟实现流程详解

    C++ qsort函数排序与冒泡模拟实现流程详解

    qsort是一个库函数,基于快速排序算法实现的一个排序的函数,下面这篇文章主要给大家介绍了关于C语言qsort()函数使用的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-10-10
  • C++面向对象编程之析构详解

    C++面向对象编程之析构详解

    这篇文章主要为大家详细介绍了C++面向对象编程之析构,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-03-03
  • C语言结构体指针的具体使用

    C语言结构体指针的具体使用

    结构体指针是一种非常有用的数据类型,它可以让我们更方便地操作结构体,本文主要介绍了C语言结构体指针的具体使用,非常具有实用价值,需要的朋友可以参考下
    2023-05-05
  • C++中菱形继承的解释与处理详解

    C++中菱形继承的解释与处理详解

    菱形继承是多重继承中跑不掉的,Java拿掉了多重继承,辅之以接口。C++中虽然没有明确说明接口这种东西,但是只有纯虚函数的类可以看作Java中的接口,下面这篇文章主要给大家介绍了关于C++中菱形继承的解释与处理的相关资料,需要的朋友可以参考下
    2022-02-02
  • C语言数据结构实例讲解单链表的实现

    C语言数据结构实例讲解单链表的实现

    单链表是后面要学的双链表以及循环链表的基础,要想继续深入了解数据结构以及C++,我们就要奠定好这块基石!接下来就和我一起学习吧
    2022-03-03
  • C++设计模式之抽象工厂模式

    C++设计模式之抽象工厂模式

    这篇文章主要介绍了C++设计模式之抽象工厂模式,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • 浅析c++ 宏 #val 在unicode下的使用

    浅析c++ 宏 #val 在unicode下的使用

    以下是对c++中宏#val在unicode下的使用方法进行了详细的分析介绍,需要的朋友可以参考下
    2013-07-07
  • C++内存泄漏及检测工具详解

    C++内存泄漏及检测工具详解

    最简单的方法当然是借助于专业的检测工具,比较有名如BoundsCheck,功能非常强大,相信做C++开发的人都离不开它。此外就是不使用任何工具,而是自己来实现对内存泄露的监控
    2013-10-10

最新评论