如何将自定义数据类型巧妙地应用于复杂的数据处理场景?

2026-04-11 20:462阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计2219个文字,预计阅读时间需要9分钟。

如何将自定义数据类型巧妙地应用于复杂的数据处理场景?

内置类型---int, short, char, double, float---C语言自带的类型 + 复杂类型---结构体, 枚举, 联合体---自定义类型 + 结构体 + 结构体类型引用声明 + 结构体是一系列值的集合,这些值可以是不同类型。

内置类型---int short char double flaot---C语言自己的类型

如何将自定义数据类型巧妙地应用于复杂的数据处理场景?

复杂类型---结构体,枚举,联合体---自己创造的类型

结构体

  • 结构体类型引用声明

结构体是一些值的集合,这些值可以是不同类型。

struct Stu//如果不屑Stu就是匿名结构体类型 { member-list;//--成员列表 }Variable-list;//变量列表 //声明一个结构体类型 struct Stu //结构体标签 { //声明结构体变量(成员变量) char name[20]; char tele[15]; char sex[10]; int age; }s3,s4,s5; //都是全局变量--可以一次创建多个 struct Stu s;//全局变量 int main() { //创建结构体变量---局部变量 struct Stu s1; struct Stu s2; return 0; }

匿名结构体类型,只能在变量列表创建,不可能在别处创建---特点:该结构体只能用一次

struct { char name[20]; int age; }sa;//只能在这创建 struct { char name[20]; int age; }* psa; int main() { psa = &sa;//是不能赋值的,因为编译器认为这是两个完全不同的类型 return 0; }


  • 结构体自引用

结构体内不能包含一个类型为该结构本身的成员,但是可以包含该结构体的指针,因为指针的大小是确定的。如果用typedef重定义匿名函数,则不能实现自引用


  • 结构体变量的定义和初始化
  • 结构体内存对齐
  1. 第一个成员在于结构体变量偏移量为0的地址处
  2. 其他成员变量要对其某个成员数字(对齐数)的整数倍的地址处。对齐数:编译器默认的对齐数,与该成员大小的较小值,vs2013编译器默认的大小是8 gcc编译器没有设置默认对齐数
  3. 结构体的大小必须是对齐数的整数倍
  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
  5. 数组的对齐数是---数组的元素是什么,那它的最大对齐数就拿它数组的类型

为什么存在内存对齐:

  1. 平台原因:不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  2. 性能原因:数据结构(尤其是栈)应该尽可能的在自然边界上对齐,原因在于,为了访问未对其的内存,处理器需要做两次内存访问,而对齐的内存仅需要一次访问。

总的来说:结构体的内存对齐是拿空间换取时间的做法

让占用空间小的成员变量尽量集中在一起

#pragma pack(4) //可以设置默认对齐块---把默认对齐数设置为4 #pragma pack() //取消设置默认对齐数

offsetof不是函数,它是宏,因此他的参数可以传类型的(struct Name),不是变量名

size_t offsetof(struct Name ,member Name); //计算结构体的某个值的偏移量,头文件#include <stddef.h>


  • 结构体传参

如果要初始化结构体的内容的话,需要传地址,如果不是地址的话,初始化函数的参数只是结构体的一份临时拷贝,并不会初始化成功。

如果是打印的话,不需要改变结构体的值,则传不传地址都可以---但是延申一个传值和传址问题 ,两者相比较起来,传址更优,因为,只需要传一个地址,无论结构体有多大,地址的大小只有4/8个字节;传值的话,如果结构体过大,则会压榨内存空间,空间花销过大,性能降低,同时又出现一个问题,就是传值相对于传址安全,因为传址可能会改变结构体原有的大小,对于这种现象,我们也有办法避免,只需要在传的地址前加上const来修饰,这样地址就不会被改变


  • 结构体实现位段(位段的可填充&可移植性)

位段的成员必须是int unsigned int signed int三种类型(但是经过大量实践证明,不止这三种,只要是整形就可以了比如char short) 而位段的成员名后面有一个冒号和数字。 这个数字的含义是这个变量占几个bit位,因为一个字节只有32个位,所以这个数字是不能超过32的,位段一般是以int(4个字节)和char(一个字节)来开辟空间的

位段在内存中的存储方式

struct Q { int a : 2;//数字是bit位,指的是a占用两个bit位 一个字节8个bit位 int b : 5; int c : 10; int d : 30; };

abc同时存储在一个字节内,此时该字节还剩15个bit位,但是d需要30个bit位,因此废弃这15个bit位,另辟一个空间存放d,在另一个空间内,还剩两个bit没有被存储,所以该空间也被废弃

位段就是节省空间而存在的

位段跨平台问题

  • int位段被当成有符号还是无符号数是不确定的
  • 位段中最大位的数目不能被确定(16位机器中16位最大,32位机器中32位最大,27在32位中可执行,在16位中就不能被执行)
  • 位段中的成员在内存中从左向右分配,还是从右向左分配未定义
  • 当一个结构体包含两个位段时,当第二个位段较大,无法容纳第一个位段剩余的位时,是舍弃剩余位还是利用这是不确定的


vs2013位段内存的存储方式:现根据类型int或者char选择开辟1个或者4个字节,在字节中的使用方式是先使用低位在使用高位,由右向左使用我的bit位,如果当前开辟的空间剩下的内存不足以存放我的下一个数据的时候,我们就把该剩下的空间浪费掉,然后重新开辟空间,去使用下一个空间,下一个空间的使用依然是先使用低位,直至把所有数据都放进去

枚举

  • 枚举类型的定义

枚举是一种类型

enum Sex { //是一种类型 //枚举的可能取值---常量 male=2,//male=2是给它赋一个初始值 默认的初始值是0 female,//当male=2时,female就是3 secret//4 }; int main() { enum Sex s = male;//只能取枚举内定义的值 printf("%d %d %d",male,female,secret); return 0; }

因此枚举的大小也是整形的大小

c语言的源代码->预编译->编译------链接-----可执行程序

  • 预编译:冗余删除


  • 枚举的优点

也可以使用#define 命名替换,但是枚举比起#define的优势有

  • 增加代码的可读性和可维护性
  • 和#define定义的标识符比较枚举有类型检查,更加严谨(#define是进行替换的,没有固定的类型)
  • 防止命名污染(封装)
  • 便于调试
  • 使用方便,一次可以定义多个常量


  • 枚举的使用


联合

  • 联合类型的定义

联合也是一特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间


  • 联合的特点

联合体的成员共用一块空间,所以联合体的大小至少是最大成员的大小(因为联合体至少得有能里保存)


  • 联合大小的计算
  1. 联合的大小至少是最大成员的大小
  2. 当最大成员大小不是最大对其数的整数倍的时候,就要对齐到最大对齐数的整数倍







本文共计2219个文字,预计阅读时间需要9分钟。

如何将自定义数据类型巧妙地应用于复杂的数据处理场景?

内置类型---int, short, char, double, float---C语言自带的类型 + 复杂类型---结构体, 枚举, 联合体---自定义类型 + 结构体 + 结构体类型引用声明 + 结构体是一系列值的集合,这些值可以是不同类型。

内置类型---int short char double flaot---C语言自己的类型

如何将自定义数据类型巧妙地应用于复杂的数据处理场景?

复杂类型---结构体,枚举,联合体---自己创造的类型

结构体

  • 结构体类型引用声明

结构体是一些值的集合,这些值可以是不同类型。

struct Stu//如果不屑Stu就是匿名结构体类型 { member-list;//--成员列表 }Variable-list;//变量列表 //声明一个结构体类型 struct Stu //结构体标签 { //声明结构体变量(成员变量) char name[20]; char tele[15]; char sex[10]; int age; }s3,s4,s5; //都是全局变量--可以一次创建多个 struct Stu s;//全局变量 int main() { //创建结构体变量---局部变量 struct Stu s1; struct Stu s2; return 0; }

匿名结构体类型,只能在变量列表创建,不可能在别处创建---特点:该结构体只能用一次

struct { char name[20]; int age; }sa;//只能在这创建 struct { char name[20]; int age; }* psa; int main() { psa = &sa;//是不能赋值的,因为编译器认为这是两个完全不同的类型 return 0; }


  • 结构体自引用

结构体内不能包含一个类型为该结构本身的成员,但是可以包含该结构体的指针,因为指针的大小是确定的。如果用typedef重定义匿名函数,则不能实现自引用


  • 结构体变量的定义和初始化
  • 结构体内存对齐
  1. 第一个成员在于结构体变量偏移量为0的地址处
  2. 其他成员变量要对其某个成员数字(对齐数)的整数倍的地址处。对齐数:编译器默认的对齐数,与该成员大小的较小值,vs2013编译器默认的大小是8 gcc编译器没有设置默认对齐数
  3. 结构体的大小必须是对齐数的整数倍
  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
  5. 数组的对齐数是---数组的元素是什么,那它的最大对齐数就拿它数组的类型

为什么存在内存对齐:

  1. 平台原因:不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  2. 性能原因:数据结构(尤其是栈)应该尽可能的在自然边界上对齐,原因在于,为了访问未对其的内存,处理器需要做两次内存访问,而对齐的内存仅需要一次访问。

总的来说:结构体的内存对齐是拿空间换取时间的做法

让占用空间小的成员变量尽量集中在一起

#pragma pack(4) //可以设置默认对齐块---把默认对齐数设置为4 #pragma pack() //取消设置默认对齐数

offsetof不是函数,它是宏,因此他的参数可以传类型的(struct Name),不是变量名

size_t offsetof(struct Name ,member Name); //计算结构体的某个值的偏移量,头文件#include <stddef.h>


  • 结构体传参

如果要初始化结构体的内容的话,需要传地址,如果不是地址的话,初始化函数的参数只是结构体的一份临时拷贝,并不会初始化成功。

如果是打印的话,不需要改变结构体的值,则传不传地址都可以---但是延申一个传值和传址问题 ,两者相比较起来,传址更优,因为,只需要传一个地址,无论结构体有多大,地址的大小只有4/8个字节;传值的话,如果结构体过大,则会压榨内存空间,空间花销过大,性能降低,同时又出现一个问题,就是传值相对于传址安全,因为传址可能会改变结构体原有的大小,对于这种现象,我们也有办法避免,只需要在传的地址前加上const来修饰,这样地址就不会被改变


  • 结构体实现位段(位段的可填充&可移植性)

位段的成员必须是int unsigned int signed int三种类型(但是经过大量实践证明,不止这三种,只要是整形就可以了比如char short) 而位段的成员名后面有一个冒号和数字。 这个数字的含义是这个变量占几个bit位,因为一个字节只有32个位,所以这个数字是不能超过32的,位段一般是以int(4个字节)和char(一个字节)来开辟空间的

位段在内存中的存储方式

struct Q { int a : 2;//数字是bit位,指的是a占用两个bit位 一个字节8个bit位 int b : 5; int c : 10; int d : 30; };

abc同时存储在一个字节内,此时该字节还剩15个bit位,但是d需要30个bit位,因此废弃这15个bit位,另辟一个空间存放d,在另一个空间内,还剩两个bit没有被存储,所以该空间也被废弃

位段就是节省空间而存在的

位段跨平台问题

  • int位段被当成有符号还是无符号数是不确定的
  • 位段中最大位的数目不能被确定(16位机器中16位最大,32位机器中32位最大,27在32位中可执行,在16位中就不能被执行)
  • 位段中的成员在内存中从左向右分配,还是从右向左分配未定义
  • 当一个结构体包含两个位段时,当第二个位段较大,无法容纳第一个位段剩余的位时,是舍弃剩余位还是利用这是不确定的


vs2013位段内存的存储方式:现根据类型int或者char选择开辟1个或者4个字节,在字节中的使用方式是先使用低位在使用高位,由右向左使用我的bit位,如果当前开辟的空间剩下的内存不足以存放我的下一个数据的时候,我们就把该剩下的空间浪费掉,然后重新开辟空间,去使用下一个空间,下一个空间的使用依然是先使用低位,直至把所有数据都放进去

枚举

  • 枚举类型的定义

枚举是一种类型

enum Sex { //是一种类型 //枚举的可能取值---常量 male=2,//male=2是给它赋一个初始值 默认的初始值是0 female,//当male=2时,female就是3 secret//4 }; int main() { enum Sex s = male;//只能取枚举内定义的值 printf("%d %d %d",male,female,secret); return 0; }

因此枚举的大小也是整形的大小

c语言的源代码->预编译->编译------链接-----可执行程序

  • 预编译:冗余删除


  • 枚举的优点

也可以使用#define 命名替换,但是枚举比起#define的优势有

  • 增加代码的可读性和可维护性
  • 和#define定义的标识符比较枚举有类型检查,更加严谨(#define是进行替换的,没有固定的类型)
  • 防止命名污染(封装)
  • 便于调试
  • 使用方便,一次可以定义多个常量


  • 枚举的使用


联合

  • 联合类型的定义

联合也是一特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间


  • 联合的特点

联合体的成员共用一块空间,所以联合体的大小至少是最大成员的大小(因为联合体至少得有能里保存)


  • 联合大小的计算
  1. 联合的大小至少是最大成员的大小
  2. 当最大成员大小不是最大对其数的整数倍的时候,就要对齐到最大对齐数的整数倍