C++的 pack 与 unpack的方法

2023-05-21 12:33:11

在使用 Cuda 的Thrust 进行加速时，需要将一些复杂信息从C++层传递到Cuda层，比如说多个Device端的内存地址。

一种常用的方式是，使用device_vector 与 STL vector 进行传递。
本文使用另外一种方式，是将信息Pack成Device内存中的地址，传递到Cuda层后，再进行Unpack 处理。

下面的例子，表示的是将 std::vector<void*> 与 std::vector 进行 pack的方法，以及 unpack 的验证。

#include <stdio.h>
#include <vector>
#include <iostream>

void test_pack_unpack()
{
  // step1: Create Test Data
  std::vector<float> ratio;
  ratio.push_back(0.5f);
  ratio.push_back(0.5f);

  std::vector<void*> address;
  int temp_1 = 20;
  int temp_2 = 40;
  address.push_back(&temp_1);
  address.push_back(&temp_2);
  std::cout << "temp_1: " << &temp_1 << " temp_2 " << & temp_2 << std::endl;

  // step2: pack data to info_buffer
  int num = 2;
  std::vector<char> info_buffer(num * (sizeof(void*) + sizeof(float)));
  void* ptr = info_buffer.data();
  std::cout << "original pack address : " << (char**)ptr << std::endl;
  
  for (int i = 0; i < num; ++i)
  {
    memcpy(ptr, &address[i], sizeof(void*));
    ptr = (void*)((char*)(ptr)+sizeof(void*));
    ((float*)ptr)[0] = ratio[i];
    ptr = (void*)((char*)(ptr)+sizeof(float));
  }

  // step3: unpack data
  void* ptr_new = info_buffer.data();
  std::cout << "original unpack address : " << (char**)ptr_new << std::endl;
  for (int i = 0; i < num; ++i)
  {
    std::cout << " address : " << i << std::hex << (int)(*((char**)ptr_new)) << std::endl;
    ptr_new = (void*)((char*)(ptr_new)+sizeof(void*));
    std::cout << " ratio : " << i << *((float*)ptr_new) << std::endl;
    ptr_new = (void*)((float*)(ptr_new)+1);
  }

  std::cout << "end" << std::endl;
}

int main ()
{
  test_pack_unpack();
  return 0;
}

最终，输出的信息如下

temp_1: 00000000006FF664 temp_2 00000000006FF684
original pack address : 0000000000CE9C70
original unpack address : 0000000000CE9C70
address : 06ff664
ratio : 00.5
address : 16ff684
ratio : 10.5
ptr0000000000CE9C88

可以看到，pack 的 temp_1, temp_2的地址： 00000000006FF664， 00000000006FF684 正确的 unpack 得到了。

示例中，缺少的一步是需要将 pack 的内存，使用CUDA 的API，变成Device Momery. 然后在 Device Momery中进行unpack.

C++的 pack 与 unpack的方法

继续阅读

C语言第四章自述2第四章选择结构程序设计

面试题:vector和map的区别，异同。空间分布，100万数据存哪个比较合适。一、迭代器区别二、vector三、Map、Set四、vector_map 为什么比map效率高五、如何选择六、容器选择原则七、效率对比

C++ 多线程用条件变量确定线程的执行顺序而不是使用 sleep(1)

POJ 1284 Primitive Roots (欧拉函数&原根定理)

CQ V1.0分词bates(基于双数组tire树)—应该是目前最快的中文分词算法

成员函数初始化列表

2021-08-13c++——类之操作符重载

swmm与lisflood-fp源码如何一起编译 CMake命令

Windows下VS开发环境环境安装工程项目设置关于Debug和Release的提示

一文看懂字符串的加减乘除

C++ 第十五周报告1--《冒泡法排序》

C++实现简单顺序表

C经典书籍笔记——C陷阱与缺陷②(语法陷阱之优先级)一、错误案列二、优先级规律

线性表之顺序表的实现

C++判断素数、求最大公约数代码判断一个数是否为素数求两个数的最大公约数

SequoiaDB巨杉数据库C++驱动概述