一、数组拼接的核心定义
数组拼接是指将多个形状兼容的数组,沿着指定的轴(axis) 合并为一个新数组:
- 轴(axis):拼接的方向,二维数组中 axis=0 表示按行拼接(垂直方向),axis=1 表示按列拼接(水平方向);
- 形状兼容:除拼接轴外,其他维度的大小必须完全一致(比如按行拼接时,所有数组的列数必须相同);
- 核心函数:np.concatenate()(通用拼接)、np.vstack()(垂直拼接)、np.hstack()(水平拼接)、np.dstack()(深度拼接)。
二、核心拼接函数(分类讲解)
NumPy 提供了多个拼接函数,其中 np.concatenate() 是最通用的底层函数,其他 vstack/hstack 是其简化版(无需指定轴)。
1. 通用拼接:np.concatenate ()(核心)
语法:
python
运行
np.concatenate((arr1, arr2, …), axis=0, out=None)
- (arr1, arr2, …):待拼接的数组元组(必须用元组 / 列表包裹,不能直接传多个数组);
- axis:拼接轴(默认 0),一维数组只能用 axis=0;
- out:可选,指定输出数组(一般不用);
- 返回值:新数组(拼接后的结果,独立内存,不共享原数组数据)。
示例 1:一维数组合并(最基础)
python
import numpy as np
# 两个一维数组(模拟两个班级的学生分数)
class1 = np.array([85, 92, 78, 90])
class2 = np.array([88, 76, 95, 81])
# 拼接为一个一维数组(axis=0,唯一可选)
all_scores = np.concatenate((class1, class2))
print("拼接后一维数组:", all_scores) # [85 92 78 90 88 76 95 81]
print("拼接后形状:", all_scores.shape) # (8,)
示例 2:二维数组按行拼接(axis=0)
按行拼接要求所有数组的列数相同(垂直方向堆叠):
python
import numpy as np
# 两个二维数组(列数均为3)
arr1 = np.array([[1, 2, 3], [4, 5, 6]]) # 2行3列
arr2 = np.array([[7, 8, 9], [10, 11, 12]]) # 2行3列
# 按行拼接(axis=0)→ 4行3列
arr_v = np.concatenate((arr1, arr2), axis=0)
print("按行拼接结果:\\n", arr_v)
print("拼接后形状:", arr_v.shape) # (4, 3)
输出:
plaintext
按行拼接结果:
[[ 1 2 3]
[ 4 5 6]
[ 7 8 9]
[10 11 12]]
拼接后形状: (4, 3)
示例 3:二维数组按列拼接(axis=1)
按列拼接要求所有数组的行数相同(水平方向拼接):
python
import numpy as np
# 两个二维数组(行数均为2)
arr1 = np.array([[1, 2], [3, 4]]) # 2行2列
arr2 = np.array([[5, 6], [7, 8]]) # 2行2列
arr3 = np.array([[9], [10]]) # 2行1列
# 按列拼接(axis=1)→ 2行5列(2+2+1)
arr_h = np.concatenate((arr1, arr2, arr3), axis=1)
print("按列拼接结果:\\n", arr_h)
print("拼接后形状:", arr_h.shape) # (2, 5)
输出:
plaintext
按列拼接结果:
[[ 1 2 5 6 9]
[ 3 4 7 8 10]]
拼接后形状: (2, 5)
2. 简化拼接函数(更直观)
为了避免记错 axis 参数,NumPy 提供了更贴合语义的简化函数:
表格
| np.vstack() | 垂直拼接(按行) | np.concatenate(…, axis=0) | 一维 / 二维数组按行堆叠 |
| np.hstack() | 水平拼接(按列) | np.concatenate(…, axis=1) | 一维 / 二维数组按列拼接 |
| np.dstack() | 深度拼接(按第三个维度) | np.concatenate(…, axis=2) | 三维数组拼接 |
示例:vstack/hstack 简化操作
python
import numpy as np
# 二维数组
arr1 = np.array([[1,2],[3,4]])
arr2 = np.array([[5,6],[7,8]])
# 垂直拼接(等价于 axis=0)
arr_v = np.vstack((arr1, arr2))
print("vstack结果:\\n", arr_v) # 4行2列
# 水平拼接(等价于 axis=1)
arr_h = np.hstack((arr1, arr2))
print("hstack结果:\\n", arr_h) # 2行4列
示例:一维数组的 hstack/vstack 特殊处理
一维数组用 hstack/vstack 会自动调整维度:
python
import numpy as np
a = np.array([1,2,3]) # 形状(3,)
b = np.array([4,5,6]) # 形状(3,)
# vstack:一维数组合并为二维(按行)→ (2,3)
v_arr = np.vstack((a, b))
print("vstack一维数组:\\n", v_arr)
print("形状:", v_arr.shape) # (2,3)
# hstack:一维数组合并为更长的一维 → (6,)
h_arr = np.hstack((a, b))
print("hstack一维数组:", h_arr)
print("形状:", h_arr.shape) # (6,)
3. 深度拼接:np.dstack ()(三维数组)
按第三个维度(深度)拼接,适用于图像、三维数据:
python
import numpy as np
# 两个二维数组(形状均为(2,3))
arr1 = np.array([[1,2,3],[4,5,6]])
arr2 = np.array([[7,8,9],[10,11,12]])
# 深度拼接 → 形状(2,3,2)
d_arr = np.dstack((arr1, arr2))
print("dstack结果形状:", d_arr.shape) # (2,3,2)
print("dstack结果[0,0,:]:", d_arr[0,0,:]) # [1,7](深度维度的两个值)
三、高维数组拼接(进阶)
高维数组拼接的核心是明确拼接轴的编号,维度编号从 0 开始:
- 三维数组形状 (a,b,c) → 轴 0=a、轴 1=b、轴 2=c;
- 拼接时,除拼接轴外,其他维度大小必须一致。
示例:三维数组拼接
python
import numpy as np
# 两个三维数组:形状(2,3,4)(轴0=2,轴1=3,轴2=4)
arr1 = np.arange(24).reshape(2,3,4)
arr2 = np.arange(24,48).reshape(2,3,4)
# 按轴0拼接 → 形状(4,3,4)
concat0 = np.concatenate((arr1, arr2), axis=0)
print("按轴0拼接形状:", concat0.shape) # (4,3,4)
# 按轴1拼接 → 形状(2,6,4)
concat1 = np.concatenate((arr1, arr2), axis=1)
print("按轴1拼接形状:", concat1.shape) # (2,6,4)
# 按轴2拼接 → 形状(2,3,8)
concat2 = np.concatenate((arr1, arr2), axis=2)
print("按轴2拼接形状:", concat2.shape) # (2,3,8)
四、拼接的兼容性规则(核心避坑!)
拼接失败的唯一原因是形状不兼容,需牢记:
除拼接轴外,其他所有维度的大小必须完全一致。
示例:不兼容的拼接(报错)
python
import numpy as np
# 错误1:按行拼接(axis=0)但列数不同
arr1 = np.array([[1,2],[3,4]]) # 2行2列
arr2 = np.array([[5,6,7],[8,9,10]]) # 2行3列
try:
np.concatenate((arr1, arr2), axis=0)
except ValueError as e:
print("报错1:", e) # all the input array dimensions except for the concatenation axis must match exactly
# 错误2:按列拼接(axis=1)但行数不同
arr3 = np.array([[1,2],[3,4]]) # 2行2列
arr4 = np.array([[5,6]]) # 1行2列
try:
np.concatenate((arr3, arr4), axis=1)
except ValueError as e:
print("报错2:", e)
解决方法:调整数组形状(reshape/expand_dims)
通过 reshape 或 np.expand_dims 让数组形状兼容:
python
import numpy as np
# 原数组:arr4是(1,2),行数为1(arr3行数为2,不兼容)
arr3 = np.array([[1,2],[3,4]])
arr4 = np.array([[5,6]])
# 方法1:给arr4添加一行(补0)
arr4_exp = np.vstack((arr4, [[0,0]])) # 变为2行2列
concat_ok = np.concatenate((arr3, arr4_exp), axis=1)
print("调整后拼接结果:\\n", concat_ok)
# 方法2:扩展维度(一维→二维)
a = np.array([1,2,3]) # (3,)
b = np.array([[4,5,6]]) # (1,3)
# 先将a转为(1,3),再按行拼接
a_2d = np.expand_dims(a, axis=0) # (1,3)
concat_a_b = np.concatenate((a_2d, b), axis=0)
print("一维转二维后拼接:\\n", concat_a_b)
五、常见应用场景
场景 1:合并多组数据(机器学习数据集)
python
import numpy as np
# 模拟3组特征数据(每组10个样本×5个特征)
feat1 = np.random.rand(10,5)
feat2 = np.random.rand(10,5)
feat3 = np.random.rand(10,5)
# 合并为30个样本的数据集(按行拼接)
all_feat = np.concatenate((feat1, feat2, feat3), axis=0)
print("合并后数据集形状:", all_feat.shape) # (30,5)
# 合并特征列(比如添加新特征)
new_feat = np.random.rand(30,1) # 30个样本×1个新特征
all_feat_new = np.hstack((all_feat, new_feat))
print("添加新特征后形状:", all_feat_new.shape) # (30,6)
场景 2:合并时间序列数据(温度数据)
python
import numpy as np
# 模拟3月和4月的温度数据(各31天×24小时)
march_temp = np.random.normal(5,6,(31,24)).round(1)
april_temp = np.random.normal(15,5,(30,24)).round(1)
# 合并为2个月的温度数据(按行拼接,行数31+30=61)
spring_temp = np.vstack((march_temp, april_temp))
print("春季温度数据形状:", spring_temp.shape) # (61,24)
场景 3:批量拼接多个数组
python
import numpy as np
# 生成10个一维数组,每个数组5个元素
arr_list = [np.random.randint(0,10,5) for _ in range(10)]
# 拼接为一个一维数组
all_arr = np.concatenate(arr_list, axis=0)
print("批量拼接后形状:", all_arr.shape) # (50,)
六、避坑点与最佳实践
1. 核心避坑点
- ❌ 误区:直接传多个数组给 concatenate(必须用元组 / 列表包裹,如 (arr1,arr2));
- ❌ 错误:一维数组用 axis=1 拼接(一维数组只有 axis=0,会报错);
- ❌ 忽略:拼接轴的方向(二维数组 axis=0 是行,axis=1 是列,易记反);
- ❌ 混淆:vstack 对一维数组的处理(会转为二维,而 concatenate 保持一维)。
2. 最佳实践
- ✅ 简单拼接用 vstack/hstack(语义清晰,无需记 axis);
- ✅ 高维数组用 np.concatenate(明确指定 axis);
- ✅ 拼接前检查形状:用 arr.shape 确认除拼接轴外其他维度一致;
- ✅ 批量拼接多个数组时,先放入列表,再传给 concatenate;
- ✅ 需频繁拼接时,先预分配数组(np.empty)再填充,比多次拼接更高效。
总结
- 一维数组:仅能按 axis=0 拼接(hstack 合并为更长一维,vstack 转为二维);
- 二维数组:axis=0 按行拼接(列数一致),axis=1 按列拼接(行数一致);
网硕互联帮助中心





评论前必须登录!
注册