如何在Bevy游戏引擎中绘制10000个立方体以创建3D像素游戏?

4
当我在Bevy中创建一个 100 x 100 的方块块时,只能保持大约10fps的帧数。
即使我将这些方块替换为更简单的平面,性能也不会有任何改善。
我使用mangohud进行了基准测试,它显示我的CPU和GPU仅使用约20%的利用率。
以下是我使用OpenSimplex噪声生成32 x 32块的代码。
    commands: &mut Commands,
    mut meshes: ResMut<Assets<Mesh>>,
    mut materials: ResMut<Assets<StandardMaterial>>,
    asset_server: Res<AssetServer>,
    seed: Res<Seed>,
) {
    let noise = OpenSimplex::new();

    commands
        .spawn(PbrBundle {
            mesh: meshes.add(Mesh::from(shape::Plane{ size: 1.0 })),
            material: materials.add(Color::rgb(0.5, 0.5, 1.0).into()),
            transform: Transform::from_translation(Vec3::new(0.0, 0.0, 0.0)),
            ..Default::default()
        })
        .with(Chunk)
        .with_children(|parent| {

        let texture_handle = asset_server.load("textures/dirt.png");
    
        for x in -32 .. 32 {
            for z in -32 .. 32 {
                let y = (noise.get([
                    ( x as f32 / 20. ) as f64, 
                    ( z as f32 / 20. ) as f64,
                    seed.value,
                ]) * 15. + 16.0) as u32;


                parent
                    .spawn(PbrBundle {
                        mesh: meshes.add(Mesh::from(shape::Cube{ size: 1.0 })),
                        material: materials.add(StandardMaterial { albedo: Color::rgba(1.0, 1.0, 1.0, 1.0), albedo_texture: Some(texture_handle.clone()), ..Default::default() }),
                        transform: Transform::from_translation(Vec3::new(x as f32, y as f32, z as f32)),
                        ..Default::default()
                    })
                .with(Cube);
            }
        }
    });
}

但是32 x 32是可玩体验的绝对最大值。 我需要做什么才能够同时绘制多个区块呢?

系统规格:
CPU:英特尔Core i7-6820HQ CPU @ 2.70GHz
iGPU:英特尔HD Graphics 530
dGPU:Nvidia Quadro M2000M

但是当切换到更强大的dGPU时,性能并没有得到提升。


1
你可以使用类似这样的东西:https://github.com/bonsairobo/building-blocks 或者至少从那里获得一些灵感。 - frankenapps
4个回答

3

隐藏表面移除和不是朴素地为每个体素生成一个立方体网格才是真正的答案;然而,有一个低悬果实可以优化,可能解释了为什么性能如此低:您只需要一个网格和一个材质来渲染所有这些立方体。

    commands: &mut Commands,
    mut meshes: ResMut<Assets<Mesh>>,
    mut materials: ResMut<Assets<StandardMaterial>>,
    asset_server: Res<AssetServer>,
    seed: Res<Seed>,
) {
    let noise = OpenSimplex::new();

    commands
        .spawn(PbrBundle {
            mesh: meshes.add(Mesh::from(shape::Plane{ size: 1.0 })),
            material: materials.add(Color::rgb(0.5, 0.5, 1.0).into()),
            transform: Transform::from_translation(Vec3::new(0.0, 0.0, 0.0)),
            ..Default::default()
        })
        .with(Chunk)
        .with_children(|parent| {

        let texture_handle = asset_server.load("textures/dirt.png");
        let mesh_handle = meshes.add(Mesh::from(shape::Cube{ size: 1.0 }));
        let material_handle = materials.add(StandardMaterial { albedo: Color::rgba(1.0, 1.0, 1.0, 1.0), albedo_texture: Some(texture_handle.clone()), ..Default::default() });
        for x in -32 .. 32 {
            for z in -32 .. 32 {
                let y = (noise.get([
                    ( x as f32 / 20. ) as f64, 
                    ( z as f32 / 20. ) as f64,
                    seed.value,
                ]) * 15. + 16.0) as u32;


                parent
                    .spawn(PbrBundle {
                        mesh: mesh_handle,
                        material: material_handle,
                        transform: Transform::from_translation(Vec3::new(x as f32, y as f32, z as f32)),
                        ..Default::default()
                    })
                .with(Cube);
            }
        }
    });
}

1

一些立即可见的优化:

  • 将嵌套的for循环算法转换为单个for循环
    • 更加友好缓存。
    • 使用数学将现在的单个索引分割成x/y/z值以确定位置。
  • 隐藏表面去除。
    • 在网格创建期间,不要创建一个完整的新立方体添加到网格中(6个面,12个三角形,24个顶点),而只是将实际可见的面(2个三角形)添加到网格中。 即那些在该方向上没有相邻的不透明(非空气)块的面。
  • 使用索引绘制代替基于顶点绘制
  • 使用纹理图集。
    • 为每个立方体使用一个大的纹理,而不是每个立方体使用单个纹理。

1
将嵌套循环转换为非嵌套循环不会改善性能,也不会改变算法的复杂度。 - Acorn
@Acorn 这取决于循环的维度,在这种情况下它们是相等的,然而扁平循环比嵌套循环更加缓存友好。 - Casey
1
不,它并不取决于维度是否相等,我不确定你想表达什么。无论循环是否嵌套,对于缓存来说都没有关系,访问的局部性才是重要的。 - Acorn
1
纹理图集的建议也很奇怪。OP应该做的不是创建一个新的图集,而是重复使用纹理。 - Acorn
我通过仅生成平面而不是立方体来减少网格创建中的面数,因此现在只渲染200个三角形,而不是1200个三角形。但这并没有帮助我获得更多的每秒帧数。这可能是引擎(bevy)的某种限制吗? - Bruno Wallner
显示剩余2条评论

-1

实际上这是引擎的问题,但它将会在0.5.0版本中得到改进。


2
我不同意。这个例子:https://github.com/bonsairobo/building-blocks/tree/main/examples/array_texture_materials 在我的GTI1060上使用bevy 0.4可以达到1000fps以上。虽然不是完全100000个体素,但仍然相当不错。你是用cargo run --release来运行它吗? - frankenapps

-1

使用网格算法,例如贪婪网格化算法。 block-mesh 是一个很好的 Rust 库,已经集成了几个用于体素的算法。

还可以查看 vx-bevy 以了解有关体素引擎创建的想法。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接