update pbnbv

2025-05-19 16:32:04 +08:00 · 2025-05-19 16:32:04 +08:00 · cd436605a5
commit cd436605a5
parent b98753bfbb
25 changed files with 1228 additions and 178 deletions
--- a/app_inference.py
+++ b/app_inference.py
@ -4,6 +4,8 @@ from runners.global_and_local_points_inferencer import GlobalAndLocalPointsInfer
 from runners.local_points_inferencer import LocalPointsInferencer
 from runners.inference_server import InferencerServer
 from runners.evaluate_uncertainty_guide import EvaluateUncertaintyGuide
+from runners.evaluate_pbnbv import EvaluatePBNBV
+
@PytorchBootApplication("global_points_inference")
 class GlobalPointsInferenceApp:
    @staticmethod
@ -46,6 +48,27 @@ class LocalPointsInferenceApp:
        '''       
        LocalPointsInferencer("./configs/local/local_only_inference_config.yaml").run()

+@PytorchBootApplication("real_global_only_inference")
+class RealGlobalOnlyInferenceApp:
+    @staticmethod
+    def start():
+        ''' 
+            call default or your custom runners here, code will be executed 
+        automatically when type "pytorch-boot run" or "ptb run" in terminal
+        
+            example:
+                Trainer("path_to_your_train_config").run()
+                Evaluator("path_to_your_eval_config").run()
+        '''       
+        GlobalPointsInferencer("./configs/local/real_global_only_inference_config.yaml").run()
+
+@PytorchBootApplication("mlp_inference")
+class MLPInferenceApp:
+    @staticmethod
+    def start():
+        GlobalAndLocalPointsInferencer("./configs/local/mlp_inference_config.yaml").run()
+
+
@PytorchBootApplication("server")
 class InferenceServerApp:
    @staticmethod
@ -72,4 +95,10 @@ class EvaluateUncertaintyGuideApp:
                Trainer("path_to_your_train_config").run()
                Evaluator("path_to_your_eval_config").run()
        '''       
-        EvaluateUncertaintyGuide("./configs/local/uncertainty_guide_evaluation_config.yaml").run()
+        EvaluateUncertaintyGuide("./configs/local/uncertainty_guide_evaluation_config.yaml").run()
+
+@PytorchBootApplication("evaluate_pbnbv")
+class EvaluatePBNBVApp:
+    @staticmethod
+    def start():
+        EvaluatePBNBV("./configs/local/pbnbv_evalutaion_config.yaml").run()
--- a/beans/pycache/predict_result.cpython-39.pyc
+++ b/beans/pycache/predict_result.cpython-39.pyc
--- a/beans/predict_result.py
+++ b/beans/predict_result.py
@ -83,7 +83,8 @@ class PredictResult:
    def get_center_matrix_pose_from_cluster(self, cluster):
        min_total_distance = float('inf')
        center_matrix_pose = None
-        
+        if len(cluster) == 1:
+            return cluster[0]
        for matrix_pose in cluster:
            total_distance = 0
            for other_matrix_pose in cluster:
@ -94,6 +95,7 @@ class PredictResult:
                min_total_distance = total_distance
                center_matrix_pose = matrix_pose
        
+        
        return center_matrix_pose
    
    def get_candidate_poses(self):
--- a/configs/local/global_only_inference_config.yaml
+++ b/configs/local/global_only_inference_config.yaml
@ -15,10 +15,12 @@ runner:
      - OmniObject3d_test

  blender_script_path: "/media/hofee/data/project/python/nbv_reconstruction/blender/data_renderer.py"
-  output_dir: "/media/hofee/data/project/exp/new_ab_global_pts_and_local_pose"
+  output_dir: "/media/hofee/data/project/exp/new_no_cluster_ab_global_pts_and_local_pose"
  pipeline: nbv_reconstruction_pipeline_global
  voxel_size: 0.003
  min_new_area: 1.0
+  overlap_limit: True
+  enable_cluster: False
 dataset:
  OmniObject3d_test:
    root_dir: "/media/hofee/repository/final_test_set/preprocessed_dataset"
--- a/configs/local/global_pts_and_local_pts_pose.yaml
+++ b/configs/local/global_pts_and_local_pts_pose.yaml
@ -15,10 +15,12 @@ runner:
      - OmniObject3d_test

  blender_script_path: "/media/hofee/data/project/python/nbv_reconstruction/blender/data_renderer.py"
-  output_dir: "/media/hofee/data/project/exp/new_ab_global_pts_and_local_pts_pose"
+  output_dir: "/media/hofee/data/project/exp/new_no_cluster_ab_global_pts_and_local_pts_pose"
  pipeline: nbv_reconstruction_pipeline_local
  voxel_size: 0.003
  min_new_area: 1.0
+  overlap_limit: True
+  enable_cluster: False
 dataset:
  OmniObject3d_test:
    root_dir: "/media/hofee/repository/final_test_set/preprocessed_dataset"
--- a/configs/local/local_only_inference_config.yaml
+++ b/configs/local/local_only_inference_config.yaml
@ -15,10 +15,12 @@ runner:
      - OmniObject3d_test

  blender_script_path: "/media/hofee/data/project/python/nbv_reconstruction/blender/data_renderer.py"
-  output_dir: "/media/hofee/data/project/exp/new_ab_local_only"
+  output_dir: "/media/hofee/data/project/exp/new_no_cluster_ab_local_only"
  pipeline: nbv_reconstruction_pipeline_local_only
  voxel_size: 0.003
  min_new_area: 1.0
+  overlap_limit: True
+  enable_cluster: False
 dataset:
  # OmniObject3d_train:
  #   root_dir: "C:\\Document\\Datasets\\inference_test1"
--- a/configs/local/mlp_inference_config.yaml
+++ b/configs/local/mlp_inference_config.yaml
@ -0,0 +1,130 @@
+
+runner:
+  general:
+    seed: 0
+    device: cuda
+    cuda_visible_devices: "0,1,2,3,4,5,6,7"
+    
+  experiment:
+    name: ab_mlp
+    root_dir: "experiments"
+    epoch: 200 # -1 stands for last epoch
+
+  test:
+    dataset_list:
+      - OmniObject3d_test
+
+  blender_script_path: "/media/hofee/data/project/python/nbv_reconstruction/blender/data_renderer.py"
+  output_dir: "/media/hofee/data/project/exp/new_no_cluster_ab_mlp_inference"
+  pipeline: nbv_reconstruction_pipeline_mlp
+  voxel_size: 0.003
+  min_new_area: 1.0
+  overlap_limit: True
+  enable_cluster: False
+dataset:
+  OmniObject3d_test:
+    root_dir: "/media/hofee/repository/final_test_set/preprocessed_dataset"
+    model_dir: "/media/hofee/data/data/target/target_formulated_view"
+    source: seq_reconstruction_dataset_preprocessed
+    # split_file: "C:\\Document\\Datasets\\data_list\\OmniObject3d_test.txt"
+    type: test
+    filter_degree: 75
+    eval_list:
+      - pose_diff
+      - coverage_rate_increase
+    ratio: 0.1
+    batch_size: 1
+    num_workers: 12
+    pts_num: 8192
+    load_from_preprocess: True
+
+pipeline:
+  nbv_reconstruction_pipeline_local:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: gf_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+  nbv_reconstruction_pipeline_global:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: gf_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+  nbv_reconstruction_pipeline_local_only:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: gf_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+  nbv_reconstruction_pipeline_global_only:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: gf_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+  nbv_reconstruction_pipeline_mlp:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: mlp_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+
+    
+module:
+
+  pointnet_encoder:
+    in_dim: 3
+    out_dim: 1024
+    global_feat: True
+    feature_transform: False
+
+  pointnet++_encoder:
+    in_dim: 3
+
+  transformer_seq_encoder:
+    embed_dim: 1280
+    num_heads: 4
+    ffn_dim: 256
+    num_layers: 3
+    output_dim: 1024
+
+  gf_view_finder:
+    t_feat_dim: 128
+    pose_feat_dim: 256
+    main_feat_dim: 2048
+    regression_head: Rx_Ry_and_T
+    pose_mode: rot_matrix
+    per_point_feature: False
+    sample_mode: ode
+    sampling_steps: 500
+    sde_mode: ve
+
+  mlp_view_finder:
+    t_feat_dim: 128
+    pose_feat_dim: 256
+    main_feat_dim: 2048
+    regression_head: Rx_Ry_and_T
+    pose_mode: rot_matrix
+    per_point_feature: False
+    sample_mode: ode
+    sampling_steps: 500
+    sde_mode: ve
+
+  pose_encoder:
+    pose_dim: 9
+    out_dim: 256
+    
+
+  pts_num_encoder:
+    out_dim: 64
--- a/configs/local/pbnbv_evalutaion_config.yaml
+++ b/configs/local/pbnbv_evalutaion_config.yaml
@ -0,0 +1,131 @@
+
+runner:
+  general:
+    seed: 0
+    device: cuda
+    cuda_visible_devices: "0,1,2,3,4,5,6,7"
+    
+  experiment:
+    name: pbnbv_evaluation
+    root_dir: "experiments"
+    epoch: 200 # -1 stands for last epoch
+
+  test:
+    dataset_list:
+      - OmniObject3d_test
+
+  blender_script_path: "/media/hofee/data/project/python/nbv_reconstruction/blender/data_renderer.py"
+  output_dir: "/media/hofee/data/project/exp/new_pbnbv_evaluation"
+  output_data_root: "/media/hofee/repository/code/nbv_rec_uncertainty_guide/output/reconstruction"
+  pipeline: nbv_reconstruction_pipeline_global_only
+  voxel_size: 0.003
+  min_new_area: 1.0
+  overlap_limit: True
+dataset:
+  # OmniObject3d_train:
+  #   root_dir: "C:\\Document\\Datasets\\inference_test1"
+  #   model_dir: "C:\\Document\\Datasets\\scaled_object_meshes"
+  #   source: seq_reconstruction_dataset_preprocessed
+  #   split_file: "C:\\Document\\Datasets\\data_list\\sample.txt"
+  #   type: test
+  #   filter_degree: 75
+  #   ratio: 1
+  #   batch_size: 1
+  #   num_workers: 12
+  #   pts_num: 8192
+  #   load_from_preprocess: True
+
+  OmniObject3d_test:
+    root_dir: "/media/hofee/repository/final_test_set/preprocessed_dataset"
+    model_dir: "/media/hofee/data/data/target/target_formulated_view"
+    source: seq_reconstruction_dataset_preprocessed
+    # split_file: "C:\\Document\\Datasets\\data_list\\OmniObject3d_test.txt"
+    type: test
+    filter_degree: 75
+    eval_list:
+      - pose_diff
+      - coverage_rate_increase
+    ratio: 0.1
+    batch_size: 1
+    num_workers: 12
+    pts_num: 8192
+    load_from_preprocess: True
+
+pipeline:
+  nbv_reconstruction_pipeline_local:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: gf_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+  nbv_reconstruction_pipeline_global:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: gf_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+  nbv_reconstruction_pipeline_local_only:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: gf_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+  nbv_reconstruction_pipeline_global_only:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: gf_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+  nbv_reconstruction_pipeline_mlp:
+    modules:
+      pts_encoder: pointnet++_encoder
+      seq_encoder: transformer_seq_encoder
+      pose_encoder: pose_encoder
+      view_finder: mlp_view_finder
+    eps: 1e-5
+    global_scanned_feat: True
+
+    
+module:
+
+  pointnet_encoder:
+    in_dim: 3
+    out_dim: 1024
+    global_feat: True
+    feature_transform: False
+
+  pointnet++_encoder:
+    in_dim: 3
+
+  transformer_seq_encoder:
+    embed_dim: 256
+    num_heads: 4
+    ffn_dim: 256
+    num_layers: 3
+    output_dim: 1024
+
+  gf_view_finder:
+    t_feat_dim: 128
+    pose_feat_dim: 256
+    main_feat_dim: 2048
+    regression_head: Rx_Ry_and_T
+    pose_mode: rot_matrix
+    per_point_feature: False
+    sample_mode: ode
+    sampling_steps: 500
+    sde_mode: ve
+
+  pose_encoder:
+    pose_dim: 9
+    out_dim: 256
+
+  pts_num_encoder:
+    out_dim: 64
--- a/configs/local/global_points_and_pose_inference_config.yaml
+++ b/configs/local/global_points_and_pose_inference_config.yaml
@ -1,3 +1,4 @@
+
 runner:
  general:
    seed: 0
@ -5,7 +6,7 @@ runner:
    cuda_visible_devices: "0,1,2,3,4,5,6,7"
    
  experiment:
-    name: ab_global_pts_and_local_pose
+    name: ab_global_only
    root_dir: "experiments"
    epoch: 200 # -1 stands for last epoch

@ -14,26 +15,28 @@ runner:
      - OmniObject3d_test

  blender_script_path: "/media/hofee/data/project/python/nbv_reconstruction/blender/data_renderer.py"
-  output_dir: "/media/hofee/data/project/exp/new_ab_global_only"
+  output_dir: "/media/hofee/data/project/exp/new_no_cluster_ab_global_only"
  pipeline: nbv_reconstruction_pipeline_global_only
  voxel_size: 0.003
  min_new_area: 1.0
+  overlap_limit: True
+  enable_cluster: False

 dataset:
-    OmniObject3d_test:
-      source: seq_reconstruction_dataset_preprocessed
-      root_dir: /media/hofee/repository/final_test_set/preprocessed_dataset
-      model_dir: /media/hofee/data/data/target/target_formulated_view
-      type: test
-      filter_degree: 75
-      eval_list:
-        - pose_diff
-        - coverage_rate_increase
-      ratio: 0.1
-      batch_size: 1
-      num_workers: 12
-      pts_num: 8192
-      load_from_preprocess: True
+  OmniObject3d_test:
+    root_dir: "/media/hofee/repository/final_test_set/preprocessed_dataset"
+    model_dir: "/media/hofee/data/data/target/target_formulated_view"
+    source: seq_reconstruction_dataset_preprocessed
+    type: test
+    filter_degree: 75
+    eval_list:
+      - pose_diff
+      - coverage_rate_increase
+    ratio: 0.1
+    batch_size: 1
+    num_workers: 12
+    pts_num: 8192
+    load_from_preprocess: True

 pipeline:
  nbv_reconstruction_pipeline_local:
@ -99,7 +102,7 @@ module:
  gf_view_finder:
    t_feat_dim: 128
    pose_feat_dim: 256
-    main_feat_dim: 2048
+    main_feat_dim: 1024
    regression_head: Rx_Ry_and_T
    pose_mode: rot_matrix
    per_point_feature: False
--- a/configs/local/uncertainty_guide_evaluation_config.yaml
+++ b/configs/local/uncertainty_guide_evaluation_config.yaml
@ -6,7 +6,7 @@ runner:
    cuda_visible_devices: "0,1,2,3,4,5,6,7"
    
  experiment:
-    name: uncertainty_guide_evaluation
+    name: uncertainty_guide_evaluation2
    root_dir: "experiments"
    epoch: 200 # -1 stands for last epoch

@ -15,11 +15,12 @@ runner:
      - OmniObject3d_test

  blender_script_path: "/media/hofee/data/project/python/nbv_reconstruction/blender/data_renderer.py"
-  output_dir: "/media/hofee/data/project/exp/old_uncertainty_guide_evaluation"
+  output_dir: "/media/hofee/data/project/exp/new_no_limit_uncertainty_guide_evaluation"
  output_data_root: "/media/hofee/repository/code/nbv_rec_uncertainty_guide/output/reconstruction"
  pipeline: nbv_reconstruction_pipeline_global_only
  voxel_size: 0.003
  min_new_area: 1.0
+  overlap_limit: False
 dataset:
  # OmniObject3d_train:
  #   root_dir: "C:\\Document\\Datasets\\inference_test1"
@ -35,8 +36,8 @@ dataset:
  #   load_from_preprocess: True

  OmniObject3d_test:
-    root_dir: "/media/hofee/data/data/new_testset_output"
-    model_dir: "/media/hofee/data/data/scaled_object_meshes"
+    root_dir: "/media/hofee/repository/final_test_set/preprocessed_dataset"
+    model_dir: "/media/hofee/data/data/target/target_formulated_view"
    source: seq_reconstruction_dataset_preprocessed
    # split_file: "C:\\Document\\Datasets\\data_list\\OmniObject3d_test.txt"
    type: test
--- a/core/pycache/ab_global_only_pts_pipeline.cpython-39.pyc
+++ b/core/pycache/ab_global_only_pts_pipeline.cpython-39.pyc
--- a/core/pycache/ab_mlp_pipeline.cpython-39.pyc
+++ b/core/pycache/ab_mlp_pipeline.cpython-39.pyc
--- a/core/ab_mlp_pipeline.py
+++ b/core/ab_mlp_pipeline.py
@ -45,6 +45,8 @@ class NBVReconstructionMLPPipeline(nn.Module):
    
    def forward_test(self,data):
        main_feat = self.get_main_feat(data)
+        repeat_num = data.get("repeat_num", 50)
+        main_feat = main_feat.repeat(repeat_num, 1)
        estimated_delta_rot_9d, _ = self.view_finder.next_best_view(main_feat)
        result = {
            "pred_pose_9d": estimated_delta_rot_9d,
--- a/runners/pycache/evaluate_pbnbv.cpython-39.pyc
+++ b/runners/pycache/evaluate_pbnbv.cpython-39.pyc
--- a/runners/pycache/evaluate_uncertainty_guide.cpython-39.pyc
+++ b/runners/pycache/evaluate_uncertainty_guide.cpython-39.pyc
--- a/runners/pycache/global_and_local_points_inferencer.cpython-39.pyc
+++ b/runners/pycache/global_and_local_points_inferencer.cpython-39.pyc
--- a/runners/pycache/global_points_inferencer.cpython-39.pyc
+++ b/runners/pycache/global_points_inferencer.cpython-39.pyc
--- a/runners/pycache/local_points_inferencer.cpython-39.pyc
+++ b/runners/pycache/local_points_inferencer.cpython-39.pyc
--- a/runners/evaluate_pbnbv.py
+++ b/runners/evaluate_pbnbv.py
@ -0,0 +1,786 @@
+import numpy as np
+
+from sklearn.mixture import GaussianMixture
+from typing import List, Tuple, Dict
+from enum import Enum
+
+class VoxelType(Enum):
+    NONE = 0
+    OCCUPIED = 1
+    EMPTY = 2
+    UNKNOWN = 3
+    FRONTIER = 4
+
+class VoxelStruct:
+    def __init__(self, voxel_resolution=0.01, ray_trace_step=0.01, surrounding_radius=1, 
+                 num_parallels=10, viewpoints_per_parallel=10, camera_working_distance=0.5):
+        self.voxel_resolution = voxel_resolution 
+        self.ray_trace_step = ray_trace_step
+        self.surrounding_radius = surrounding_radius
+        self.num_parallels = num_parallels
+        self.viewpoints_per_parallel = viewpoints_per_parallel
+        self.camera_working_distance = camera_working_distance
+        self.occupied_voxels = []
+        self.empty_voxels = []
+        self.unknown_voxels = []
+        self.frontier_voxels = []
+        self.bbx_min = None
+        self.bbx_max = None
+        self.voxel_types: Dict[Tuple[float, float, float], VoxelType] = {}
+        
+    def update_voxel_map(self, points: np.ndarray, 
+                        camera_pose: np.ndarray) -> Tuple[List[np.ndarray], List[np.ndarray]]:
+        points = self.transform_points(points, camera_pose)
+        new_occupied = self.voxelize_points(points)
+        self.occupied_voxels.extend(new_occupied)
+        self.update_bounding_box()
+        self.ray_tracing(camera_pose[:3, 3], camera_pose[:3, :3])
+        self.update_frontier_voxels()
+        return self.frontier_voxels, self.occupied_voxels
+    
+    def ray_tracing(self, camera_position: np.ndarray, camera_rotation: np.ndarray):
+        if self.bbx_min is None or self.bbx_max is None:
+            return
+            
+        directions = self.generate_ray_directions()   
+        for direction in directions:
+            direction_cam = camera_rotation @ direction
+            current_pos = camera_position.copy()
+
+            cnt = 0
+            while not self.is_in_bounding_box(current_pos):
+                current_pos -= direction_cam * self.ray_trace_step*2
+                cnt += 1
+                if cnt > 200:
+                    break
+
+            occupied_flag = False
+            maybe_unknown_voxels = []
+            while self.is_in_bounding_box(current_pos):
+                voxel = self.get_voxel_coordinate(current_pos)
+                voxel_key = tuple(voxel)
+                
+                if self.is_occupied(voxel):
+                    current_pos -= direction_cam * self.ray_trace_step
+                    occupied_flag = True
+                    continue
+                if not occupied_flag:
+                    if voxel_key not in self.voxel_types or self.voxel_types[voxel_key] == VoxelType.NONE or self.voxel_types[voxel_key] == VoxelType.UNKNOWN:
+                        maybe_unknown_voxels.append(voxel)
+                else:
+                    if voxel_key not in self.voxel_types or self.voxel_types[voxel_key] == VoxelType.NONE:
+                        self.voxel_types[voxel_key] = VoxelType.UNKNOWN
+                        self.unknown_voxels.append(voxel)
+                current_pos -= direction_cam * self.ray_trace_step
+            if not occupied_flag:
+                for voxel in maybe_unknown_voxels:
+                    self.voxel_types[tuple(voxel)] = VoxelType.UNKNOWN
+                    self.unknown_voxels.append(voxel)
+            else:
+                for voxel in maybe_unknown_voxels:
+                    voxel_key = tuple(voxel)
+                    if voxel_key in self.voxel_types and self.voxel_types[voxel_key] == VoxelType.UNKNOWN:
+                        self.unknown_voxels = [v for v in self.unknown_voxels if not np.array_equal(v, voxel)]
+                    self.voxel_types[voxel_key] = VoxelType.EMPTY
+                    self.empty_voxels.append(voxel)
+    
+    def generate_ray_directions(self):
+        directions = []
+        if self.bbx_min is not None and self.bbx_max is not None:
+            bbx_diagonal = np.linalg.norm(self.bbx_max - self.bbx_min)
+            hemisphere_radius = self.camera_working_distance + bbx_diagonal / 2
+        else:
+            hemisphere_radius = self.camera_working_distance
+
+        # 使用更密集的采样
+        theta_step = np.pi / (6 * self.num_parallels)  # 减小theta的步长
+        phi_step = np.pi / (6 * self.viewpoints_per_parallel)  # 减小phi的步长
+
+        # 从顶部到底部采样
+        for theta in np.arange(0, np.pi/6 + theta_step, theta_step):
+            # 在每个纬度上采样
+            for phi in np.arange(0, 2*np.pi, phi_step):
+                x = hemisphere_radius * np.sin(theta) * np.cos(phi)
+                y = hemisphere_radius * np.sin(theta) * np.sin(phi)
+                z = hemisphere_radius * np.cos(theta)
+                direction = np.array([-x, -y, -z])
+                direction = direction / np.linalg.norm(direction)
+                directions.append(direction)
+
+        return directions
+    
+    def update_frontier_voxels(self):
+        self.frontier_voxels = []
+        remaining_unknown = []
+        
+        for voxel in self.unknown_voxels:
+            neighbors = self.find_neighbors(voxel)
+            has_empty = any(self.voxel_types.get(tuple(n), VoxelType.NONE) == VoxelType.EMPTY for n in neighbors)
+            has_occupied = any(self.voxel_types.get(tuple(n), VoxelType.NONE) == VoxelType.OCCUPIED for n in neighbors)
+            
+            if has_empty and has_occupied:
+                self.voxel_types[tuple(voxel)] = VoxelType.FRONTIER
+                self.frontier_voxels.append(voxel)
+            else:
+                remaining_unknown.append(voxel)
+        self.unknown_voxels = remaining_unknown
+    
+    def is_in_bounding_box(self, point: np.ndarray) -> bool:
+        if self.bbx_min is None or self.bbx_max is None:
+            return False
+        return np.all(point >= self.bbx_min) and np.all(point <= self.bbx_max)
+    
+    def get_voxel_coordinate(self, point: np.ndarray) -> np.ndarray:
+        return (point / self.voxel_resolution).astype(int) * self.voxel_resolution
+    
+    def voxelize_points(self, points: np.ndarray) -> List[np.ndarray]:
+        voxel_coords = (points / self.voxel_resolution).astype(int)
+        unique_voxels = np.unique(voxel_coords, axis=0)
+        voxels = [voxel * self.voxel_resolution for voxel in unique_voxels]
+        for voxel in voxels:
+            self.voxel_types[tuple(voxel)] = VoxelType.OCCUPIED
+        return voxels
+    
+    def is_occupied(self, voxel: np.ndarray) -> bool:
+        return self.voxel_types.get(tuple(voxel), VoxelType.NONE) == VoxelType.OCCUPIED
+    
+    def find_neighbors(self, voxel: np.ndarray) -> List[np.ndarray]:
+        neighbors = []
+        for dx in [-1, 0, 1]:
+            for dy in [-1, 0, 1]:
+                for dz in [-1, 0, 1]:
+                    if dx == 0 and dy == 0 and dz == 0:
+                        continue
+                    neighbor = voxel + np.array([dx, dy, dz]) * self.voxel_resolution
+                    neighbors.append(neighbor)
+        return neighbors
+    
+    def update_bounding_box(self):
+        if not self.occupied_voxels:
+            return
+            
+        occupied_array = np.array(self.occupied_voxels)
+        self.bbx_min = occupied_array.min(axis=0) - 2 * self.voxel_resolution
+        self.bbx_max = occupied_array.max(axis=0) + 2 * self.voxel_resolution
+    
+    def transform_points(self, points: np.ndarray, transform: np.ndarray) -> np.ndarray:
+        ones = np.ones((points.shape[0], 1))
+        points_homo = np.hstack((points, ones))
+        transformed = (transform @ points_homo.T).T
+        return transformed[:, :3]
+    
+    def create_voxel_geometry(self,voxels, color, voxel_size):
+        import open3d as o3d
+        points = np.array(voxels)
+        if len(points) == 0:
+            return None
+        
+        pcd = o3d.geometry.PointCloud()
+        pcd.points = o3d.utility.Vector3dVector(points)
+        pcd.colors = o3d.utility.Vector3dVector(np.tile(color, (len(points), 1)))
+        return pcd
+
+    def create_ray_geometry(self,camera_pos, directions, camera_rot, length=1.0):
+        import open3d as o3d
+        lines = []
+        colors = []
+        for direction in directions:
+            # 将方向向量转换到相机坐标系
+            direction_cam = camera_rot @ direction
+            end_point = camera_pos - direction_cam * length
+            lines.append([camera_pos, end_point])
+            colors.append([0.5, 0.5, 0.5])  # 灰色光线
+        
+        line_set = o3d.geometry.LineSet()
+        line_set.points = o3d.utility.Vector3dVector(np.array(lines).reshape(-1, 3))
+        line_set.lines = o3d.utility.Vector2iVector(np.array([[i*2, i*2+1] for i in range(len(lines))]))
+        line_set.colors = o3d.utility.Vector3dVector(colors)
+        return line_set
+
+    def visualize_voxel_struct(self, camera_pose: np.ndarray = None):
+        import open3d as o3d
+        vis = o3d.visualization.Visualizer()
+        vis.create_window()
+        
+        coordinate_frame = o3d.geometry.TriangleMesh.create_coordinate_frame(size=0.1, origin=[0, 0, 0])
+        vis.add_geometry(coordinate_frame)
+        
+        # 显示已占据的体素（蓝色）
+        occupied_voxels = self.create_voxel_geometry(
+            self.occupied_voxels,
+            [0, 0, 1],
+            self.voxel_resolution
+        )
+        if occupied_voxels:
+            vis.add_geometry(occupied_voxels)
+        
+        # 显示空体素（绿色）
+        empty_voxels = self.create_voxel_geometry(
+            self.empty_voxels,
+            [0, 1, 0],
+            self.voxel_resolution
+        )
+        if empty_voxels:
+            vis.add_geometry(empty_voxels)
+        
+        # 显示未知体素（灰色）
+        unknown_voxels = self.create_voxel_geometry(
+            self.unknown_voxels,
+            [0.5, 0.5, 0.5],
+            self.voxel_resolution
+        )
+        if unknown_voxels:
+            vis.add_geometry(unknown_voxels)
+        
+        # 显示frontier体素（红色）
+        frontier_voxels = self.create_voxel_geometry(
+            self.frontier_voxels,
+            [1, 0, 0],
+            self.voxel_resolution
+        )
+        if frontier_voxels:
+            vis.add_geometry(frontier_voxels)
+        
+        # 显示光线
+        if camera_pose is not None:
+            directions = self.generate_ray_directions()
+            rays = self.create_ray_geometry(
+                camera_pose[:3, 3],
+                directions,
+                camera_pose[:3, :3],
+                length=0.5  # 光线长度
+            )
+            vis.add_geometry(rays)
+        
+        opt = vis.get_render_option()
+        opt.background_color = np.asarray([0.8, 0.8, 0.8])
+        opt.point_size = 5.0
+        
+        vis.run()
+        vis.destroy_window()
+
+class PBNBV:
+    def __init__(self, voxel_resolution=0.01, camera_intrinsic=None):
+        self.voxel_resolution = voxel_resolution
+        self.voxel_struct = VoxelStruct(voxel_resolution)
+        self.camera_intrinsic = camera_intrinsic or np.array([
+            [902.14, 0, 320],
+            [0, 902.14, 200],
+            [0, 0, 1]
+        ])
+        self.focal_length = (self.camera_intrinsic[0,0] + self.camera_intrinsic[1,1]) / 2 / 1000
+        self.ellipsoids = []
+        
+    def capture(self, point_cloud: np.ndarray, camera_pose: np.ndarray):
+        frontier_voxels, occupied_voxels = self.voxel_struct.update_voxel_map(point_cloud, camera_pose)
+        # self.voxel_struct.visualize_voxel_struct(camera_pose)
+        self.fit_ellipsoids(frontier_voxels, occupied_voxels)
+    
+    def reset(self):
+        self.ellipsoids = []
+        self.voxel_struct = VoxelStruct(self.voxel_resolution)
+    
+    def fit_ellipsoids(self, frontier_voxels: List[np.ndarray], occupied_voxels: List[np.ndarray], 
+                      max_ellipsoids=10):
+        self.ellipsoids = []
+        
+        if not frontier_voxels and not occupied_voxels:
+            return
+            
+        if frontier_voxels:
+            frontier_gmm = self.fit_gmm(np.array(frontier_voxels), max_ellipsoids)
+            self.ellipsoids.extend(self.gmm_to_ellipsoids(frontier_gmm, "frontier"))
+        
+        if occupied_voxels:
+            occupied_gmm = self.fit_gmm(np.array(occupied_voxels), max_ellipsoids)
+            self.ellipsoids.extend(self.gmm_to_ellipsoids(occupied_gmm, "occupied"))
+    
+    def fit_gmm(self, data: np.ndarray, max_components: int) -> GaussianMixture:
+        best_gmm = None
+        best_bic = np.inf
+        
+        for n in range(1, min(max_components, len(data)) + 1):
+            gmm = GaussianMixture(n_components=n, covariance_type='full')
+            gmm.fit(data)
+            bic = gmm.bic(data)
+            
+            if bic < best_bic:
+                best_bic = bic
+                best_gmm = gmm
+                
+        return best_gmm
+    
+    def gmm_to_ellipsoids(self, gmm: GaussianMixture, ellipsoid_type: str) -> List[Dict]:
+        ellipsoids = []
+        
+        for i in range(gmm.n_components):
+            mean = gmm.means_[i]
+            cov = gmm.covariances_[i]
+            
+            eigvals, eigvecs = np.linalg.eigh(cov)
+            radii = np.sqrt(eigvals) * 3
+            
+            rotation = eigvecs
+            pose = np.eye(4)
+            pose[:3, :3] = rotation
+            pose[:3, 3] = mean
+            
+            ellipsoids.append({
+                "type": ellipsoid_type,
+                "pose": pose,
+                "radii": radii
+            })
+            
+        return ellipsoids
+    
+    def evaluate_viewpoint(self, viewpoint_pose: np.ndarray) -> float:
+        if not self.ellipsoids:
+            return 0.0
+            
+        ellipsoid_weights = self.compute_ellipsoid_weights(viewpoint_pose)
+        
+        projection_scores = []
+        for ellipsoid, weight in zip(self.ellipsoids, ellipsoid_weights):
+            score = self.project_ellipsoid(ellipsoid, viewpoint_pose) * weight
+            projection_scores.append((ellipsoid["type"], score))
+        
+        frontier_score = sum(s for t, s in projection_scores if t == "frontier")
+        occupied_score = sum(s for t, s in projection_scores if t == "occupied")
+        
+        return frontier_score - occupied_score
+    
+    def compute_ellipsoid_weights(self, viewpoint_pose: np.ndarray) -> List[float]:
+        centers_world = np.array([e["pose"][:3, 3] for e in self.ellipsoids])
+        centers_homo = np.hstack((centers_world, np.ones((len(centers_world), 1))))
+        centers_cam = (np.linalg.inv(viewpoint_pose) @ centers_homo.T).T[:, :3]
+        
+        z_coords = centers_cam[:, 2]
+        sorted_indices = np.argsort(z_coords)
+        
+        weights = np.zeros(len(self.ellipsoids))
+        for rank, idx in enumerate(sorted_indices):
+            weights[idx] = 0.5 ** rank
+            
+        return weights.tolist()
+    
+    def project_ellipsoid(self, ellipsoid: Dict, viewpoint_pose: np.ndarray) -> float:
+        ellipsoid_pose_cam = np.linalg.inv(viewpoint_pose) @ ellipsoid["pose"]
+        
+        radii = ellipsoid["radii"]
+        rotation = ellipsoid_pose_cam[:3, :3]
+        scales = np.diag(radii)
+        transform = rotation @ scales
+        
+        major_axis = np.linalg.norm(transform[:, 0])
+        minor_axis = np.linalg.norm(transform[:, 1])
+        area = np.pi * major_axis * minor_axis
+        
+        return area
+    
+    def generate_candidate_views(self, num_views=100, longitude_num=5) -> List[np.ndarray]:
+        if self.voxel_struct.bbx_min is None:
+            return []
+            
+        center = (self.voxel_struct.bbx_min + self.voxel_struct.bbx_max) / 2
+        radius = np.linalg.norm(self.voxel_struct.bbx_max - self.voxel_struct.bbx_min) / 2 + self.focal_length
+        
+        candidate_views = []
+        
+        latitudes = np.linspace(np.deg2rad(40), np.deg2rad(90), longitude_num)
+        
+        lengths = [2 * np.pi * np.sin(lat) * radius for lat in latitudes]
+        total_length = sum(lengths)
+        points_per_lat = [int(round(num_views * l / total_length)) for l in lengths]
+        
+        for lat, n in zip(latitudes, points_per_lat):
+            if n == 0:
+                continue
+                
+            longitudes = np.linspace(0, 2*np.pi, n, endpoint=False)
+            for lon in longitudes:
+                x = radius * np.sin(lat) * np.cos(lon)
+                y = radius * np.sin(lat) * np.sin(lon)
+                z = radius * np.cos(lat)
+                position = np.array([x, y, z]) + center
+                
+                z_axis = center - position
+                z_axis /= np.linalg.norm(z_axis)
+                
+                x_axis = np.cross(z_axis, np.array([0, 0, 1]))
+                if np.linalg.norm(x_axis) < 1e-6:
+                    x_axis = np.array([1, 0, 0])
+                x_axis /= np.linalg.norm(x_axis)
+                
+                y_axis = np.cross(z_axis, x_axis)
+                y_axis /= np.linalg.norm(y_axis)
+                
+                rotation = np.column_stack((x_axis, y_axis, z_axis))
+                
+                view_pose = np.eye(4)
+                view_pose[:3, :3] = rotation
+                view_pose[:3, 3] = position
+                
+                candidate_views.append(view_pose)
+                
+        return candidate_views
+    
+    def select_best_view(self) -> np.ndarray:
+        candidate_views = self.generate_candidate_views()
+        if not candidate_views:
+            return np.eye(4)
+            
+        scores = [self.evaluate_viewpoint(view) for view in candidate_views]
+        best_idx = np.argmax(scores)
+        
+        return candidate_views[best_idx]
+    
+    def execute(self) -> Tuple[np.ndarray, bool]:
+        best_view = self.select_best_view()
+        
+        has_frontier = any(e["type"] == "frontier" for e in self.ellipsoids)
+        done = not has_frontier
+        
+        return best_view, done
+    
+import os
+import json
+from utils.render import RenderUtil
+from utils.pose import PoseUtil
+from utils.pts import PtsUtil
+from utils.reconstruction import ReconstructionUtil
+from beans.predict_result import PredictResult
+
+from tqdm import tqdm
+import numpy as np
+import pickle
+
+from PytorchBoot.config import ConfigManager
+import PytorchBoot.namespace as namespace
+import PytorchBoot.stereotype as stereotype
+from PytorchBoot.factory import ComponentFactory
+
+from PytorchBoot.dataset import BaseDataset
+from PytorchBoot.runners.runner import Runner
+from PytorchBoot.utils import Log
+from PytorchBoot.status import status_manager
+from utils.data_load import DataLoadUtil
+
+@stereotype.runner("evaluate_pbnbv")
+class EvaluatePBNBV(Runner):
+    def __init__(self, config_path):
+        
+        super().__init__(config_path)
+    
+        self.script_path = ConfigManager.get(namespace.Stereotype.RUNNER, "blender_script_path")
+        self.output_dir = ConfigManager.get(namespace.Stereotype.RUNNER, "output_dir")
+        self.voxel_size = ConfigManager.get(namespace.Stereotype.RUNNER, "voxel_size")
+        self.min_new_area = ConfigManager.get(namespace.Stereotype.RUNNER, "min_new_area")
+        CM = 0.01
+        self.min_new_pts_num = self.min_new_area * (CM / self.voxel_size) ** 2
+        self.overlap_limit = ConfigManager.get(namespace.Stereotype.RUNNER, "overlap_limit")
+
+        self.pbnbv = PBNBV(self.voxel_size)
+        ''' Experiment '''
+        self.load_experiment("nbv_evaluator")
+        self.stat_result_path = os.path.join(self.output_dir, "stat.json")
+        if os.path.exists(self.stat_result_path):
+            with open(self.stat_result_path, "r") as f:
+                self.stat_result = json.load(f)
+        else:
+            self.stat_result = {}
+
+        ''' Test '''
+        self.test_config = ConfigManager.get(namespace.Stereotype.RUNNER, namespace.Mode.TEST)
+        self.test_dataset_name_list = self.test_config["dataset_list"]
+        self.test_set_list = []
+        self.test_writer_list = []
+        seen_name = set()
+        for test_dataset_name in self.test_dataset_name_list:
+            if test_dataset_name not in seen_name:
+                seen_name.add(test_dataset_name)
+            else:
+                raise ValueError("Duplicate test dataset name: {}".format(test_dataset_name))
+            test_set: BaseDataset = ComponentFactory.create(namespace.Stereotype.DATASET, test_dataset_name)
+            self.test_set_list.append(test_set)
+        self.print_info()
+        
+
+    def run(self):
+        Log.info("Loading from epoch {}.".format(self.current_epoch))
+        self.inference()
+        Log.success("Inference finished.")
+        
+
+    def inference(self):
+        #self.pipeline.eval()
+    
+        test_set: BaseDataset
+        for dataset_idx, test_set in enumerate(self.test_set_list):
+            status_manager.set_progress("inference", "inferencer", f"dataset", dataset_idx, len(self.test_set_list))
+            test_set_name = test_set.get_name()
+
+            total=int(len(test_set))
+            for i in tqdm(range(total), desc=f"Processing {test_set_name}", ncols=100):
+                try:
+                    self.pbnbv.reset()
+                    data = test_set.__getitem__(i)
+                    scene_name = data["scene_name"]
+                    inference_result_path = os.path.join(self.output_dir, test_set_name, f"{scene_name}.pkl")
+                    
+                    if os.path.exists(inference_result_path):
+                        Log.info(f"Inference result already exists for scene: {scene_name}")
+                        continue
+                    
+                    status_manager.set_progress("inference", "inferencer", f"Batch[{test_set_name}]", i+1, total)
+                    output = self.predict_sequence(data)
+                    self.save_inference_result(test_set_name, data["scene_name"], output)
+                except Exception as e:
+                    print(e)
+                    Log.error(f"Error, {e}")
+                    continue
+                
+        status_manager.set_progress("inference", "inferencer", f"dataset", len(self.test_set_list), len(self.test_set_list))
+
+    def get_output_data(self):
+        pose_matrix, done = self.pbnbv.execute()
+
+        offset = np.asarray([[1, 0, 0, 0], [0, -1, 0, 0], [0, 0, -1, 0], [0, 0, 0, 1]])
+        pose_matrix = pose_matrix @ offset
+        rot = pose_matrix[:3,:3]
+        
+        pose_6d = PoseUtil.matrix_to_rotation_6d_numpy(rot)
+        translation = pose_matrix[:3, 3]
+
+        pose_9d = np.concatenate([pose_6d, translation], axis=0).reshape(1,9)
+        pose_9d = pose_9d.repeat(50, axis=0)
+        #import ipdb; ipdb.set_trace()
+        return {"pred_pose_9d": pose_9d}
+        
+    def predict_sequence(self, data, cr_increase_threshold=0, overlap_area_threshold=25, scan_points_threshold=10, max_iter=50, max_retry = 10, max_success=3):
+        scene_name = data["scene_name"]
+        Log.info(f"Processing scene: {scene_name}")
+        status_manager.set_status("inference", "inferencer", "scene", scene_name)
+
+        ''' data for rendering '''
+        scene_path = data["scene_path"]
+        O_to_L_pose = data["O_to_L_pose"]
+        voxel_threshold = self.voxel_size
+        filter_degree = 75
+        down_sampled_model_pts = data["gt_pts"]
+        
+        first_frame_to_world_9d = data["first_scanned_n_to_world_pose_9d"][0]
+        first_frame_to_world = np.eye(4)
+        first_frame_to_world[:3,:3] = PoseUtil.rotation_6d_to_matrix_numpy(first_frame_to_world_9d[:6])
+        first_frame_to_world[:3,3] = first_frame_to_world_9d[6:]
+        self.pbnbv.capture(data["first_scanned_pts"][0], first_frame_to_world)
+        ''' data for inference '''
+        input_data = {}
+        
+        input_data["combined_scanned_pts"] = np.array(data["first_scanned_pts"][0], dtype=np.float32)
+        input_data["scanned_pts"] = [np.array(data["first_scanned_pts"][0], dtype=np.float32)]
+        input_data["scanned_pts_mask"] = [np.zeros(input_data["combined_scanned_pts"].shape[0], dtype=np.bool_)]
+        input_data["scanned_n_to_world_pose_9d"] = [np.array(data["first_scanned_n_to_world_pose_9d"], dtype=np.float32)]
+        input_data["mode"] = namespace.Mode.TEST
+        input_pts_N = input_data["combined_scanned_pts"].shape[0]
+        root = os.path.dirname(scene_path)
+        display_table_info = DataLoadUtil.get_display_table_info(root, scene_name)
+        radius = display_table_info["radius"]
+        scan_points = np.asarray(ReconstructionUtil.generate_scan_points(display_table_top=0,display_table_radius=radius))
+        
+        first_frame_target_pts, first_frame_target_normals, first_frame_scan_points_indices = RenderUtil.render_pts(first_frame_to_world, scene_path, self.script_path, scan_points, voxel_threshold=voxel_threshold, filter_degree=filter_degree, nO_to_nL_pose=O_to_L_pose)
+        scanned_view_pts = [first_frame_target_pts]
+        history_indices = [first_frame_scan_points_indices]
+        last_pred_cr, added_pts_num = self.compute_coverage_rate(scanned_view_pts, None, down_sampled_model_pts, threshold=voxel_threshold)
+        retry_duplication_pose = []
+        retry_no_pts_pose = []
+        retry_overlap_pose = []
+        retry = 0
+        pred_cr_seq = [last_pred_cr]
+        success = 0
+        last_pts_num = PtsUtil.voxel_downsample_point_cloud(data["first_scanned_pts"][0], voxel_threshold).shape[0]
+        #import time
+        while len(pred_cr_seq) < max_iter and retry < max_retry and success < max_success:
+            #import ipdb; ipdb.set_trace()
+            Log.green(f"iter: {len(pred_cr_seq)}, retry: {retry}/{max_retry}, success: {success}/{max_success}")
+            combined_scanned_pts = np.vstack(scanned_view_pts)
+            voxel_downsampled_combined_scanned_pts_np, inverse =  self.voxel_downsample_with_mapping(combined_scanned_pts, voxel_threshold)
+            
+            output = self.get_output_data()
+            pred_pose_9d = output["pred_pose_9d"]
+            pred_pose = np.eye(4)
+            
+            predict_result = PredictResult(pred_pose_9d, input_pts=input_data["combined_scanned_pts"], cluster_params=dict(eps=0.25, min_samples=3))
+            # -----------------------
+            import ipdb; ipdb.set_trace()
+            predict_result.visualize()
+            # -----------------------
+            pred_pose_9d_candidates = predict_result.candidate_9d_poses
+            #import ipdb; ipdb.set_trace()
+            for pred_pose_9d in pred_pose_9d_candidates:
+                #import ipdb; ipdb.set_trace()
+                pred_pose_9d = np.array(pred_pose_9d, dtype=np.float32)
+                pred_pose[:3,:3] = PoseUtil.rotation_6d_to_matrix_numpy(pred_pose_9d[:6])
+                pred_pose[:3,3] = pred_pose_9d[6:]
+                try:
+                    new_target_pts, new_target_normals, new_scan_points_indices = RenderUtil.render_pts(pred_pose, scene_path, self.script_path, scan_points, voxel_threshold=voxel_threshold, filter_degree=filter_degree, nO_to_nL_pose=O_to_L_pose)
+                    #import ipdb; ipdb.set_trace()
+                    if not ReconstructionUtil.check_scan_points_overlap(history_indices, new_scan_points_indices, scan_points_threshold):
+                        curr_overlap_area_threshold = overlap_area_threshold
+                    else:
+                        curr_overlap_area_threshold = overlap_area_threshold * 0.5  
+
+                    downsampled_new_target_pts = PtsUtil.voxel_downsample_point_cloud(new_target_pts, voxel_threshold)
+                    #import ipdb; ipdb.set_trace()
+                    if self.overlap_limit:
+                        overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
+                        if not overlap:
+                            Log.yellow("no overlap!")
+                            retry += 1
+                            retry_overlap_pose.append(pred_pose.tolist())
+                            continue
+                    
+                    history_indices.append(new_scan_points_indices)
+                except Exception as e:
+                    Log.error(f"Error in scene {scene_path}, {e}")
+                    print("current pose: ", pred_pose)
+                    print("curr_pred_cr: ", last_pred_cr)
+                    retry_no_pts_pose.append(pred_pose.tolist())
+                    retry += 1
+                    continue
+                
+                if new_target_pts.shape[0] == 0:
+                    Log.red("no pts in new target")
+                    retry_no_pts_pose.append(pred_pose.tolist())
+                    retry += 1
+                    continue
+                
+                pred_cr, _ = self.compute_coverage_rate(scanned_view_pts, new_target_pts, down_sampled_model_pts, threshold=voxel_threshold)
+                Log.yellow(f"{pred_cr}, {last_pred_cr}, max: , {data['seq_max_coverage_rate']}")
+                if pred_cr >= data["seq_max_coverage_rate"] - 1e-3:
+                    print("max coverage rate reached!: ", pred_cr)
+                    
+            
+
+                pred_cr_seq.append(pred_cr)
+                scanned_view_pts.append(new_target_pts)
+                
+                pred_pose_9d = pred_pose_9d.reshape(1, -1)
+                input_data["scanned_n_to_world_pose_9d"] = [np.concatenate([input_data["scanned_n_to_world_pose_9d"][0], pred_pose_9d], axis=0)]
+                
+                combined_scanned_pts = np.vstack(scanned_view_pts)
+                voxel_downsampled_combined_scanned_pts_np = PtsUtil.voxel_downsample_point_cloud(combined_scanned_pts, voxel_threshold)
+                random_downsampled_combined_scanned_pts_np = PtsUtil.random_downsample_point_cloud(voxel_downsampled_combined_scanned_pts_np, input_pts_N)
+                self.pbnbv.capture(np.array(random_downsampled_combined_scanned_pts_np, dtype=np.float32), pred_pose)
+                input_data["combined_scanned_pts"] = np.array(random_downsampled_combined_scanned_pts_np, dtype=np.float32)
+                input_data["scanned_pts"] = [np.concatenate([input_data["scanned_pts"][0], np.array(random_downsampled_combined_scanned_pts_np, dtype=np.float32)], axis=0)]
+                
+                last_pred_cr = pred_cr
+                pts_num = voxel_downsampled_combined_scanned_pts_np.shape[0]
+                Log.info(f"delta pts num:,{pts_num - last_pts_num },{pts_num}, {last_pts_num}")
+
+                if pts_num - last_pts_num < self.min_new_pts_num and pred_cr <= data["seq_max_coverage_rate"] - 1e-2:
+                    retry += 1
+                    retry_duplication_pose.append(pred_pose.tolist())
+                    Log.red(f"delta pts num < {self.min_new_pts_num}:, {pts_num}, {last_pts_num}")
+                elif pts_num - last_pts_num < self.min_new_pts_num and pred_cr > data["seq_max_coverage_rate"] - 1e-2:
+                    success += 1
+                    Log.success(f"delta pts num < {self.min_new_pts_num}:, {pts_num}, {last_pts_num}")
+
+                last_pts_num = pts_num
+            
+
+        input_data["scanned_n_to_world_pose_9d"] = input_data["scanned_n_to_world_pose_9d"][0].tolist()
+        result = {
+            "pred_pose_9d_seq": input_data["scanned_n_to_world_pose_9d"],
+            "combined_scanned_pts": input_data["combined_scanned_pts"],
+            "target_pts_seq": scanned_view_pts,
+            "coverage_rate_seq": pred_cr_seq,
+            "max_coverage_rate": data["seq_max_coverage_rate"],
+            "pred_max_coverage_rate": max(pred_cr_seq),
+            "scene_name": scene_name,
+            "retry_no_pts_pose": retry_no_pts_pose,
+            "retry_duplication_pose": retry_duplication_pose,
+            "retry_overlap_pose": retry_overlap_pose,
+            "best_seq_len": data["best_seq_len"],
+        }
+        self.stat_result[scene_name] = {
+            "coverage_rate_seq": pred_cr_seq,
+            "pred_max_coverage_rate": max(pred_cr_seq),
+            "pred_seq_len": len(pred_cr_seq),
+        }
+        print('success rate: ', max(pred_cr_seq))
+
+        return result
+
+    def voxel_downsample_with_mapping(self, point_cloud, voxel_size=0.003):
+        voxel_indices = np.floor(point_cloud / voxel_size).astype(np.int32)
+        unique_voxels, inverse, counts = np.unique(voxel_indices, axis=0, return_inverse=True, return_counts=True)
+        idx_sort = np.argsort(inverse)
+        idx_unique = idx_sort[np.cumsum(counts)-counts]
+        downsampled_points = point_cloud[idx_unique]
+        return downsampled_points, inverse
+    
+    def compute_coverage_rate(self, scanned_view_pts, new_pts, model_pts, threshold=0.005):
+        if new_pts is not None:
+            new_scanned_view_pts = scanned_view_pts + [new_pts]
+        else:
+            new_scanned_view_pts = scanned_view_pts
+        combined_point_cloud = np.vstack(new_scanned_view_pts)
+        down_sampled_combined_point_cloud = PtsUtil.voxel_downsample_point_cloud(combined_point_cloud,threshold)
+        return ReconstructionUtil.compute_coverage_rate(model_pts, down_sampled_combined_point_cloud, threshold)
+    
+    def voxel_downsample_with_mapping(self, point_cloud, voxel_size=0.003):
+        voxel_indices = np.floor(point_cloud / voxel_size).astype(np.int32)
+        unique_voxels, inverse, counts = np.unique(voxel_indices, axis=0, return_inverse=True, return_counts=True)
+        idx_sort = np.argsort(inverse)
+        idx_unique = idx_sort[np.cumsum(counts)-counts]
+        downsampled_points = point_cloud[idx_unique]
+        return downsampled_points, inverse
+
+    def save_inference_result(self, dataset_name, scene_name, output):
+        dataset_dir = os.path.join(self.output_dir, dataset_name)
+        if not os.path.exists(dataset_dir):
+            os.makedirs(dataset_dir)
+        output_path = os.path.join(dataset_dir, f"{scene_name}.pkl")
+        pickle.dump(output, open(output_path, "wb"))
+        with open(self.stat_result_path, "w") as f:
+            json.dump(self.stat_result, f)
+    
+
+    def get_checkpoint_path(self, is_last=False):
+        return os.path.join(self.experiment_path, namespace.Direcotry.CHECKPOINT_DIR_NAME,
+                            "Epoch_{}.pth".format(
+                                self.current_epoch if self.current_epoch != -1 and not is_last else "last"))
+
+    def load_experiment(self, backup_name=None):
+        super().load_experiment(backup_name)
+        self.current_epoch = self.experiments_config["epoch"]
+        #self.load_checkpoint(is_last=(self.current_epoch == -1))
+
+    def create_experiment(self, backup_name=None):
+        super().create_experiment(backup_name)
+       
+        
+    def load(self, path):
+        # 如果仍然需要加载某些数据，可以使用numpy的load方法
+        pass
+
+    def print_info(self):
+        def print_dataset(dataset: BaseDataset):
+            config = dataset.get_config()
+            name = dataset.get_name()
+            Log.blue(f"Dataset: {name}")
+            for k,v in config.items():
+                Log.blue(f"\t{k}: {v}")
+
+        super().print_info()
+        table_size = 70
+        Log.blue(f"{'+' + '-' * (table_size // 2)} Pipeline {'-' * (table_size // 2)}" + '+')
+        #Log.blue(self.pipeline)
+        Log.blue(f"{'+' + '-' * (table_size // 2)} Datasets {'-' * (table_size // 2)}" + '+')
+        for i, test_set in enumerate(self.test_set_list):
+            Log.blue(f"test dataset {i}: ")
+            print_dataset(test_set)
+
+        Log.blue(f"{'+' + '-' * (table_size // 2)}----------{'-' * (table_size // 2)}" + '+')
+
--- a/runners/evaluate_uncertainty_guide.py
+++ b/runners/evaluate_uncertainty_guide.py
@ -6,7 +6,6 @@ from utils.pts import PtsUtil
 from utils.reconstruction import ReconstructionUtil
 from beans.predict_result import PredictResult

-import torch
 from tqdm import tqdm
 import numpy as np
 import pickle
@ -34,8 +33,9 @@ class EvaluateUncertaintyGuide(Runner):
        self.min_new_area = ConfigManager.get(namespace.Stereotype.RUNNER, "min_new_area")
        CM = 0.01
        self.min_new_pts_num = self.min_new_area * (CM / self.voxel_size) ** 2
+        self.overlap_limit = ConfigManager.get(namespace.Stereotype.RUNNER, "overlap_limit")

-        
+        self.radius = 0.5
        self.output_data_root =  ConfigManager.get(namespace.Stereotype.RUNNER, "output_data_root")
        self.output_data = dict()
        for scene_name in os.listdir(self.output_data_root):
@ -75,38 +75,48 @@ class EvaluateUncertaintyGuide(Runner):

    def inference(self):
        #self.pipeline.eval()
-        with torch.no_grad():
-            test_set: BaseDataset
-            for dataset_idx, test_set in enumerate(self.test_set_list):
-                status_manager.set_progress("inference", "inferencer", f"dataset", dataset_idx, len(self.test_set_list))
-                test_set_name = test_set.get_name()
+    
+        test_set: BaseDataset
+        for dataset_idx, test_set in enumerate(self.test_set_list):
+            status_manager.set_progress("inference", "inferencer", f"dataset", dataset_idx, len(self.test_set_list))
+            test_set_name = test_set.get_name()

-                total=int(len(test_set))
-                for i in tqdm(range(total), desc=f"Processing {test_set_name}", ncols=100):
-                    try:
-                        data = test_set.__getitem__(i)
-                        scene_name = data["scene_name"]
-                        inference_result_path = os.path.join(self.output_dir, test_set_name, f"{scene_name}.pkl")
-                        
-                        if os.path.exists(inference_result_path):
-                            Log.info(f"Inference result already exists for scene: {scene_name}")
-                            continue
-                        
-                        status_manager.set_progress("inference", "inferencer", f"Batch[{test_set_name}]", i+1, total)
-                        output = self.predict_sequence(data)
-                        self.save_inference_result(test_set_name, data["scene_name"], output)
-                    except Exception as e:
-                        print(e)
-                        Log.error(f"Error, {e}")
+            total=int(len(test_set))
+            for i in tqdm(range(total), desc=f"Processing {test_set_name}", ncols=100):
+                try:
+                    data = test_set.__getitem__(i)
+                    scene_name = data["scene_name"]
+                    inference_result_path = os.path.join(self.output_dir, test_set_name, f"{scene_name}.pkl")
+                    
+                    if os.path.exists(inference_result_path):
+                        Log.info(f"Inference result already exists for scene: {scene_name}")
                        continue
                    
-            status_manager.set_progress("inference", "inferencer", f"dataset", len(self.test_set_list), len(self.test_set_list))
+                    status_manager.set_progress("inference", "inferencer", f"Batch[{test_set_name}]", i+1, total)
+                    output = self.predict_sequence(data)
+                    self.save_inference_result(test_set_name, data["scene_name"], output)
+                except Exception as e:
+                    print(e)
+                    Log.error(f"Error, {e}")
+                    continue
+                
+        status_manager.set_progress("inference", "inferencer", f"dataset", len(self.test_set_list), len(self.test_set_list))

    def get_output_data(self, scene_name, idx):
        pose_matrix = self.output_data[scene_name][idx]
-        pose_6d = PoseUtil.matrix_to_rotation_6d_numpy(pose_matrix[:3,:3])
-        pose_9d = np.concatenate([pose_6d, pose_matrix[:3,3]], axis=0).reshape(1,9)
-        import ipdb; ipdb.set_trace()
+        offset = np.asarray([[1, 0, 0, 0], [0, -1, 0, 0], [0, 0, -1, 0], [0, 0, 0, 1]])
+        pose_matrix = pose_matrix @ offset
+        rot = pose_matrix[:3,:3]
+        
+        pose_6d = PoseUtil.matrix_to_rotation_6d_numpy(rot)
+
+        # 计算相机在球面上的位置
+        camera_direction = rot[:, 2]  # 相机朝向球心
+        translation = -self.radius * camera_direction  # 相机位置在球面上
+
+        pose_9d = np.concatenate([pose_6d, translation], axis=0).reshape(1,9)
+        pose_9d = pose_9d.repeat(50, axis=0)
+        #import ipdb; ipdb.set_trace()
        return {"pred_pose_9d": pose_9d}
        
    def predict_sequence(self, data, cr_increase_threshold=0, overlap_area_threshold=25, scan_points_threshold=10, max_iter=50, max_retry = 10, max_success=3):
@ -129,17 +139,17 @@ class EvaluateUncertaintyGuide(Runner):
        ''' data for inference '''
        input_data = {}
        
-        input_data["combined_scanned_pts"] = torch.tensor(data["first_scanned_pts"][0], dtype=torch.float32).to(self.device).unsqueeze(0)
-        input_data["scanned_pts"] = [torch.tensor(data["first_scanned_pts"][0], dtype=torch.float32).to(self.device).unsqueeze(0)]
-        input_data["scanned_pts_mask"] = [torch.zeros(input_data["combined_scanned_pts"].shape[1], dtype=torch.bool).to(self.device).unsqueeze(0)]
-        input_data["scanned_n_to_world_pose_9d"] = [torch.tensor(data["first_scanned_n_to_world_pose_9d"], dtype=torch.float32).to(self.device)]
+        input_data["combined_scanned_pts"] = np.array(data["first_scanned_pts"][0], dtype=np.float32)
+        input_data["scanned_pts"] = [np.array(data["first_scanned_pts"][0], dtype=np.float32)]
+        input_data["scanned_pts_mask"] = [np.zeros(input_data["combined_scanned_pts"].shape[0], dtype=np.bool_)]
+        input_data["scanned_n_to_world_pose_9d"] = [np.array(data["first_scanned_n_to_world_pose_9d"], dtype=np.float32)]
        input_data["mode"] = namespace.Mode.TEST
-        input_pts_N = input_data["combined_scanned_pts"].shape[1]
+        input_pts_N = input_data["combined_scanned_pts"].shape[0]
        root = os.path.dirname(scene_path)
        display_table_info = DataLoadUtil.get_display_table_info(root, scene_name)
        radius = display_table_info["radius"]
        scan_points = np.asarray(ReconstructionUtil.generate_scan_points(display_table_top=0,display_table_radius=radius))
-
+        
        first_frame_target_pts, first_frame_target_normals, first_frame_scan_points_indices = RenderUtil.render_pts(first_frame_to_world, scene_path, self.script_path, scan_points, voxel_threshold=voxel_threshold, filter_degree=filter_degree, nO_to_nL_pose=O_to_L_pose)
        scanned_view_pts = [first_frame_target_pts]
        history_indices = [first_frame_scan_points_indices]
@ -160,30 +170,20 @@ class EvaluateUncertaintyGuide(Runner):
            
            output = self.get_output_data(scene_name, i)
            pred_pose_9d = output["pred_pose_9d"]
-            import ipdb; ipdb.set_trace()
-            #pred_pose = torch.eye(4, device=pred_pose_9d.device)
-            # # save pred_pose_9d ------
-            # root = "/media/hofee/data/project/python/nbv_reconstruction/nbv_reconstruction/temp_output_result"
-            # scene_dir = os.path.join(root, scene_name)
-            # if not os.path.exists(scene_dir):
-            #     os.makedirs(scene_dir)
-            # pred_9d_path = os.path.join(scene_dir,f"pred_pose_9d_{len(pred_cr_seq)}.npy")
-            # pts_path = os.path.join(scene_dir,f"combined_scanned_pts_{len(pred_cr_seq)}.txt")
-            # np_combined_scanned_pts = input_data["combined_scanned_pts"][0].cpu().numpy()
-            # np.save(pred_9d_path, pred_pose_9d.cpu().numpy())
-            # np.savetxt(pts_path, np_combined_scanned_pts)
-            # # ----- ----- -----
-            predict_result = PredictResult(pred_pose_9d, input_pts=input_data["combined_scanned_pts"][0].cpu().numpy(), cluster_params=dict(eps=0.25, min_samples=3))
+            pred_pose = np.eye(4)
+            
+            predict_result = PredictResult(pred_pose_9d, input_pts=input_data["combined_scanned_pts"], cluster_params=dict(eps=0.25, min_samples=3))
            # -----------------------
            # import ipdb; ipdb.set_trace()
            # predict_result.visualize()
            # -----------------------
            pred_pose_9d_candidates = predict_result.candidate_9d_poses
+            #import ipdb; ipdb.set_trace()
            for pred_pose_9d in pred_pose_9d_candidates:
                #import ipdb; ipdb.set_trace()
-                pred_pose_9d = torch.tensor(pred_pose_9d, dtype=torch.float32).to(self.device).unsqueeze(0)
-                pred_pose[:3,:3] = PoseUtil.rotation_6d_to_matrix_tensor_batch(pred_pose_9d[:,:6])[0]
-                pred_pose[:3,3] = pred_pose_9d[0,6:]
+                pred_pose_9d = np.array(pred_pose_9d, dtype=np.float32)
+                pred_pose[:3,:3] = PoseUtil.rotation_6d_to_matrix_numpy(pred_pose_9d[:6])
+                pred_pose[:3,3] = pred_pose_9d[6:]
                try:
                    new_target_pts, new_target_normals, new_scan_points_indices = RenderUtil.render_pts(pred_pose, scene_path, self.script_path, scan_points, voxel_threshold=voxel_threshold, filter_degree=filter_degree, nO_to_nL_pose=O_to_L_pose)
                    #import ipdb; ipdb.set_trace()
@ -193,25 +193,27 @@ class EvaluateUncertaintyGuide(Runner):
                        curr_overlap_area_threshold = overlap_area_threshold * 0.5  

                    downsampled_new_target_pts = PtsUtil.voxel_downsample_point_cloud(new_target_pts, voxel_threshold)
-                    overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
-                    if not overlap:
-                        Log.yellow("no overlap!")
-                        retry += 1
-                        retry_overlap_pose.append(pred_pose.cpu().numpy().tolist())
-                        continue
+                    #import ipdb; ipdb.set_trace()
+                    if self.overlap_limit:
+                        overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
+                        if not overlap:
+                            Log.yellow("no overlap!")
+                            retry += 1
+                            retry_overlap_pose.append(pred_pose.tolist())
+                            continue
                    
                    history_indices.append(new_scan_points_indices)
                except Exception as e:
                    Log.error(f"Error in scene {scene_path}, {e}")
                    print("current pose: ", pred_pose)
                    print("curr_pred_cr: ", last_pred_cr)
-                    retry_no_pts_pose.append(pred_pose.cpu().numpy().tolist())
+                    retry_no_pts_pose.append(pred_pose.tolist())
                    retry += 1
                    continue
                
                if new_target_pts.shape[0] == 0:
                    Log.red("no pts in new target")
-                    retry_no_pts_pose.append(pred_pose.cpu().numpy().tolist())
+                    retry_no_pts_pose.append(pred_pose.tolist())
                    retry += 1
                    continue
                
@ -225,13 +227,14 @@ class EvaluateUncertaintyGuide(Runner):
                pred_cr_seq.append(pred_cr)
                scanned_view_pts.append(new_target_pts)
                
-                input_data["scanned_n_to_world_pose_9d"] = [torch.cat([input_data["scanned_n_to_world_pose_9d"][0], pred_pose_9d], dim=0)]
+                pred_pose_9d = pred_pose_9d.reshape(1, -1)
+                input_data["scanned_n_to_world_pose_9d"] = [np.concatenate([input_data["scanned_n_to_world_pose_9d"][0], pred_pose_9d], axis=0)]
                
                combined_scanned_pts = np.vstack(scanned_view_pts)
                voxel_downsampled_combined_scanned_pts_np = PtsUtil.voxel_downsample_point_cloud(combined_scanned_pts, voxel_threshold)
                random_downsampled_combined_scanned_pts_np = PtsUtil.random_downsample_point_cloud(voxel_downsampled_combined_scanned_pts_np, input_pts_N)
-                input_data["combined_scanned_pts"] = torch.tensor(random_downsampled_combined_scanned_pts_np, dtype=torch.float32).unsqueeze(0).to(self.device)
-                input_data["scanned_pts"] = [torch.cat([input_data["scanned_pts"][0], torch.tensor(random_downsampled_combined_scanned_pts_np, dtype=torch.float32).unsqueeze(0).to(self.device)], dim=0)]
+                input_data["combined_scanned_pts"] = np.array(random_downsampled_combined_scanned_pts_np, dtype=np.float32)
+                input_data["scanned_pts"] = [np.concatenate([input_data["scanned_pts"][0], np.array(random_downsampled_combined_scanned_pts_np, dtype=np.float32)], axis=0)]
                
                last_pred_cr = pred_cr
                pts_num = voxel_downsampled_combined_scanned_pts_np.shape[0]
@ -239,7 +242,7 @@ class EvaluateUncertaintyGuide(Runner):

                if pts_num - last_pts_num < self.min_new_pts_num and pred_cr <= data["seq_max_coverage_rate"] - 1e-2:
                    retry += 1
-                    retry_duplication_pose.append(pred_pose.cpu().numpy().tolist())
+                    retry_duplication_pose.append(pred_pose.tolist())
                    Log.red(f"delta pts num < {self.min_new_pts_num}:, {pts_num}, {last_pts_num}")
                elif pts_num - last_pts_num < self.min_new_pts_num and pred_cr > data["seq_max_coverage_rate"] - 1e-2:
                    success += 1
@ -248,7 +251,7 @@ class EvaluateUncertaintyGuide(Runner):
                last_pts_num = pts_num
            

-        input_data["scanned_n_to_world_pose_9d"] = input_data["scanned_n_to_world_pose_9d"][0].cpu().numpy().tolist()
+        input_data["scanned_n_to_world_pose_9d"] = input_data["scanned_n_to_world_pose_9d"][0].tolist()
        result = {
            "pred_pose_9d_seq": input_data["scanned_n_to_world_pose_9d"],
            "combined_scanned_pts": input_data["combined_scanned_pts"],
@ -311,21 +314,6 @@ class EvaluateUncertaintyGuide(Runner):
                            "Epoch_{}.pth".format(
                                self.current_epoch if self.current_epoch != -1 and not is_last else "last"))

-    def load_checkpoint(self, is_last=False):
-        self.load(self.get_checkpoint_path(is_last))
-        Log.success(f"Loaded checkpoint from {self.get_checkpoint_path(is_last)}")
-        if is_last:
-            checkpoint_root = os.path.join(self.experiment_path, namespace.Direcotry.CHECKPOINT_DIR_NAME)
-            meta_path = os.path.join(checkpoint_root, "meta.json")
-            if not os.path.exists(meta_path):
-                raise FileNotFoundError(
-                    "No checkpoint meta.json file in the experiment {}".format(self.experiments_config["name"]))
-            file_path = os.path.join(checkpoint_root, "meta.json")
-            with open(file_path, "r") as f:
-                meta = json.load(f)
-            self.current_epoch = meta["last_epoch"]
-            self.current_iter = meta["last_iter"]
-
    def load_experiment(self, backup_name=None):
        super().load_experiment(backup_name)
        self.current_epoch = self.experiments_config["epoch"]
@ -336,8 +324,8 @@ class EvaluateUncertaintyGuide(Runner):
       
        
    def load(self, path):
-        state_dict = torch.load(path)
-        self.pipeline.load_state_dict(state_dict)
+        # 如果仍然需要加载某些数据，可以使用numpy的load方法
+        pass

    def print_info(self):
        def print_dataset(dataset: BaseDataset):
--- a/runners/global_and_local_points_inferencer.py
+++ b/runners/global_and_local_points_inferencer.py
@ -34,6 +34,8 @@ class GlobalAndLocalPointsInferencer(Runner):
        self.min_new_area = ConfigManager.get(namespace.Stereotype.RUNNER, "min_new_area")
        CM = 0.01
        self.min_new_pts_num = self.min_new_area * (CM / self.voxel_size) **2
+        self.overlap_limit = ConfigManager.get(namespace.Stereotype.RUNNER, "overlap_limit")
+        self.enable_cluster = ConfigManager.get(namespace.Stereotype.RUNNER, "enable_cluster")
        ''' Pipeline '''
        self.pipeline_name = self.config[namespace.Stereotype.PIPELINE]
        self.pipeline:torch.nn.Module = ComponentFactory.create(namespace.Stereotype.PIPELINE, self.pipeline_name)
@ -149,27 +151,15 @@ class GlobalAndLocalPointsInferencer(Runner):
            Log.green(f"iter: {len(pred_cr_seq)}, retry: {retry}/{max_retry}, success: {success}/{max_success}")
            combined_scanned_pts = np.vstack(scanned_view_pts)
            voxel_downsampled_combined_scanned_pts_np, inverse =  self.voxel_downsample_with_mapping(combined_scanned_pts, voxel_threshold)
-            
+            #import ipdb; ipdb.set_trace()
            output = self.pipeline(input_data)
            pred_pose_9d = output["pred_pose_9d"]
+            if not self.enable_cluster:
+                pred_pose_9d_candidates = [pred_pose_9d[0]]
+            else:
+                predict_result = PredictResult(pred_pose_9d.cpu().numpy(), input_pts=input_data["combined_scanned_pts"][0].cpu().numpy(), cluster_params=dict(eps=0.25, min_samples=3))
+                pred_pose_9d_candidates = predict_result.candidate_9d_poses
            pred_pose = torch.eye(4, device=pred_pose_9d.device)
-            # # save pred_pose_9d ------
-            # root = "/media/hofee/data/project/python/nbv_reconstruction/nbv_reconstruction/temp_output_result"
-            # scene_dir = os.path.join(root, scene_name)
-            # if not os.path.exists(scene_dir):
-            #     os.makedirs(scene_dir)
-            # pred_9d_path = os.path.join(scene_dir,f"pred_pose_9d_{len(pred_cr_seq)}.npy")
-            # pts_path = os.path.join(scene_dir,f"combined_scanned_pts_{len(pred_cr_seq)}.txt")
-            # np_combined_scanned_pts = input_data["combined_scanned_pts"][0].cpu().numpy()
-            # np.save(pred_9d_path, pred_pose_9d.cpu().numpy())
-            # np.savetxt(pts_path, np_combined_scanned_pts)
-            # # ----- ----- -----
-            predict_result = PredictResult(pred_pose_9d.cpu().numpy(), input_pts=input_data["combined_scanned_pts"][0].cpu().numpy(), cluster_params=dict(eps=0.25, min_samples=3))
-            # -----------------------
-            # import ipdb; ipdb.set_trace()
-            # predict_result.visualize()
-            # -----------------------
-            pred_pose_9d_candidates = predict_result.candidate_9d_poses
            for pred_pose_9d in pred_pose_9d_candidates:
                #import ipdb; ipdb.set_trace()
                pred_pose_9d = torch.tensor(pred_pose_9d, dtype=torch.float32).to(self.device).unsqueeze(0)
@ -185,12 +175,13 @@ class GlobalAndLocalPointsInferencer(Runner):
                        curr_overlap_area_threshold = overlap_area_threshold * 0.5  

                    downsampled_new_target_pts = PtsUtil.voxel_downsample_point_cloud(new_target_pts, voxel_threshold)
-                    overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
-                    if not overlap:
-                        Log.yellow("no overlap!")
-                        retry += 1
-                        retry_overlap_pose.append(pred_pose.cpu().numpy().tolist())
-                        continue
+                    if self.overlap_limit:
+                        overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
+                        if not overlap:
+                            Log.yellow("no overlap!")
+                            retry += 1
+                            retry_overlap_pose.append(pred_pose.cpu().numpy().tolist())
+                            continue
                    
                    history_indices.append(new_scan_points_indices)
                except Exception as e:
--- a/runners/global_points_inferencer.py
+++ b/runners/global_points_inferencer.py
@ -34,6 +34,8 @@ class GlobalPointsInferencer(Runner):
        self.min_new_area = ConfigManager.get(namespace.Stereotype.RUNNER, "min_new_area")
        CM = 0.01
        self.min_new_pts_num = self.min_new_area * (CM / self.voxel_size) **2
+        self.overlap_limit = ConfigManager.get(namespace.Stereotype.RUNNER, "overlap_limit")
+        self.enable_cluster = ConfigManager.get(namespace.Stereotype.RUNNER, "enable_cluster")
        ''' Pipeline '''
        self.pipeline_name = self.config[namespace.Stereotype.PIPELINE]
        self.pipeline:torch.nn.Module = ComponentFactory.create(namespace.Stereotype.PIPELINE, self.pipeline_name)
@ -149,24 +151,12 @@ class GlobalPointsInferencer(Runner):
            voxel_downsampled_combined_scanned_pts_np, inverse =  self.voxel_downsample_with_mapping(combined_scanned_pts, voxel_threshold)
            output = self.pipeline(input_data)
            pred_pose_9d = output["pred_pose_9d"]
+            if not self.enable_cluster:
+                pred_pose_9d_candidates = [pred_pose_9d[0]]
+            else:
+                predict_result = PredictResult(pred_pose_9d.cpu().numpy(), input_pts=input_data["combined_scanned_pts"][0].cpu().numpy(), cluster_params=dict(eps=0.25, min_samples=3))
+                pred_pose_9d_candidates = predict_result.candidate_9d_poses
            pred_pose = torch.eye(4, device=pred_pose_9d.device)
-            # # save pred_pose_9d ------
-            # root = "/media/hofee/data/project/python/nbv_reconstruction/nbv_reconstruction/temp_output_result"
-            # scene_dir = os.path.join(root, scene_name)
-            # if not os.path.exists(scene_dir):
-            #     os.makedirs(scene_dir)
-            # pred_9d_path = os.path.join(scene_dir,f"pred_pose_9d_{len(pred_cr_seq)}.npy")
-            # pts_path = os.path.join(scene_dir,f"combined_scanned_pts_{len(pred_cr_seq)}.txt")
-            # np_combined_scanned_pts = input_data["combined_scanned_pts"][0].cpu().numpy()
-            # np.save(pred_9d_path, pred_pose_9d.cpu().numpy())
-            # np.savetxt(pts_path, np_combined_scanned_pts)
-            # # ----- ----- -----
-            predict_result = PredictResult(pred_pose_9d.cpu().numpy(), input_pts=input_data["combined_scanned_pts"][0].cpu().numpy(), cluster_params=dict(eps=0.25, min_samples=3))
-            # -----------------------
-            # import ipdb; ipdb.set_trace()
-            # predict_result.visualize()
-            # -----------------------
-            pred_pose_9d_candidates = predict_result.candidate_9d_poses
            for pred_pose_9d in pred_pose_9d_candidates:
                #import ipdb; ipdb.set_trace()
                pred_pose_9d = torch.tensor(pred_pose_9d, dtype=torch.float32).to(self.device).unsqueeze(0)
@ -181,12 +171,13 @@ class GlobalPointsInferencer(Runner):
                        curr_overlap_area_threshold = overlap_area_threshold * 0.5  

                    downsampled_new_target_pts = PtsUtil.voxel_downsample_point_cloud(new_target_pts, voxel_threshold)
-                    overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
-                    if not overlap:
-                        Log.yellow("no overlap!")
-                        retry += 1
-                        retry_overlap_pose.append(pred_pose.cpu().numpy().tolist())
-                        continue
+                    if self.overlap_limit:
+                        overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
+                        if not overlap:
+                            Log.yellow("no overlap!")
+                            retry += 1
+                            retry_overlap_pose.append(pred_pose.cpu().numpy().tolist())
+                            continue
                    
                    history_indices.append(new_scan_points_indices)
                except Exception as e:
--- a/runners/local_points_inferencer.py
+++ b/runners/local_points_inferencer.py
@ -34,7 +34,8 @@ class LocalPointsInferencer(Runner):
        self.min_new_area = ConfigManager.get(namespace.Stereotype.RUNNER, "min_new_area")
        CM = 0.01
        self.min_new_pts_num = self.min_new_area * (CM / self.voxel_size) ** 2
-
+        self.overlap_limit = ConfigManager.get(namespace.Stereotype.RUNNER, "overlap_limit")
+        self.enable_cluster = ConfigManager.get(namespace.Stereotype.RUNNER, "enable_cluster")
        ''' Pipeline '''
        self.pipeline_name = self.config[namespace.Stereotype.PIPELINE]
        self.pipeline:torch.nn.Module = ComponentFactory.create(namespace.Stereotype.PIPELINE, self.pipeline_name)
@ -151,24 +152,12 @@ class LocalPointsInferencer(Runner):
            
            output = self.pipeline(input_data)
            pred_pose_9d = output["pred_pose_9d"]
+            if not self.enable_cluster:
+                pred_pose_9d_candidates = [pred_pose_9d[0]]
+            else:
+                predict_result = PredictResult(pred_pose_9d.cpu().numpy(), input_pts=input_data["combined_scanned_pts"][0].cpu().numpy(), cluster_params=dict(eps=0.25, min_samples=3))
+                pred_pose_9d_candidates = predict_result.candidate_9d_poses
            pred_pose = torch.eye(4, device=pred_pose_9d.device)
-            # # save pred_pose_9d ------
-            # root = "/media/hofee/data/project/python/nbv_reconstruction/nbv_reconstruction/temp_output_result"
-            # scene_dir = os.path.join(root, scene_name)
-            # if not os.path.exists(scene_dir):
-            #     os.makedirs(scene_dir)
-            # pred_9d_path = os.path.join(scene_dir,f"pred_pose_9d_{len(pred_cr_seq)}.npy")
-            # pts_path = os.path.join(scene_dir,f"combined_scanned_pts_{len(pred_cr_seq)}.txt")
-            # np_combined_scanned_pts = input_data["combined_scanned_pts"][0].cpu().numpy()
-            # np.save(pred_9d_path, pred_pose_9d.cpu().numpy())
-            # np.savetxt(pts_path, np_combined_scanned_pts)
-            # # ----- ----- -----
-            predict_result = PredictResult(pred_pose_9d.cpu().numpy(), input_pts=input_data["combined_scanned_pts"][0].cpu().numpy(), cluster_params=dict(eps=0.25, min_samples=3))
-            # -----------------------
-            # import ipdb; ipdb.set_trace()
-            # predict_result.visualize()
-            # -----------------------
-            pred_pose_9d_candidates = predict_result.candidate_9d_poses
            for pred_pose_9d in pred_pose_9d_candidates:
                #import ipdb; ipdb.set_trace()
                pred_pose_9d = torch.tensor(pred_pose_9d, dtype=torch.float32).to(self.device).unsqueeze(0)
@ -183,12 +172,13 @@ class LocalPointsInferencer(Runner):
                        curr_overlap_area_threshold = overlap_area_threshold * 0.5  

                    downsampled_new_target_pts = PtsUtil.voxel_downsample_point_cloud(new_target_pts, voxel_threshold)
-                    overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
-                    if not overlap:
-                        Log.yellow("no overlap!")
-                        retry += 1
-                        retry_overlap_pose.append(pred_pose.cpu().numpy().tolist())
-                        continue
+                    if self.overlap_limit:
+                        overlap, _ = ReconstructionUtil.check_overlap(downsampled_new_target_pts, voxel_downsampled_combined_scanned_pts_np, overlap_area_threshold = curr_overlap_area_threshold, voxel_size=voxel_threshold, require_new_added_pts_num = True)
+                        if not overlap:
+                            Log.yellow("no overlap!")
+                            retry += 1
+                            retry_overlap_pose.append(pred_pose.cpu().numpy().tolist())
+                            continue
                    
                    history_indices.append(new_scan_points_indices)
                except Exception as e:
--- a/utils/pycache/data_load.cpython-39.pyc
+++ b/utils/pycache/data_load.cpython-39.pyc
--- a/utils/pycache/render.cpython-39.pyc
+++ b/utils/pycache/render.cpython-39.pyc