# 导入相关问题汇总 ## MindStudio Insight打开profiling数据文件,信息显示不全 ### 问题描述 用MindStudio insight打开profiling文件夹./localhost.localdomain_355720_20251204222740460_ascend_pt,只显示CANN层以上的profiling信息  如果打开文件夹内部的文件夹./localhost.localdomain_355720_20251204222740460_ascend_pt/PROF_000001_20251204222740461_RKFAKPJFMEEOIMMB,只显示CANN层及以下的profiling信息  MindStudio版本信息:8.2 硬件使用 A5。 ### 解决方法 A5当前导出db存在已知问题,手动拦截了db导出。 建议将 ASCEND_PROFILER_OUTPUT 文件夹下的 db 文件均删除,使用 TEXT 格式数据读取。 --- ## 无法导入项目 ### 问题描述  用MindStudio Insight打开profiling,显示无法打开。已排查2和3,profiling中的steptrace也能用google perfetto正常打开。 工具版本:Insight 8.1 ### 解决方法 Insight 版本更新到 8.2 版本及以上 --- ## cluster_analyze集群分析结果MindStudio Insight无法识别 ### 问题描述 客户的内网采集了 128 机的 profiling 之后,使用 `msprof-analyze cluster all -d {profiling\_path}` 命令执行出来的结果,MindStudio Insight 工具识别不了 命令执行的过程中有很多warning: `Rank 58 does not have valid communication data and communication\_matrix data.` `The dst local 993 of the operator allgather -bottom3@xxx cannot be mapped to the global rank.` ### 解决方法 【问题原因】 概览界面有显示,通信界面无显示,原因是cluster_communication_matrix.json缺少具体step,这会导致落盘数据库step记为`0`,但是cluster_step_trace_time.csv里step是`114`,对不上导致通信界面无显示。 【解决方案】 对单卡进行离线解析。 --- ## MindStudio Insight多卡采集结果导入后无Summary Communication ### 问题描述 采集背景:llamafactory lora微调qwen模型,两卡单机。使用 `msprof --output=` 采集 能看到算子和时间线     ### 解决方法 【问题分析】 msprof 是采集 NPU 卡内的数据。而 Summary 和 Communication 显示的是卡间的数据。因此解析 msprof 采集的数据不会得到卡间的数据,Summary 和 Communication 也就没有数据。 【解决方案】 1. 使用 Ascend PyTorch Profiler,可以采集卡内和卡间的数据。https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/850alpha001/devaids/Profiling/atlasprofiling_16_0033.html 2. mstt 可能支持对 msprof 数据的集群分析。 --- ## L1采集集群信息没有集合通信和集群概览信息 ### 问题描述 采集配置如下:  数据导入 Insight 后页面显示:  ### 解决方法 分析数据没有问题,但 Insight 版本太老,更新 Insight 到 8.2 版本解决 --- ## MindStudio Insight多卡采集结果导入后无NPU算子信息 ### 问题描述 环境:镜像版本为:mindie:dev-2.1.RC1.B152-800I-A3-py311-ubuntu22.04-aarch64, 这是msprof采集后解析的结果:  多卡的采集结果op_summary中存在NPU的算子信息,但是导入output文件后: NPU无算子信息展示:  只更改卡数,单卡采集后的结果就存在NPU算子信息:  ### 解决方法 【问题分析】 多卡数据在个人电脑中导入可以看到 Ascend Hardware 泳道。 猜测是因为之前解析过,但未解析完成就关闭 Insight,因此没有显示 Ascend Hardware 的泳道。  【解决方法】 删除导入目录下的 mindstudio_insight_data.db 缓存数据库,重新导入解析 --- ## MindStudio Insight 如何查看GPU采集的profile的内存信息 ### 问题描述 希望查看GPU采集的内存数据 ### 解决方法 2025年 Insight 8 的版本,内存页签需要的数据文件是 memory_record.csv, npu_module_mem.csv, static_op_mem.csv 和 operator_memory.csv 文件。 GPU 应该没有这些数据生成,因此不能查看 GPU 采集的内存数据。 --- ## 导入项目后Communication无数据呈现 ### 问题描述 导入项目后Communication无数据呈现  **工具版本:** Insight 8.2.RC1 **问题来源:** 昇腾计算训练开发部部门MinSpeed-MM团队 **模型使用场景:** qwen3vl-30B, 8卡 **性能问题描述:** 训练场景,开箱性能未达预期 #### 解决方法 【问题分析】 查看analysis.db,发现CommAnalyzerBandwidth表无数据 【解决方法】 怀疑profiling在线解析过程出错,建议离线解析试试看 --- ## 【cluster】MindStudio Insight导入profiling数据后无结果 ### 问题描述 使用MindStudio Insight导入使用msprof-analyze cluster all -d ./profile命令收集的集群性能数据,无响应  ### 解决方法 mstt集群分析时未开启--data_simplification导致,insight不支持未精简模式数据。msprof-analyze cluster -m all -d {数据位置} --data_simplification 再执行一遍即可。和mstt同事确认了一下,后续会默认开启精简,干掉未精简模式。 --- ## 【导入问题】MindStudio Insight 打开profile文件报错“No parsable db files found” ### 解决方法 【问题原因】 导入的文件夹中,PROF_***文件夹下有msprof.db,而ASCEND_PROFILER_OUTPUT中是text格式数据,MindStudio Insight会优先识别msprof.db,导致无法展示ASCEND_PROFILER_OUTPUT文件夹中的数据。 【解决方案】 导入时,只导入ASCEND_PROFILER_OUTPUT文件夹即可。 从采集上来说,出现ASCEND_PROFILER_OUTPUT中是text格式而PROF_***有msprof.db的原因是CANN用的是默认导出db的而框架侧profiling是旧的。 --- ## 【导入问题】文件均存在,但无法导入No parsable db files found ### 问题描述 文件均存在,但无法导入   ### 解决方法 【问题原因】 导入的文件夹中,PROF_***文件夹下有msprof.db,而ASCEND_PROFILER_OUTPUT中是text格式数据,MindStudio Insight会优先识别msprof.db,导致无法展示ASCEND_PROFILER_OUTPUT文件夹中的数据。 【解决方案】 导入时,只导入ASCEND_PROFILER_OUTPUT文件夹即可。 从采集上来说,出现ASCEND_PROFILER_OUTPUT中是text格式而PROF_***有msprof.db的原因是CANN用的是默认导出db的而PTA是旧的。建议更新PTA。 --- ## MindStudio Insight 导入profiling数据时,看不到目录 ### 问题描述 版本:8.1.RC1 重启Insight还是看不到  ### 解决方法 【问题原因】 导入路径安全检验防护,主要字符为以下这些  【后续措施】 可进行简单提示 --- ## MindStudio Insight 解析数据nodata ### 问题描述 数据有,单解析nodata   ### 解决方法 重新导入后问题解决,可能的原因是数据文件过大,导致磁盘空间耗尽 --- ## MindStudio Insight 打开profile没数据显示 ### 问题描述 版本号 8.1.RC1 ### 解决方法 是因为profiling数据中缺失了trace_view.json文件导致,下载该文件后显示正常 --- ## 打开JSON文件没有trace图显示 ### 问题描述 版本号 8.2.RC1 ### 解决方法 【错误原因】 采集侧问题,和MindStudio Insight无关,采集侧的时间跨度过大,而timeline界面初始显示的时间跨度就是采集侧的时间跨度。 【解决方案】 可以先任意搜索一个事件,界面会自动放大到对应大小,然后使用wasd查看。 --- ## MindStudio Insight打开性能仿真图trace.json报错 ### 问题描述 通过msprof op simulator生成算子仿真图 通过MindStudio Insight打开trace.json文件失败,报错如下:  ### 解决方法 【问题原因】 客户从vscode上下载原始数据后,JSON数据格式变成了bin文件格式,导致解释识别失败 【解决方案】 将原始数据改回JSON数据后即可成功导入 【进一步提升】 客户使用老版本Insight报错提示不够准确,新版本Insight在错误提示上更加友好,可持续优化 --- ## 无法加载profiling,一直转圈 ### 问题描述 jupyter 版本 一开始能加载,突然弹窗  然后就一直转圈  ### 解决方法 【解决方案】 将数据下载到本地后,使用Windows版本打开,能够正常展示。 【遗留问题】 1.定位Jupyter无法加载和断连的原因。 2.ACC PMU无法展示,原因是单个泳道数据过多,导致前端通信量承载不了,致使断连,Counter泳道在迭代四已通过采样减小数据量。用户数据单卡导入是不会出现无法加载和断连现象的 --- ## 使用msprof采集集群profiling,没有集群通信信息 ### 问题描述 * 打开集群profiling后,没有集群通信信息 ### 解决方法 检查下是不是采集时profiler等级为Level0,改成Level1; 如果Level1仍然没有,且采集方式为msprof通用命令(而非AI框架接口命令),检查下是不是没做通信性能数据解析,参考命令: ```bash msprof --export=on --output=