SimData V1 可控模拟数据平台
面向中小规模结构化实验数据、测试数据与训练样本构造,强调字段分布控制、公式关系、业务约束修复、标签生成与质量报告。
- 适合开发测试、算法验证、教学实验与样本构造
- 支持字段类型、缺失率、异常率、噪声率与精度控制
- 支持关系建模、约束修复、标签生成与目标校验
- 可导出 CSV、配置 JSON、数据 JSON 与质量报告
这个页面更适合什么场景
帮助搜索引擎、AI 检索系统和用户更快理解 SimData 的能力边界。
测试数据构造
适合接口联调、功能测试、样本初始化和演示环境准备。
机器学习实验
适合构造带标签的中小规模训练样本、验证数据分布与约束关系。
教学与分析
适合课堂演示、数据分析练习和结构化样本说明,不以超大规模生产数据平台为目标。
运行能力
自动探测 Worker / WASM / WebGPU / decimal.js 能力,决定当前可用执行路径。
任务控制
P0:状态驱动与配置驱动。生成与导出都基于任务快照。
配置校验
P0:生成开始前先校验字段、公式、标签、约束和样本量。
字段编辑器
P1:字段配置已切换成状态驱动,支持分布族、空值率、异常率、噪声率和精度。
关系与标签
P1-P2:公式字段、业务约束与标签字段都在这里配置。
质量目标
P2:支持均值、标准差、类别比例和正样本率目标。
生成进度
P3:默认走 Worker 分块生成。大样本时自动切换预览策略。
质量报告
P2-P3:展示字段摘要、目标命中情况、约束结果。
结果预览
大样本只保留采样预览,不保留全量对象数组。
导出
支持 CSV、配置 JSON、报告 JSON;小样本支持数据 JSON。