SimData by SimLabs

SimData V1 可控模拟数据平台

面向中小规模结构化实验数据、测试数据与训练样本构造,强调字段分布控制、公式关系、业务约束修复、标签生成与质量报告。

  • 适合开发测试、算法验证、教学实验与样本构造
  • 支持字段类型、缺失率、异常率、噪声率与精度控制
  • 支持关系建模、约束修复、标签生成与目标校验
  • 可导出 CSV、配置 JSON、数据 JSON 与质量报告

这个页面更适合什么场景

帮助搜索引擎、AI 检索系统和用户更快理解 SimData 的能力边界。

测试数据构造

适合接口联调、功能测试、样本初始化和演示环境准备。

机器学习实验

适合构造带标签的中小规模训练样本、验证数据分布与约束关系。

教学与分析

适合课堂演示、数据分析练习和结构化样本说明,不以超大规模生产数据平台为目标。

运行能力

自动探测 Worker / WASM / WebGPU / decimal.js 能力,决定当前可用执行路径。

任务控制

P0:状态驱动与配置驱动。生成与导出都基于任务快照。

配置校验

P0:生成开始前先校验字段、公式、标签、约束和样本量。

字段编辑器

P1:字段配置已切换成状态驱动,支持分布族、空值率、异常率、噪声率和精度。

关系与标签

P1-P2:公式字段、业务约束与标签字段都在这里配置。

质量目标

P2:支持均值、标准差、类别比例和正样本率目标。

生成进度

P3:默认走 Worker 分块生成。大样本时自动切换预览策略。

质量报告

P2-P3:展示字段摘要、目标命中情况、约束结果。

结果预览

大样本只保留采样预览,不保留全量对象数组。

导出

支持 CSV、配置 JSON、报告 JSON;小样本支持数据 JSON。