木哈布

MUHUB·项目档案

返回首页

UltraData

当前公开信息有限。UltraData 是面壁智能开源的大模型训练数据集项目,提供 Ultra-FineWeb-L3 和 UltraData-SFT-2605 两套核心数据,分别用于预训练退火阶段和后训练微调,旨在通过高质量合成数据提升端侧小参数模型性能。

访问地址
www.muhub.cn/projects/ultradata
收录时间
2026/06/01 18:52

最新动态

  • 项目已收录2026/6/1 18:52:34

    项目已收录到 MUHUB 项目库

    来自项目发现队列的候选线索,已完成首次建档。

项目详情

当前公开信息有限。UltraData 是面壁智能开源的大模型训练数据集项目,提供 Ultra-FineWeb-L3 和 UltraData-SFT-2605 两套核心数据,分别用于预训练退火阶段和后训练微调,聚焦于通过高质量合成数据提升端侧小参数模型的性能,覆盖数学、代码、知识等主流技术领域。 适合:大模型研究人员、AI开发者、端侧模型训练者。 典型使用场景:预训练退火阶段的数据增强;后训练微调的数据准备;端侧小参数模型性能提升。

类型与标签

分类 · DATA_TOOLAI_AGENT数据与模型平台 · web技术 · synthetic-data技术 · fine-tuning技术 · pretraining渠道 · github#大模型研究人员#AI开发者#端侧模型训练者

项目信息源

本项目页基于网络公开信息整理,如有侵权,请联系我们。

代码仓库数据

暂无代码仓库数据

当前项目未配置 GitHub 仓库,不影响其它信息展示。

官方媒体

运营信息

暂无运营信息。后续将展示项目方主动披露的运营数据、更新动态、用户规模、融资进展等信息。

📚 参考资料 / 媒体报道