MUHUB·项目档案
返回首页当前公开信息有限。UltraData 是面壁智能开源的大模型训练数据集项目,提供 Ultra-FineWeb-L3 和 UltraData-SFT-2605 两套核心数据,分别用于预训练退火阶段和后训练微调,旨在通过高质量合成数据提升端侧小参数模型性能。
项目已收录到 MUHUB 项目库
来自项目发现队列的候选线索,已完成首次建档。
当前公开信息有限。UltraData 是面壁智能开源的大模型训练数据集项目,提供 Ultra-FineWeb-L3 和 UltraData-SFT-2605 两套核心数据,分别用于预训练退火阶段和后训练微调,聚焦于通过高质量合成数据提升端侧小参数模型的性能,覆盖数学、代码、知识等主流技术领域。 适合:大模型研究人员、AI开发者、端侧模型训练者。 典型使用场景:预训练退火阶段的数据增强;后训练微调的数据准备;端侧小参数模型性能提升。
本项目页基于网络公开信息整理,如有侵权,请联系我们。
暂无代码仓库数据
当前项目未配置 GitHub 仓库,不影响其它信息展示。
暂无运营信息。后续将展示项目方主动披露的运营数据、更新动态、用户规模、融资进展等信息。