登陆注册

专注数学文本的超大规模数据集

  • 200GB!AutoMathText:专注数学文本的超大规模数据集

    划重点:1.📌AutoMathText是一个200GB的数学文本数据集,包含来自不同来源的科学论文、编程代码片段和网页数据,适用于数学推理、推理训练和微调等多种应用场景。2.📌支持文本生成和问答任务,特别适用于开发和测试理解和生成数学相关内容的模型。3.📌数据集包含10亿到100亿的数据量级,提供丰富的资源供大规模模型训练。
    站长网2024-01-31 10:28:39
    0000