开源 llm,用于在最多 200b 个文本标记上进行训练的llm。 34b 的性能接近 google 的 minerva 62b,尽管其参数只有一半。使用proof-pile-2,一种混合科学论文、包含数学内容的网络数据和数学代码,从而产生。在math基准测试中,在等参数基础上优于所有已知的开放基模型,以及未发布的minerva模型套件。此外,llemma能够在无需进一步微调的情况下进行工具使用和形式定理证明。
未经允许不得转载:尊龙游戏旗舰厅官网 » llemma: 数学 llm
开源 llm,用于在最多 200b 个文本标记上进行训练的llm。 34b 的性能接近 google 的 minerva 62b,尽管其参数只有一半。使用proof-pile-2,一种混合科学论文、包含数学内容的网络数据和数学代码,从而产生。在math基准测试中,在等参数基础上优于所有已知的开放基模型,以及未发布的minerva模型套件。此外,llemma能够在无需进一步微调的情况下进行工具使用和形式定理证明。
未经允许不得转载:尊龙游戏旗舰厅官网 » llemma: 数学 llm