在人工智能领域,解决复杂的逻辑与数学推理问题一直是衡量模型智能水平的核心指标。近日,一项全新的研究成果引起了学术界与工业界的广泛关注:研究人员成功训练出一种全新的系统,专门用于攻克小学程度的数学应用题。
该系统的表现令人瞩目,其在处理数学应用题时的准确率几乎达到了经过微调后的GPT-3模型的两倍。这一突破标志着AI在处理结构化逻辑推理任务方面迈出了关键一步,展示了特定领域模型在逻辑严密性上的巨大潜力。
更具参考价值的是,该系统的表现已非常接近人类儿童的水平。在针对9至12岁儿童进行的测试中,该样本组在特定数据集上的得分率为60%,而该AI系统的得分率也达到了55%。这意味着,该系统的解题能力已能够达到人类同龄儿童约90%的水平,为构建具备类人逻辑推理能力的智能体提供了新的研究路径。
🔗 来源:OpenAI
推荐意见