标签:AI模型评估

小型AI模型的推理能力为何如此脆弱?

近期,米拉研究所、谷歌 DeepMind 和微软研究院的研究人员对 AI 语言模型的推理能力进行了惊人的深入调查,揭示了小型和便宜的模型在应对复杂问题时的显著不...

AI模型的真相:你相信了吗?

近期,一项由OpenAI进行的惊人研究揭示了最先进的人工智能语言模型在回答事实问题时的表现远低于预期。通过SimpleQA基准测试,这项研究分析了4,326个涵盖科学...