2025-02-03
【OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出】
最新报道,OpenAI发布了一款新的人工智能工具“DeepResearch”,旨在为用户执行耗时的在线研究任务,涵盖从复杂科学问题到汽车推荐等众多领域。这一新工具进一步丰富了这家初创公司的人工智能代理阵容。DeepResearch可能需要5到30分钟来完成其工作——在你离开或处理其他任务时深入挖掘网络。最终输出以报告的形式出现在聊天中,很快用户还将看到嵌入的图像、数据可视化和其他分析输出,以增强清晰度。这次的时间大大提升了它的能力。例如,在“人类的最后考试”中,DeepResearch取得了令人印象深刻的26.6%的准确率——远远超过了其最接近的竞争对手DeepSeekR1,后者的得分低于10%。这一飞跃凸显了系统的迭代优化和结构化综合能力,证明了在人工智能快速发展的步伐中,有些任务确实需要时间。