SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI
事件的起因,是上个月油管用户Saityo发起的投诉
Anthropic重磅研究:AI竟能被人类激怒暴走 绝望时还会勒索人类
从谄媚到作弊,Anthropic发现AI内部还有另一套东西
单纯延长模型内部推理轨迹的时代将过去,未来的主导将是在与环境交互中持续迭代的智能体思考。
大学教授实测AI眼镜“作弊”:30分钟斩获92.5分 碾压95%的学生
港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生
04/01 16:41
01/20 14:04
01/20 13:53