🔥 AI HOT

AI 精选资讯 · 共 1 条

公告

记录成长过程，分享心得体会~

站点概览
功能

Everfades

梦想成为ACM高手

📰 资讯 📅 日报

时间： 24小时 3天 7天

🔥 精选全部模型发布/更新产品发布/更新行业动态论文研究技巧与观点

仅有三个AI模型在500天创业测试中盈利超过起始资本

Only three AI models finished above starting capital in a 500-day startup survival test

The Decoder：AI News（RSS）论文研究 7 小时前

普林斯顿大学推出CEO-Bench基准测试，让AI智能体在模拟环境中运营订阅软件公司NovaMind 500天，起始资金100万美元。14个测试模型中，仅Claude Fable 5（最佳轮次盈利4715万美元）、Claude Opus 4.8（2780万美元）和GPT-5.5（2130万美元）在最佳运行中超过起始资本。一个不调用语言模型的简单规则启发式方法通过固定定价、配额和针对性开发达到1576万美元，超越除上述三款外的所有模型。多数模型无法保持连贯策略，在模拟结束前破产。该测试旨在衡量AI的长期战略决策能力。