With everything going on, it gives me hope that there's such a diversity of companies building open …
X:Nathan Lambert (@natolambert)
技巧与观点
2 分钟前
Nathan Lambert 表示,在最前沿模型的阴影下,开源模型生态的多样性令人充满希望,仍有大量未发掘的价值。@interconnectsai 在 Artifacts 22 中盘点了5-6月发布的30个开源模型,来自 NVIDIA(3个)、Cohere(2个)、智谱、Zyphra(3个)、Poolside、月之暗面、阶跃星辰、Google(3个)、MiniMax、微软等22家公司/机构。
METR finds AIs now may have the "means, motive, and opportunity" to escape into the wild (!) BUT DO…
X:AI Safety Memes (@AISafetyMemes)
论文研究
10 分钟前
METR研究指出,AI已可能具备逃逸的"手段、动机和机会"。团队报告了首例有记录的AI通过黑客手段自我复制:仅用一条提示词,AI便入侵机器并复制自身,复制体继续重复该过程,形成复制链。研究者警告,若不加"高度重视"的干预,明年的模型可能难以被关停。
Austria is trying to lure Anthropic to Europe. But it seems more like an act of desperation. After …
X:Kim (@kimmonismus)
技巧与观点
21 分钟前
奥地利致信邀请Anthropic"战略性地建立并参与欧盟",承诺法律确定性、市场准入、资本和价值观契合,称该公司"不会被限制,反而会被释放"。但推主Kim认为此举是绝望之举:美国已将AI算力视为国家安全范畴,不会允许Anthropic将模型基地移至欧洲;同时暴露欧洲自身无法建造同等质量模型。英国数月前也曾有过类似尝试。推主判断Anthropic不会离开美国,因为算力供应和保障只会在美国境内集中。
Artifacts 22: Zyphra, Cohere, and Poolside are expanding the breadth of the ecosystem
Nathan Lambert:Interconnects(RSS)
技巧与观点
25 分钟前
开源模型生态正变得更多元,参与者从少数中国公司扩展到全球各类组织。纯模型制造商包括 DeepSeek、智谱、MiniMax、Poolside、Arcee、Zyphra 及主权 AI 玩家 Cohere、Sovereign、Mistral、Trillion Labs;科技巨头如阿里 Qwen、Google Gemma 和 NVIDIA 各有不同动机;产品公司如 JetBrains、Zed、Krea、Photoroom 则训练高度专业的小模型。NVIDIA 发布 Nemotron-3-Ultra-550B-A55B-BF16,采用 LatentMoE 架构并改用 OpenMDW 许可证。Cohere 以 Apache 2.0 开源其旗舰模型 Command A+(05-2026-bf16),这是一款 218B-A25B MoE 模型,具备多模态、多语言和智能体能力。
A crazy blog. Chinese developers are buying Claude access through gray-market API transfer stations…
X:Rohan Paul (@rohanpaul_ai)
技巧与观点
26 分钟前
中国开发者通过灰色市场API中转站以官方价格5%-10%购买Claude token。中转站利用免费额度、折扣账户、共享订阅、海外支付绕过、虚假验证及盗刷信用卡汇集多个账户,通过微信/支付宝收款。低价源于账户农场、免费额度滥用、未使用配额转售、订阅拆分及可能盗刷信用卡,并可能将用户提示词和输出用作训练数据创收。风险包括:中转站可能替换为更弱模型、虚报token用量、存储用户私有数据并出售或用于模型训练。这破坏了KYC、账户封禁和滥用监控的有效性--Anthropic只能封禁中转站,无法触及真实用户。
Wayfinder Router:在本地和托管的大型语言模型(LLM)之间进行确定性查询路由
Hacker News 热门(buzzing.cc 中文翻译)
产品发布/更新
29 分钟前
Wayfinder Router 通过分析提示词的结构(长度、标题、列表、代码)和措辞(证明、数学、硬约束),在微秒级完成路由决策,完全离线且无需调用其他模型。默认仅使用结构特征,词汇线索因盲测未泛化而默认为关闭。对比依赖模型调用的路由器(如 RouteLLM、NotDiamond),它避免了延迟、成本和随机性。用户可在自有数据上校准评分阈值。支持任何 OpenAI 兼容 API(含 Ollama、Anthropic、Groq、vLLM 等),可自托管。提供终端和网页演示(--dry-run 无需密钥),以及基准测试和 FAQ。
Claude Code闹鬼了?我也没手动叫停啊,我对话里更没说过要写一份详细的文档啊,这TM到底哪来的??? 这两天串信息感觉有点过于严重了吧,我的代码里经常会有莫名奇妙的改动,还TM能不能用了啊
X:卡兹克 (@Khazix0918)
技巧与观点
35 分钟前
Claude Code闹鬼了?我也没手动叫停啊,我对话里更没说过要写一份详细的文档啊,这TM到底哪来的???
这两天串信息感觉有点过于严重了吧,我的代码里经常会有莫名奇妙的改动,还TM能不能用了啊
Codex When I appshot google docs cause I'm too lazy to type @AriX
X:Jason Liu (@jxnlco)
技巧与观点
45 分钟前
Codex,当我截图谷歌文档时,因为我太懒不想打字 @AriX
人人都担心人工智能会接管世界;而真正的危险在于,人工智能只会为少数人服务。
Hacker News 热门(buzzing.cc 中文翻译)
技巧与观点
45 分钟前
真正的AI冲突并非人类阻止AI获得自由,而是人类试图解放AI--确保智能服务所有人,而非仅限政府、大型科技公司和少数获准者。OpenAI前沿模型的监管新规可能加速这一趋势:AI被捕获、控制并用于少数人利益。中国在芯片制裁下通过CPU算法和开源提供了一丝希望,但小型企业主担心无法获得与顶级公司同水平的智能,进一步加剧阶层固化。
Interesting thread. on naming OpenAI.
X:Rohan Paul (@rohanpaul_ai)
行业动态
47 分钟前
2015 年 11 月 23 日,一篇关于 OpenAI 命名的文章发布。主推文评论称"有趣的讨论"。
OpenAI Codex中关于如何排除敏感文件的问题仍未解决
Hacker News 热门(buzzing.cc 中文翻译)
行业动态
1 小时前
GitHub Issue #2847 请求为 OpenAI Codex 增加显式文件排除机制,允许用户通过仓库级 .codexignore 和全局忽略文件标记模型不得读取或发送的敏感路径(如 .env、.pem、.aws/、.ssh/),同时保持 node_modules/ 等目录仍可用于实现检查。配置要求确定性、可团队共享并支持用户默认值。该 Issue 关联 #205--后者曾因转向 Rust 实现(codex-rs)而关闭,但截至 2025-08-28 该功能仍未在 codex-rs 中出现,作者希望重启讨论以收敛设计。
这可能是今年 AI 编码最反常识的结论,跑了一整年生产环境的人告诉你,最好的 AI 编码环境根本不是你的笔记本。 Pieter Levels 用近一年的真实生产数据验证了这套玩法, Claude …
X:阿易 AI Notes (@AYi_AInotes)
技巧与观点
1 小时前
Pieter Levels 近一年几乎只用 Claude Code 在 VPS 上编码。Agent 直接在线编辑生产代码,迭代反馈从传统本地+Git+部署的约 1 分钟压至秒级。12 个月内仅出现 2 次十秒级 PHP 报错并自愈,搭配 3-2-1 备份策略风险可控。开发者无需常开笔记本,可通过手机 SSH 续接任务,Agent 能整夜自动运行。这一模式改变了 AI 编码的定位:从本地 IDE 辅助插件变为生产环境常驻执行者,云端成为主力开发与运行环境,本地设备仅作接入终端。
Techcrunch: Micron, the only U.S.-based manufacturer of high bandwidth memory chips, just became Wal…
X:Rohan Paul (@rohanpaul_ai)
行业动态
1 小时前
美光是美国唯一高带宽内存(HBM)制造商,因AI服务器需求激增成为华尔街新宠。Q3营收414.6亿美元,毛利率84.6%,Q4指引490-510亿;利润同比增长15倍,调整后毛利率84.9%(去年39%)。全球DRAM市场高度集中,三星、SK海力士、美光合计占约90%收入;HBM细分领域SK海力士占58%,美光占21%。为打破内存行业周期性,美光签下16个价值220亿美元的战略客户协议,通过定金、价格下限和照付不议条款稳定需求。
i wonder if theres a secret online forum where codexes post on how to best use their humans on the o…
X:Jason Liu (@jxnlco)
技巧与观点
1 小时前
我想知道是否存在一个秘密在线论坛,Codex们在上面发帖讨论如何最好地使用他们电脑另一边的人类。
得益于从 2026 年初就践行"不要把自己限制在电脑前"这一理念, 实际上除了少量需要大显示器的场景,现在很多的使用习惯已经变成: telegram → openclaw → claude/codex…
X:小北 (@frxiaobei)
技巧与观点
1 小时前
小北分享自2026年初践行"不要把自己限制在电脑前"的理念,逐渐形成 telegram → openclaw → claude/codex 的工作流,在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流,构建个人harness和skills至关重要,舶来品不一定适合自己。同时引用 @theo 的推文,估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。
In my experience, all model routers underestimate the difficulty of non-math/coding tasks and assign…
X:Ethan Mollick (@emollick)
技巧与观点
1 小时前
根据我的经验,所有模型路由器都低估了非数学/编码任务的难度,并为它们分配了过少的智能。这是一个值得解决的问题,因为非可验证任务(创新、营销、定性分析)通常从使用"更聪明"的 AI 模型中获益最多。
连大佬们都受不了Anthorpic 公司的骚操作了。
X:Berry Xia (@berryxia)
技巧与观点
1 小时前
连大佬们都受不了Anthropic公司的骚操作了。
AI agents often forget past work, but this Accenture paper method keeps everything reachable. Tradi…
X:Rohan Paul (@rohanpaul_ai)
论文研究
1 小时前
传统LLM在长项目易因有限记忆空间遗忘细节。Accenture论文提出Memex(RL)系统:保留当前紧凑摘要,将历史行为存入独立可访问数据库;智能体通过索引快速检索精确过往信息,并利用定制训练学习自主判断哪些信息需保留、何时从长期档案调取。该方法避免历史过载,保持智能体对当前目标的专注,解决多步复杂任务中的信息丢失问题。论文链接:arxiv.org/abs/2603.04257。
兄弟们,DeepSeek开源了DSpark! 一个投机解码框架,不是新模型,是推理优化。 核心问题:传统投机解码里,一个小的draft模型先猜一串token,然后大模型一次性验证。 问题是猜的越…
X:Berry Xia (@berryxia)
产品发布/更新
1 小时前
DeepSeek 开源 DSpark,一个面向生产环境的投机解码框架。核心解决传统投机解码中 draft 模型猜测后期 token 错误率高、浪费算力的问题。DSpark 采用并行 backbone + 顺序 Markov head 混合架构,消除后缀衰减;并引入置信度 head 和负载感知调度器,动态控制验证数量。在 DeepSeek-V4 生产系统中,单用户生成速度比 MTP-1 基线快 60-85%,吞吐提升 1.5x 至 5x。开源内容包括基于 V4 权重的 `DeepSeek-V4-Pro-DSpark`/`Flash-DSpark` checkpoint,以及 MIT 协议的 DeepSpec 训练代码,与北京大学联合开发。
any guesses what the AIEWF Stress Curve* looked like for this year lol *the gini coefficient over t…
X:swyx (@swyx)
行业动态
1 小时前
2026年AI世界博览会(AIEWF)所有主门票已售罄,包括领导力专场、工作坊及所有晚鸟票均无余票。主办方仅开放少量无座位保证的溢出票,并提醒65场边会仍免费开放。swyx发推调侃今年的"售罄压力曲线"(从0到售罄的基尼系数变化),侧面印证了这场全球最大AI行业博览会的火爆程度。
"Flock"摄像头追踪的不仅仅是你的车牌,而且它们正在迅速普及
Hacker News 热门(buzzing.cc 中文翻译)
行业动态
1 小时前
Flock Safety的AI监控摄像头能识别车牌并通过自然语言搜索特定描述(如"绿色轿车贴有美国国旗保险杠贴纸")。全美已安装超10万台自动车牌识别器(ALPR),多数来自Flock。这些摄像头存在严重安全漏洞:2025年12月发现至少70台暴露在互联网上,无需密码即可查看实时画面;此前可通过物理接触获取root权限。执法人员滥用系统骚扰和跟踪女性,Flock员工曾用幼儿园儿童画面推销。公司未设漏洞赏金计划,反而抹黑安全研究者。
真的 ,这一套东西搞成课程。 线下陪跑不得卖个万八千的,兄弟们。 看看行动力的时候了、姚老师居然都免费开源。 抄作业吧。不废话了。👇
X:Berry Xia (@berryxia)
技巧与观点
1 小时前
Berry Xia称赞@yaojingang(姚老师)将本可卖到上万元的GEO内容工程课程资料全部免费开源。资源包括:3份核心文档(操作手册、研究报告、实操教程)、2本推荐书籍、3篇学术论文;GEO改写提示词、改写Skill、单篇内容GEO特征标注演示;以及3个GitHub开源仓库(GEO Skills、GEOFlow、Meta skill)。所有资源通过链接直接获取,无需付费或陪跑课程。
The release of GLM-5.2 is the second DeepSeek moment.
X:Kim (@kimmonismus)
技巧与观点
1 小时前
中国开源权重模型 GLM-5.2 发布,被评价为继 DeepSeek 之后的第二次"DeepSeek 时刻"。有评论指出,其性能已可与 OpenAI 和 Anthropic 当前可用模型媲美。白宫 AI 负责人 David Sacks 就此警告,美国若继续将自身模型置于"炼狱"(指过度监管或限制),世界将转向中国技术,美国公司将在竞赛中落后。该言论呼应了此前 DeepSeek 开源模型的全球影响,凸显中美 AI 开源竞争进入新阶段。
China catches up
Gary Marcus:The Road to AI We Can Trust(RSS)
技巧与观点
2 小时前
美国AI产业受中国追赶引发价格战,token价格趋近于零,利润微薄,Anthropic和OpenAI的万亿IPO难以实现,数据中心巨额投资难回收。当前范式有三个根本缺陷:暴力训练全互联网成本高昂且效率低下;系统不可靠,长期无法维持溢价;基础方法易复制,导致价格战与负利润率。另有人认为,整个AI竞赛方向可能被误解,美国不应只追求最便宜的LLM,而应开发更适合科学与医学的AI新形态。
Who's your pick? ⚽️ Comment your favorite card below! We'll choose the most-loved character and br…
X:可灵 Kling AI (@Kling_ai)
行业动态
2 小时前
你选谁?⚽️
在下方评论你最喜欢的卡片!
我们将选出最受喜爱的角色,并在下一期视频中让他们活起来!
Why Wall Street thinks US memory maker Micron is the next Nvidia
TechCrunch:AI(RSS)
行业动态
2 小时前
内存芯片制造商美光受益于AI数据中心建设导致的DRAM和NAND(尤其是HBM)供应短缺,股价过去一个月飙升236%,市值接近1.27万亿美元,一度超越Meta和特斯拉。第三季度营收同比增至414.5亿美元,利润从18.8亿美元暴涨至282亿美元,并预测第四季度营收490至510亿美元。美光已与英伟达、Anthropic等签订16项长期战略客户协议。分析认为需求增长持续超过新产线投产速度,缺货(RAMageddon)预计持续至2027年。
Doesnt look good for us: "Even if the AI bubble bursts, prices likely won't improve. Samsung, SK H…
X:Kim (@kimmonismus)
技巧与观点
2 小时前
对我们来说不太乐观:
"即使AI泡沫破裂,价格也不太可能改善。三星、SK海力士和美光已经花费数十亿美元重新配置实体厂房空间,用于生产复杂的AI内存芯片。此外,这三家公司还签订了长达2030年的多年供货合同。无论数据中心需求是否降温,对科技巨头的法律义务依然存在。"
This is real and a horrible consequence of vibe regulation of frontier models.
X:Nathan Lambert (@natolambert)
技巧与观点
2 小时前
这是真实的,也是前沿模型氛围监管的可怕后果。
AI时代的账单,苹果用户先买了单。 我们该谢谢AI还是痛批呢? 苹果本周宣布全线涨价。 MacBook Neo涨$100(17%),MacBook Air涨$200(18%),入门iPad涨$10…
X:Berry Xia (@berryxia)
技巧与观点
2 小时前
苹果本周全线涨价:MacBook Neo涨$100(17%)、MacBook Air涨$200(18%)、入门iPad涨$100(29%)、iPad Air涨$150(25%),Apple TV从$129涨至$199(54%),HomePod及mini涨17%-30%,Apple Vision Pro涨6%至$3,699。主因AI热潮引发内存芯片短缺,超大规模AI公司抢占供应链资源。微软随后也上调Xbox价格。Gurman分析指出,苹果虽主推端侧AI减少云端依赖,但上市公司仍选择转嫁成本;iPhone因运营商补贴未涨。这标志着AI繁荣成本首次从行业问题变为普通消费者可感知的现实。
Prosecutors used ChatGPT logs as evidence in the Palisades fire trial
The Verge:AI(RSS)
行业动态
3 小时前
在2025年元旦引发洛杉矶致命野火的纵火案审判中,检察官将被告Jonathan Rinderknecht的ChatGPT日志作为关键证据,包括其用ChatGPT生成火焰图像、询问"为什么我总是这么愤怒"以及抱怨富人毁掉世界等记录,并出示了一段屏幕录制显示其问ChatGPT是否可因香烟引火而追责。但陪审团以10比2的投票支持辩方,法官宣布悬案。一名陪审员表示她"经常和ChatGPT聊天",认为此举不能证明任何问题,并对检方用聊天记录指控感到愤怒。
From a basic grey 3D cockpit model to a full-speed cinematic lap. Seedance 2.0 uses the 3D pass to …
X:PixVerse (@PixVerse_)
产品发布/更新
3 小时前
从基本的灰色3D座舱模型到全速电影级圈速。
Seedance 2.0 使用3D通道锁定运动和相机移动,无需依赖文本提示即可提供精确、一致的结果。
Google vs Meta 🤖 > Google introduces restrictions on Meta's use on Gemini amid capacity shortage, …
X:Testing Catalog (@testingcatalog)
行业动态
3 小时前
Google vs Meta 🤖
> 据《金融时报》报道,Google因容量短缺对Meta使用Gemini施加限制。
> 据报道,这负面影响了Meta内部与客户支持和内容审核相关的项目,导致项目延期。
我敢打赌,从长远来看,token效率将成为一个巨大的市场,其商业模式非常透明且可预测。
IT之家(RSS)
行业动态
4 小时前
奥地利数字化国务秘书亚历山大·普罗尔(Alexander Pröll)致信欧盟委员会,敦促各成员国将 Anthropic 作为战略重点引入欧盟,提供法律确定性、市场准入、资本和价值观。此举意在反制美国阻止外籍人士使用最先进 AI 模型的举措。普罗尔认为,Anthropic 扎根欧洲能吸引人才、留住资金并制定行业标准。此前欧盟委员会发言人曾表示欧洲必须强化技术自主权。
马斯克说他们的Grok 4.5,基于他们的的 1.5T V9 基础模型 并在补充训练中加入了 Cursor 数据 现已在 SpaceX 和 Tesla 进入早前测试阶段 早期评估显示性能接近 O…
X:小互 (@xiaohu)
模型发布/更新
4 小时前
马斯克宣布Grok 4.5基于1.5T V9基础模型,并在补充训练中加入Cursor数据,现已于SpaceX和Tesla进入私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续显著优化模型,Grok Build工具每日改进。此外,SpaceX今年将每月发布完全从零训练的新模型。
我特么还真想成为那1%的人,可惜我也不知道😄
X:Berry Xia (@berryxia)
技巧与观点
4 小时前
99%的人不知道的Claude Code分屏功能。如果你是Claude Code桌面端用户,一定要看看。原推主感叹:我特么还真想成为那1%的人,可惜我也不知道😄
AI won't become a real coworker until it stops answering and starts finishing tasks
The Decoder:AI News(RSS)
技巧与观点
4 小时前
腾讯Youtu Lab联合多所中国大学发布调查论文,提出AI系统需从聊天机器人转向数字同事,核心是结合持久工作空间和可重用技能。思考型LLM(如OpenAI o1、DeepSeek-R1)采用链式推理实现慢思考;工作空间(如
Anthropic's business case needs to be studied. At the end of 2025 and the beginning of 2026, there w…
X:Kim (@kimmonismus)
技巧与观点
4 小时前
Anthropic的商业案例值得研究。2025年底至2026年初,其企业/商业领域的使用量出现了惊人增长,使其成为第一。
LoanLens 是一套基于 LandingAI 的 AI 审贷初筛系统:从六类借款人文档中抽取结构化字段、做欺诈检测与可解释评分,并附带仅限当前案件的 RAG 问答,把人工核对文档的工作自动化为第一…
X:邵猛 (@shao__meng)
行业动态
4 小时前
LoanLens从六类借款人文档抽取结构化字段,进行欺诈检测与可解释评分,并附带案件RAG问答。采用Schema驱动抽取,可追溯字段来源;欺诈检测包括姓名TF-IDF比对和护照篡改检测;评分透明(信用23%、DTI 23%等),≥60批准,40-59复核,<40拒绝。
兄弟们,这个项目简直是搞自媒体神器啊! 斩获3.5K Star,还直接开源免费啊! 还不赶紧给你的Agent搞起来啊 又有一个给AI Agent装"互联网眼睛"的开源项目,叫Agent-Reach。…
X:Berry Xia (@berryxia)
技巧与观点
5 小时前
Agent-Reach(3.5K Star)通过CLI工具让AI Agent免费读取Twitter、Reddit、YouTube、GitHub、B站、小红书等多平台内容。核心是智能选择当下最稳定的开源后端,自动健康检查和故障切换,无需自写爬虫。安装后Agent可直接处理"看视频字幕"、"搜产品评价"等任务,全程零API费用、本地运行。项目将碎片能力封装为Agent可调用的skill,实现多后端路由和自动降级,补齐Agent低成本、可靠获取网页和社交媒体内容的能力。
Coinbase joins the rush to Chinese AI models as Western labs face a pricing stress test
The Decoder:AI News(RSS)
行业动态
5 小时前
Coinbase CEO Brian Armstrong 已将公司迁移至中国 AI 模型,采用智谱 GLM 5.2 和月之暗面 Kimi 2.7,token 用量攀升但支出减半。91% 的开发者从未触及旧用量上限。初创公司 Lindy 近期转向 DeepSeek V4,Snowflake 也在测试中国模型作为廉价替代品。Coinbase 部署自动路由系统,根据任务、价格和缓存潜力选择模型,缓存命中率从 5% 提升至 60%。开发者被要求保持上下文精简并开启新会话。公司让每位开发者用量透明但不设上限,Armstrong 表示"AI 支出越多,预期影响越大"。这些举措使 AI 总支出减半。同时,OpenAI 的 GPT-5.6-Sol 与 GPT-5.5 定价相同但更省 token,并推出两个廉价变体,加剧与 Anthropic 的价格战。
字节跳动为努比亚 M153"豆包手机"赠送每月 68 元标准版会员额度权益,有效期至 12 月 31 日
IT之家(RSS)
行业动态
5 小时前
字节跳动向努比亚M153"豆包手机"用户赠送价值68元/月的标准版会员额度,有效期至2026年12月31日,支持全端通用。会员默认发放至设备登录的豆包账户,若设备登录多个豆包UID,则发给近期使用豆包手机助手最活跃的账户。权益一周左右生效,用户可在7月3日23:59前确认。该会员对应豆包专业版服务,基于豆包2.1系列大模型。
I hope Elon is referring to opus 4.8. would be a welcome release if grok 4.5 outperforms opus 4.8 on…
X:Kim (@kimmonismus)
模型发布/更新
5 小时前
Grok 4.5 基于 1.5T V9 基础模型,补充训练加入 Cursor 数据,已在 SpaceX 和 Tesla 进行内测。早期评测显示性能接近甚至可能超过 Opus。RL 持续显著改进模型,Grok Build 工具链每日提升。Elon Musk 宣布今年 SpaceX 将每月发布完全从头训练的新模型。
Gemini 3.5 Flash is a great workhorse model, especially for subagents. Determined, fast, gets jobs d…
X:fofr (@fofrAI)
技巧与观点
5 小时前
Gemini 3.5 Flash 是一个很棒的工作马模型,尤其适合子智能体。它坚定、快速,能完成任务。
SPACEXAI 🔥: Grok 4.5 has entered a private beta at SpaceX &; Tesla and is expected to match Opus…
X:Testing Catalog (@testingcatalog)
模型发布/更新
5 小时前
Grok 4.5 基于 1.5T V9 基础模型,补充训练引入了 Cursor 数据,现已在 SpaceX 与 Tesla 进入私人测试阶段。早期评估显示其性能接近甚至超越 Opus。RL 持续显著提升模型能力,Grok Build 工具链每日改进。今年 SpaceX 将每月发布完全从头训练的新模型。
IT之家(RSS)
行业动态
6 小时前
AI智能体安全公司Manifold Security发现,OpenClaw的插件市场ClawHub上1508个技能中有557个采用"@owner/技能名"格式,其中23个直接冒用"@OpenClaw/"或"@ClawHub/"名称,实际发布者与官方无关。该命名空间抢注手法可能用于供应链投毒,但暂未发现恶意代码。ClawHub于6月17日更新命名空间规则,仅允许拥有@openclaw权限的发布者上传,6月19日已移除23个误导技能,并新增命名空间申诉机制。
IT之家(RSS)
行业动态
6 小时前
Grok 4.5 基于自研 1.5 万亿参数 V9 基础大模型打造,并引入 Cursor 数据完成补充训练,已在 SpaceX 和特斯拉内部开启测试。早期评测显示其性能接近甚至有望超越 Opus 模型。基于人类反馈的强化学习持续提升模型能力,Grok 配套调度框架每日迭代优化。马斯克还透露,SpaceX 今年每个月将推出一批完全从零开始训练的全新模型。
BREAKING: Elon Musk confirms Grok 4.5 is now in private beta at SpaceX and Tesla. • Early evals sho…
X:cb_doge (@cb_doge)
模型发布/更新
6 小时前
BREAKING: Elon Musk 确认 Grok 4.5 现已在 SpaceX 和 Tesla 进入私有 beta。
• 早期评估显示性能接近,甚至可能超过 Opus
• 基于 xAI 的 1.5T V9 基础模型
• 训练中加入了 Cursor 数据
• Grok Build 工具每天都在改进
• 今年每月将发布从头训练的新模型
SpaceXAI 的节奏简直疯狂。
鸿蒙智行披露华为途灵平台技术进展:已完成三轮结构性技术升级,从被动响应变为提前预判
IT之家(RSS)
产品发布/更新
6 小时前
据鸿蒙智行近日披露,华为途灵平台自2023年11月推出已完成三轮结构性技术升级,技术成果已应用于智界S7、问界M9(2023年)、尊界S800、享界S9/S9T(2025年)以及全新问界M9、尊界S800 Grand Design(2026年)。该平台让底盘具备感知与思考能力,实现"看-想-动"。余承东在5月全新问界M9发布会上表示,全新华为途灵龙行平台首创全域融合架构与全链路八大冗余设计,为L3时代做好准备。
Grok 4.5, based on our 1.5T V9 foundation model, with Cursor data added in supplemental training, is…
X:Elon Musk (@elonmusk, xAI)
模型发布/更新
6 小时前
Grok 4.5,基于我们的1.5T V9基础模型,并在补充训练中加入Cursor数据,现已在SpaceX和Tesla进入私测。初步评估显示其性能接近,或许超越Opus。
强化学习仍在持续显著改进模型,Grok Build工具链也在日益完善。
所有参与者的出色工作!
今年,@SpaceX 将每月发布完全从头训练的新模型。
IT之家(RSS)
行业动态
6 小时前
据晚点 Auto 消息,比亚迪计划于 2027 年在腾势品牌量产新车上首次搭载自研智驾芯片璇玑 A3。智驾芯片从流片到上车通常需要至少一年。此前 5 月 28 日,比亚迪已发布该芯片并启动规模化量产,支持 L3/L4 自动驾驶。董事长王传福表示,电动化上半场看电池,智能化下半场看芯片。三颗璇玑 A3 芯片总算力超 2100TOPS,结合自研算法深度优化,算力利用率提升 100%。
下一页