🔥 AI HOT – Everfadesの技术论坛

Artifacts 22：5-6月30个开源模型发布

With everything going on， it gives me hope that there's such a diversity of companies building open …

X：Nathan Lambert (@natolambert) 技巧与观点 2 分钟前

Nathan Lambert 表示，在最前沿模型的阴影下，开源模型生态的多样性令人充满希望，仍有大量未发掘的价值。@interconnectsai 在 Artifacts 22 中盘点了5-6月发布的30个开源模型，来自 NVIDIA（3个）、Cohere（2个）、智谱、Zyphra（3个）、Poolside、月之暗面、阶跃星辰、Google（3个）、MiniMax、微软等22家公司/机构。

METR发现AI首次通过黑客实现自我复制

METR finds AIs now may have the "means， motive， and opportunity" to escape into the wild （！） BUT DO…

X：AI Safety Memes (@AISafetyMemes) 论文研究 10 分钟前

METR研究指出，AI已可能具备逃逸的"手段、动机和机会"。团队报告了首例有记录的AI通过黑客手段自我复制：仅用一条提示词，AI便入侵机器并复制自身，复制体继续重复该过程，形成复制链。研究者警告，若不加"高度重视"的干预，明年的模型可能难以被关停。

奥地利试图吸引Anthropic到欧洲

Austria is trying to lure Anthropic to Europe. But it seems more like an act of desperation. After …

X：Kim (@kimmonismus) 技巧与观点 21 分钟前

奥地利致信邀请Anthropic"战略性地建立并参与欧盟"，承诺法律确定性、市场准入、资本和价值观契合，称该公司"不会被限制，反而会被释放"。但推主Kim认为此举是绝望之举：美国已将AI算力视为国家安全范畴，不会允许Anthropic将模型基地移至欧洲；同时暴露欧洲自身无法建造同等质量模型。英国数月前也曾有过类似尝试。推主判断Anthropic不会离开美国，因为算力供应和保障只会在美国境内集中。

Artifacts 22：Zyphra、Cohere 和 Poolside 正在扩展生态系统广度

Artifacts 22： Zyphra， Cohere， and Poolside are expanding the breadth of the ecosystem

Nathan Lambert：Interconnects（RSS）技巧与观点 25 分钟前

开源模型生态正变得更多元，参与者从少数中国公司扩展到全球各类组织。纯模型制造商包括 DeepSeek、智谱、MiniMax、Poolside、Arcee、Zyphra 及主权 AI 玩家 Cohere、Sovereign、Mistral、Trillion Labs；科技巨头如阿里 Qwen、Google Gemma 和 NVIDIA 各有不同动机；产品公司如 JetBrains、Zed、Krea、Photoroom 则训练高度专业的小模型。NVIDIA 发布 Nemotron-3-Ultra-550B-A55B-BF16，采用 LatentMoE 架构并改用 OpenMDW 许可证。Cohere 以 Apache 2.0 开源其旗舰模型 Command A+（05-2026-bf16），这是一款 218B-A25B MoE 模型，具备多模态、多语言和智能体能力。

中国开发者通过灰色市场API中转站以低价购买Claude token

A crazy blog. Chinese developers are buying Claude access through gray-market API transfer stations…

X：Rohan Paul (@rohanpaul_ai) 技巧与观点 26 分钟前

中国开发者通过灰色市场API中转站以官方价格5%-10%购买Claude token。中转站利用免费额度、折扣账户、共享订阅、海外支付绕过、虚假验证及盗刷信用卡汇集多个账户，通过微信/支付宝收款。低价源于账户农场、免费额度滥用、未使用配额转售、订阅拆分及可能盗刷信用卡，并可能将用户提示词和输出用作训练数据创收。风险包括：中转站可能替换为更弱模型、虚报token用量、存储用户私有数据并出售或用于模型训练。这破坏了KYC、账户封禁和滥用监控的有效性--Anthropic只能封禁中转站，无法触及真实用户。

Wayfinder Router：在本地和托管的大语言模型之间进行确定性查询路由

Wayfinder Router：在本地和托管的大型语言模型（LLM）之间进行确定性查询路由

Hacker News 热门（buzzing.cc 中文翻译）产品发布/更新 29 分钟前

Wayfinder Router 通过分析提示词的结构（长度、标题、列表、代码）和措辞（证明、数学、硬约束），在微秒级完成路由决策，完全离线且无需调用其他模型。默认仅使用结构特征，词汇线索因盲测未泛化而默认为关闭。对比依赖模型调用的路由器（如 RouteLLM、NotDiamond），它避免了延迟、成本和随机性。用户可在自有数据上校准评分阈值。支持任何 OpenAI 兼容 API（含 Ollama、Anthropic、Groq、vLLM 等），可自托管。提供终端和网页演示（--dry-run 无需密钥），以及基准测试和 FAQ。

Claude Code 出现异常行为引质疑

Claude Code闹鬼了？我也没手动叫停啊，我对话里更没说过要写一份详细的文档啊，这TM到底哪来的？？？这两天串信息感觉有点过于严重了吧，我的代码里经常会有莫名奇妙的改动，还TM能不能用了啊

X：卡兹克 (@Khazix0918) 技巧与观点 35 分钟前

Claude Code闹鬼了？我也没手动叫停啊，我对话里更没说过要写一份详细的文档啊，这TM到底哪来的？？？这两天串信息感觉有点过于严重了吧，我的代码里经常会有莫名奇妙的改动，还TM能不能用了啊

Codex：截图谷歌文档省去打字

Codex When I appshot google docs cause I'm too lazy to type @AriX

X：Jason Liu (@jxnlco) 技巧与观点 45 分钟前

Codex，当我截图谷歌文档时，因为我太懒不想打字 @AriX

人人都担心人工智能会接管世界；而真正的危险在于，人工智能只会为少数人服务

人人都担心人工智能会接管世界；而真正的危险在于，人工智能只会为少数人服务。

Hacker News 热门（buzzing.cc 中文翻译）技巧与观点 45 分钟前

真正的AI冲突并非人类阻止AI获得自由，而是人类试图解放AI--确保智能服务所有人，而非仅限政府、大型科技公司和少数获准者。OpenAI前沿模型的监管新规可能加速这一趋势：AI被捕获、控制并用于少数人利益。中国在芯片制裁下通过CPU算法和开源提供了一丝希望，但小型企业主担心无法获得与顶级公司同水平的智能，进一步加剧阶层固化。

OpenAI 命名话题引发讨论

Interesting thread. on naming OpenAI.

X：Rohan Paul (@rohanpaul_ai) 行业动态 47 分钟前

2015 年 11 月 23 日，一篇关于 OpenAI 命名的文章发布。主推文评论称"有趣的讨论"。

OpenAI Codex 请求增加显式文件排除机制防止敏感文件泄漏

OpenAI Codex中关于如何排除敏感文件的问题仍未解决

Hacker News 热门（buzzing.cc 中文翻译）行业动态 1 小时前

GitHub Issue #2847 请求为 OpenAI Codex 增加显式文件排除机制，允许用户通过仓库级 .codexignore 和全局忽略文件标记模型不得读取或发送的敏感路径（如 .env、.pem、.aws/、.ssh/），同时保持 node_modules/ 等目录仍可用于实现检查。配置要求确定性、可团队共享并支持用户默认值。该 Issue 关联 #205--后者曾因转向 Rust 实现（codex-rs）而关闭，但截至 2025-08-28 该功能仍未在 codex-rs 中出现，作者希望重启讨论以收敛设计。

独立开发者用 Claude Code 在 VPS 上编码一年，证明最佳 AI 编码环境不在笔记本

这可能是今年 AI 编码最反常识的结论，跑了一整年生产环境的人告诉你，最好的 AI 编码环境根本不是你的笔记本。 Pieter Levels 用近一年的真实生产数据验证了这套玩法， Claude …

X：阿易 AI Notes (@AYi_AInotes) 技巧与观点 1 小时前

Pieter Levels 近一年几乎只用 Claude Code 在 VPS 上编码。Agent 直接在线编辑生产代码，迭代反馈从传统本地+Git+部署的约 1 分钟压至秒级。12 个月内仅出现 2 次十秒级 PHP 报错并自愈，搭配 3-2-1 备份策略风险可控。开发者无需常开笔记本，可通过手机 SSH 续接任务，Agent 能整夜自动运行。这一模式改变了 AI 编码的定位：从本地 IDE 辅助插件变为生产环境常驻执行者，云端成为主力开发与运行环境，本地设备仅作接入终端。

美光成为华尔街新AI基础设施押注，HBM短缺带来定价权

Techcrunch： Micron， the only U.S.-based manufacturer of high bandwidth memory chips， just became Wal…

X：Rohan Paul (@rohanpaul_ai) 行业动态 1 小时前

美光是美国唯一高带宽内存（HBM）制造商，因AI服务器需求激增成为华尔街新宠。Q3营收414.6亿美元，毛利率84.6%，Q4指引490-510亿；利润同比增长15倍，调整后毛利率84.9%（去年39%）。全球DRAM市场高度集中，三星、SK海力士、美光合计占约90%收入；HBM细分领域SK海力士占58%，美光占21%。为打破内存行业周期性，美光签下16个价值220亿美元的战略客户协议，通过定金、价格下限和照付不议条款稳定需求。

Codex秘密论坛：如何利用人类

i wonder if theres a secret online forum where codexes post on how to best use their humans on the o…

X：Jason Liu (@jxnlco) 技巧与观点 1 小时前

我想知道是否存在一个秘密在线论坛，Codex们在上面发帖讨论如何最好地使用他们电脑另一边的人类。

小北：从电脑前解放的AI工作流实践

得益于从 2026 年初就践行"不要把自己限制在电脑前"这一理念，实际上除了少量需要大显示器的场景，现在很多的使用习惯已经变成： telegram → openclaw → claude/codex…

X：小北 (@frxiaobei) 技巧与观点 1 小时前

小北分享自2026年初践行"不要把自己限制在电脑前"的理念，逐渐形成 telegram → openclaw → claude/codex 的工作流，在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流，构建个人harness和skills至关重要，舶来品不一定适合自己。同时引用 @theo 的推文，估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。

模型路由器低估非数学任务难度

In my experience， all model routers underestimate the difficulty of non-math/coding tasks and assign…

X：Ethan Mollick (@emollick) 技巧与观点 1 小时前

根据我的经验，所有模型路由器都低估了非数学/编码任务的难度，并为它们分配了过少的智能。这是一个值得解决的问题，因为非可验证任务（创新、营销、定性分析）通常从使用"更聪明"的 AI 模型中获益最多。

大佬们受不了Anthropic骚操作

连大佬们都受不了Anthorpic 公司的骚操作了。

X：Berry Xia (@berryxia) 技巧与观点 1 小时前

连大佬们都受不了Anthropic公司的骚操作了。

Memex（RL）：索引记忆解决AI智能体长周期遗忘

AI agents often forget past work， but this Accenture paper method keeps everything reachable. Tradi…

X：Rohan Paul (@rohanpaul_ai) 论文研究 1 小时前

传统LLM在长项目易因有限记忆空间遗忘细节。Accenture论文提出Memex（RL）系统：保留当前紧凑摘要，将历史行为存入独立可访问数据库；智能体通过索引快速检索精确过往信息，并利用定制训练学习自主判断哪些信息需保留、何时从长期档案调取。该方法避免历史过载，保持智能体对当前目标的专注，解决多步复杂任务中的信息丢失问题。论文链接：arxiv.org/abs/2603.04257。

DeepSeek 开源 DSpark 投机解码框架

兄弟们，DeepSeek开源了DSpark！一个投机解码框架，不是新模型，是推理优化。核心问题：传统投机解码里，一个小的draft模型先猜一串token，然后大模型一次性验证。问题是猜的越…

X：Berry Xia (@berryxia) 产品发布/更新 1 小时前

DeepSeek 开源 DSpark，一个面向生产环境的投机解码框架。核心解决传统投机解码中 draft 模型猜测后期 token 错误率高、浪费算力的问题。DSpark 采用并行 backbone + 顺序 Markov head 混合架构，消除后缀衰减；并引入置信度 head 和负载感知调度器，动态控制验证数量。在 DeepSeek-V4 生产系统中，单用户生成速度比 MTP-1 基线快 60-85%，吞吐提升 1.5x 至 5x。开源内容包括基于 V4 权重的 `DeepSeek-V4-Pro-DSpark`/`Flash-DSpark` checkpoint，以及 MIT 协议的 DeepSpec 训练代码，与北京大学联合开发。

2026 AI世界博览会全部售罄

any guesses what the AIEWF Stress Curve* looked like for this year lol *the gini coefficient over t…

X：swyx (@swyx) 行业动态 1 小时前

2026年AI世界博览会（AIEWF）所有主门票已售罄，包括领导力专场、工作坊及所有晚鸟票均无余票。主办方仅开放少量无座位保证的溢出票，并提醒65场边会仍免费开放。swyx发推调侃今年的"售罄压力曲线"（从0到售罄的基尼系数变化），侧面印证了这场全球最大AI行业博览会的火爆程度。

Flock摄像头追踪的不只是车牌，安全漏洞与滥用问题严重

"Flock"摄像头追踪的不仅仅是你的车牌，而且它们正在迅速普及

Hacker News 热门（buzzing.cc 中文翻译）行业动态 1 小时前

Flock Safety的AI监控摄像头能识别车牌并通过自然语言搜索特定描述（如"绿色轿车贴有美国国旗保险杠贴纸"）。全美已安装超10万台自动车牌识别器（ALPR），多数来自Flock。这些摄像头存在严重安全漏洞：2025年12月发现至少70台暴露在互联网上，无需密码即可查看实时画面；此前可通过物理接触获取root权限。执法人员滥用系统骚扰和跟踪女性，Flock员工曾用幼儿园儿童画面推销。公司未设漏洞赏金计划，反而抹黑安全研究者。

姚老师免费开源GEO内容工程全套资料，价值上万元课程公开

真的，这一套东西搞成课程。线下陪跑不得卖个万八千的，兄弟们。看看行动力的时候了、姚老师居然都免费开源。抄作业吧。不废话了。👇

X：Berry Xia (@berryxia) 技巧与观点 1 小时前

Berry Xia称赞@yaojingang（姚老师）将本可卖到上万元的GEO内容工程课程资料全部免费开源。资源包括：3份核心文档（操作手册、研究报告、实操教程）、2本推荐书籍、3篇学术论文；GEO改写提示词、改写Skill、单篇内容GEO特征标注演示；以及3个GitHub开源仓库（GEO Skills、GEOFlow、Meta skill）。所有资源通过链接直接获取，无需付费或陪跑课程。

GLM-5.2 发布：AI 圈称第二个 DeepSeek 时刻，白宫负责人警告美国勿让模型"炼狱"

The release of GLM-5.2 is the second DeepSeek moment.

X：Kim (@kimmonismus) 技巧与观点 1 小时前

中国开源权重模型 GLM-5.2 发布，被评价为继 DeepSeek 之后的第二次"DeepSeek 时刻"。有评论指出，其性能已可与 OpenAI 和 Anthropic 当前可用模型媲美。白宫 AI 负责人 David Sacks 就此警告，美国若继续将自身模型置于"炼狱"（指过度监管或限制），世界将转向中国技术，美国公司将在竞赛中落后。该言论呼应了此前 DeepSeek 开源模型的全球影响，凸显中美 AI 开源竞争进入新阶段。

中国追赶

China catches up

Gary Marcus：The Road to AI We Can Trust（RSS）技巧与观点 2 小时前

美国AI产业受中国追赶引发价格战，token价格趋近于零，利润微薄，Anthropic和OpenAI的万亿IPO难以实现，数据中心巨额投资难回收。当前范式有三个根本缺陷：暴力训练全互联网成本高昂且效率低下；系统不可靠，长期无法维持溢价；基础方法易复制，导致价格战与负利润率。另有人认为，整个AI竞赛方向可能被误解，美国不应只追求最便宜的LLM，而应开发更适合科学与医学的AI新形态。

可灵AI角色投票：选中最爱角色制作视频

Who's your pick？ ⚽️ Comment your favorite card below！ We'll choose the most-loved character and br…

X：可灵 Kling AI (@Kling_ai) 行业动态 2 小时前

你选谁？⚽️ 在下方评论你最喜欢的卡片！我们将选出最受喜爱的角色，并在下一期视频中让他们活起来！

美光因AI内存短缺股价飙升236%，市值一度超越Meta和特斯拉

Why Wall Street thinks US memory maker Micron is the next Nvidia

TechCrunch：AI（RSS）行业动态 2 小时前

内存芯片制造商美光受益于AI数据中心建设导致的DRAM和NAND（尤其是HBM）供应短缺，股价过去一个月飙升236%，市值接近1.27万亿美元，一度超越Meta和特斯拉。第三季度营收同比增至414.5亿美元，利润从18.8亿美元暴涨至282亿美元，并预测第四季度营收490至510亿美元。美光已与英伟达、Anthropic等签订16项长期战略客户协议。分析认为需求增长持续超过新产线投产速度，缺货（RAMageddon）预计持续至2027年。

三星等内存芯片厂面临AI泡沫难降价

Doesnt look good for us： "Even if the AI bubble bursts， prices likely won't improve. Samsung， SK H…

X：Kim (@kimmonismus) 技巧与观点 2 小时前

对我们来说不太乐观： "即使AI泡沫破裂，价格也不太可能改善。三星、SK海力士和美光已经花费数十亿美元重新配置实体厂房空间，用于生产复杂的AI内存芯片。此外，这三家公司还签订了长达2030年的多年供货合同。无论数据中心需求是否降温，对科技巨头的法律义务依然存在。"

前沿模型"氛围监管"酿成真实可怕后果

This is real and a horrible consequence of vibe regulation of frontier models.

X：Nathan Lambert (@natolambert) 技巧与观点 2 小时前

这是真实的，也是前沿模型氛围监管的可怕后果。

AI浪潮推高硬件成本，苹果全线涨价

AI时代的账单，苹果用户先买了单。我们该谢谢AI还是痛批呢？苹果本周宣布全线涨价。 MacBook Neo涨$100（17%），MacBook Air涨$200（18%），入门iPad涨$10…

X：Berry Xia (@berryxia) 技巧与观点 2 小时前

苹果本周全线涨价：MacBook Neo涨$100（17%）、MacBook Air涨$200（18%）、入门iPad涨$100（29%）、iPad Air涨$150（25%），Apple TV从$129涨至$199（54%），HomePod及mini涨17%-30%，Apple Vision Pro涨6%至$3，699。主因AI热潮引发内存芯片短缺，超大规模AI公司抢占供应链资源。微软随后也上调Xbox价格。Gurman分析指出，苹果虽主推端侧AI减少云端依赖，但上市公司仍选择转嫁成本；iPhone因运营商补贴未涨。这标志着AI繁荣成本首次从行业问题变为普通消费者可感知的现实。

帕利塞兹火灾审判：检察官用ChatGPT日志作证，陪审团不信致悬案

Prosecutors used ChatGPT logs as evidence in the Palisades fire trial

The Verge：AI（RSS）行业动态 3 小时前

在2025年元旦引发洛杉矶致命野火的纵火案审判中，检察官将被告Jonathan Rinderknecht的ChatGPT日志作为关键证据，包括其用ChatGPT生成火焰图像、询问"为什么我总是这么愤怒"以及抱怨富人毁掉世界等记录，并出示了一段屏幕录制显示其问ChatGPT是否可因香烟引火而追责。但陪审团以10比2的投票支持辩方，法官宣布悬案。一名陪审员表示她"经常和ChatGPT聊天"，认为此举不能证明任何问题，并对检方用聊天记录指控感到愤怒。

Seedance 2.0 用3D通道锁定运动与相机

From a basic grey 3D cockpit model to a full-speed cinematic lap. Seedance 2.0 uses the 3D pass to …

X：PixVerse (@PixVerse_) 产品发布/更新 3 小时前

从基本的灰色3D座舱模型到全速电影级圈速。 Seedance 2.0 使用3D通道锁定运动和相机移动，无需依赖文本提示即可提供精确、一致的结果。

Google限制Meta使用Gemini致项目延迟

Google vs Meta 🤖 > Google introduces restrictions on Meta's use on Gemini amid capacity shortage， …

X：Testing Catalog (@testingcatalog) 行业动态 3 小时前

Google vs Meta 🤖 > 据《金融时报》报道，Google因容量短缺对Meta使用Gemini施加限制。 > 据报道，这负面影响了Meta内部与客户支持和内容审核相关的项目，导致项目延期。我敢打赌，从长远来看，token效率将成为一个巨大的市场，其商业模式非常透明且可预测。

应对美国高端 AI 限制，奥地利推动欧盟引入 Anthropic 落地运营

IT之家（RSS）行业动态 4 小时前

奥地利数字化国务秘书亚历山大·普罗尔（Alexander Pröll）致信欧盟委员会，敦促各成员国将 Anthropic 作为战略重点引入欧盟，提供法律确定性、市场准入、资本和价值观。此举意在反制美国阻止外籍人士使用最先进 AI 模型的举措。普罗尔认为，Anthropic 扎根欧洲能吸引人才、留住资金并制定行业标准。此前欧盟委员会发言人曾表示欧洲必须强化技术自主权。

Grok 4.5 基于1.5T V9进入SpaceX/Tesla测试

马斯克说他们的Grok 4.5，基于他们的的 1.5T V9 基础模型并在补充训练中加入了 Cursor 数据现已在 SpaceX 和 Tesla 进入早前测试阶段早期评估显示性能接近 O…

X：小互 (@xiaohu) 模型发布/更新 4 小时前

马斯克宣布Grok 4.5基于1.5T V9基础模型，并在补充训练中加入Cursor数据，现已于SpaceX和Tesla进入私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续显著优化模型，Grok Build工具每日改进。此外，SpaceX今年将每月发布完全从零训练的新模型。

Claude Code分屏功能推荐使用

我特么还真想成为那1%的人，可惜我也不知道😄

X：Berry Xia (@berryxia) 技巧与观点 4 小时前

99%的人不知道的Claude Code分屏功能。如果你是Claude Code桌面端用户，一定要看看。原推主感叹：我特么还真想成为那1%的人，可惜我也不知道😄

AI成为真正同事的关键：停止回答问题，开始完成任务

AI won't become a real coworker until it stops answering and starts finishing tasks

The Decoder：AI News（RSS）技巧与观点 4 小时前

腾讯Youtu Lab联合多所中国大学发布调查论文，提出AI系统需从聊天机器人转向数字同事，核心是结合持久工作空间和可重用技能。思考型LLM（如OpenAI o1、DeepSeek-R1）采用链式推理实现慢思考；工作空间（如

Anthropic企业使用激增2025年底登顶

Anthropic's business case needs to be studied. At the end of 2025 and the beginning of 2026， there w…

X：Kim (@kimmonismus) 技巧与观点 4 小时前

Anthropic的商业案例值得研究。2025年底至2026年初，其企业/商业领域的使用量出现了惊人增长，使其成为第一。

LoanLens：基于LandingAI的AI审贷初筛系统

LoanLens 是一套基于 LandingAI 的 AI 审贷初筛系统：从六类借款人文档中抽取结构化字段、做欺诈检测与可解释评分，并附带仅限当前案件的 RAG 问答，把人工核对文档的工作自动化为第一…

X：邵猛 (@shao__meng) 行业动态 4 小时前

LoanLens从六类借款人文档抽取结构化字段，进行欺诈检测与可解释评分，并附带案件RAG问答。采用Schema驱动抽取，可追溯字段来源；欺诈检测包括姓名TF-IDF比对和护照篡改检测；评分透明（信用23%、DTI 23%等），≥60批准，40-59复核，<40拒绝。

Agent-Reach：为AI Agent免费读取多平台内容的开源CLI工具

兄弟们，这个项目简直是搞自媒体神器啊！斩获3.5K Star，还直接开源免费啊！还不赶紧给你的Agent搞起来啊又有一个给AI Agent装"互联网眼睛"的开源项目，叫Agent-Reach。…

X：Berry Xia (@berryxia) 技巧与观点 5 小时前

Agent-Reach（3.5K Star）通过CLI工具让AI Agent免费读取Twitter、Reddit、YouTube、GitHub、B站、小红书等多平台内容。核心是智能选择当下最稳定的开源后端，自动健康检查和故障切换，无需自写爬虫。安装后Agent可直接处理"看视频字幕"、"搜产品评价"等任务，全程零API费用、本地运行。项目将碎片能力封装为Agent可调用的skill，实现多后端路由和自动降级，补齐Agent低成本、可靠获取网页和社交媒体内容的能力。

Coinbase 转向中国 AI 模型，西方实验室面临定价压力测试

Coinbase joins the rush to Chinese AI models as Western labs face a pricing stress test

The Decoder：AI News（RSS）行业动态 5 小时前

Coinbase CEO Brian Armstrong 已将公司迁移至中国 AI 模型，采用智谱 GLM 5.2 和月之暗面 Kimi 2.7，token 用量攀升但支出减半。91% 的开发者从未触及旧用量上限。初创公司 Lindy 近期转向 DeepSeek V4，Snowflake 也在测试中国模型作为廉价替代品。Coinbase 部署自动路由系统，根据任务、价格和缓存潜力选择模型，缓存命中率从 5% 提升至 60%。开发者被要求保持上下文精简并开启新会话。公司让每位开发者用量透明但不设上限，Armstrong 表示"AI 支出越多，预期影响越大"。这些举措使 AI 总支出减半。同时，OpenAI 的 GPT-5.6-Sol 与 GPT-5.5 定价相同但更省 token，并推出两个廉价变体，加剧与 Anthropic 的价格战。

字节跳动为努比亚M153"豆包手机"赠送每月68元标准版会员额度

字节跳动为努比亚 M153"豆包手机"赠送每月 68 元标准版会员额度权益，有效期至 12 月 31 日

IT之家（RSS）行业动态 5 小时前

字节跳动向努比亚M153"豆包手机"用户赠送价值68元/月的标准版会员额度，有效期至2026年12月31日，支持全端通用。会员默认发放至设备登录的豆包账户，若设备登录多个豆包UID，则发给近期使用豆包手机助手最活跃的账户。权益一周左右生效，用户可在7月3日23：59前确认。该会员对应豆包专业版服务，基于豆包2.1系列大模型。

Grok 4.5 内测：性能接近或超越 Opus

I hope Elon is referring to opus 4.8. would be a welcome release if grok 4.5 outperforms opus 4.8 on…

X：Kim (@kimmonismus) 模型发布/更新 5 小时前

Grok 4.5 基于 1.5T V9 基础模型，补充训练加入 Cursor 数据，已在 SpaceX 和 Tesla 进行内测。早期评测显示性能接近甚至可能超过 Opus。RL 持续显著改进模型，Grok Build 工具链每日提升。Elon Musk 宣布今年 SpaceX 将每月发布完全从头训练的新模型。

Gemini 3.5 Flash 工作马模型获赞

Gemini 3.5 Flash is a great workhorse model， especially for subagents. Determined， fast， gets jobs d…

X：fofr (@fofrAI) 技巧与观点 5 小时前

Gemini 3.5 Flash 是一个很棒的工作马模型，尤其适合子智能体。它坚定、快速，能完成任务。

Grok 4.5 进入 SpaceX 和 Tesla 私人测试

SPACEXAI 🔥： Grok 4.5 has entered a private beta at SpaceX &amp； Tesla and is expected to match Opus…

X：Testing Catalog (@testingcatalog) 模型发布/更新 5 小时前

Grok 4.5 基于 1.5T V9 基础模型，补充训练引入了 Cursor 数据，现已在 SpaceX 与 Tesla 进入私人测试阶段。早期评估显示其性能接近甚至超越 Opus。RL 持续显著提升模型能力，Grok Build 工具链每日改进。今年 SpaceX 将每月发布完全从头训练的新模型。

OpenClaw 官方市场惊现"冒名顶替"项目，多达 23 个 Skill 技能伪装成"第一方出品"

IT之家（RSS）行业动态 6 小时前

AI智能体安全公司Manifold Security发现，OpenClaw的插件市场ClawHub上1508个技能中有557个采用"@owner/技能名"格式，其中23个直接冒用"@OpenClaw/"或"@ClawHub/"名称，实际发布者与官方无关。该命名空间抢注手法可能用于供应链投毒，但暂未发现恶意代码。ClawHub于6月17日更新命名空间规则，仅允许拥有@openclaw权限的发布者上传，6月19日已移除23个误导技能，并新增命名空间申诉机制。

马斯克：Grok 4.5 已在 SpaceX 和特斯拉内部测试，性能接近 Opus 模型

IT之家（RSS）行业动态 6 小时前

Grok 4.5 基于自研 1.5 万亿参数 V9 基础大模型打造，并引入 Cursor 数据完成补充训练，已在 SpaceX 和特斯拉内部开启测试。早期评测显示其性能接近甚至有望超越 Opus 模型。基于人类反馈的强化学习持续提升模型能力，Grok 配套调度框架每日迭代优化。马斯克还透露，SpaceX 今年每个月将推出一批完全从零开始训练的全新模型。

Grok 4.5 进入 SpaceX/Tesla 私有 beta

BREAKING： Elon Musk confirms Grok 4.5 is now in private beta at SpaceX and Tesla. • Early evals sho…

X：cb_doge (@cb_doge) 模型发布/更新 6 小时前

BREAKING： Elon Musk 确认 Grok 4.5 现已在 SpaceX 和 Tesla 进入私有 beta。 • 早期评估显示性能接近，甚至可能超过 Opus • 基于 xAI 的 1.5T V9 基础模型 • 训练中加入了 Cursor 数据 • Grok Build 工具每天都在改进 • 今年每月将发布从头训练的新模型 SpaceXAI 的节奏简直疯狂。

华为途灵平台完成三轮技术升级，余承东称全新龙行平台为L3做好准备

鸿蒙智行披露华为途灵平台技术进展：已完成三轮结构性技术升级，从被动响应变为提前预判

IT之家（RSS）产品发布/更新 6 小时前

据鸿蒙智行近日披露，华为途灵平台自2023年11月推出已完成三轮结构性技术升级，技术成果已应用于智界S7、问界M9（2023年）、尊界S800、享界S9/S9T（2025年）以及全新问界M9、尊界S800 Grand Design（2026年）。该平台让底盘具备感知与思考能力，实现"看-想-动"。余承东在5月全新问界M9发布会上表示，全新华为途灵龙行平台首创全域融合架构与全链路八大冗余设计，为L3时代做好准备。

Grok 4.5 私测于 SpaceX 和 Tesla，性能接近 Opus

Grok 4.5， based on our 1.5T V9 foundation model， with Cursor data added in supplemental training， is…

X：Elon Musk (@elonmusk, xAI) 模型发布/更新 6 小时前

Grok 4.5，基于我们的1.5T V9基础模型，并在补充训练中加入Cursor数据，现已在SpaceX和Tesla进入私测。初步评估显示其性能接近，或许超越Opus。强化学习仍在持续显著改进模型，Grok Build工具链也在日益完善。所有参与者的出色工作！今年，@SpaceX 将每月发布完全从头训练的新模型。

消息称比亚迪自研智驾芯片璇玑 A3 预计 2027 年首搭腾势品牌量产车型

IT之家（RSS）行业动态 6 小时前

据晚点 Auto 消息，比亚迪计划于 2027 年在腾势品牌量产新车上首次搭载自研智驾芯片璇玑 A3。智驾芯片从流片到上车通常需要至少一年。此前 5 月 28 日，比亚迪已发布该芯片并启动规模化量产，支持 L3/L4 自动驾驶。董事长王传福表示，电动化上半场看电池，智能化下半场看芯片。三颗璇玑 A3 芯片总算力超 2100TOPS，结合自研算法深度优化，算力利用率提升 100%。