🔥 AI HOT – Everfadesの技术论坛

小北：从电脑前解放的AI工作流实践

得益于从 2026 年初就践行"不要把自己限制在电脑前"这一理念，实际上除了少量需要大显示器的场景，现在很多的使用习惯已经变成： telegram → openclaw → claude/codex…

X：小北 (@frxiaobei) 技巧与观点 3 分钟前

小北分享自2026年初践行"不要把自己限制在电脑前"的理念，逐渐形成 telegram → openclaw → claude/codex 的工作流，在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流，构建个人harness和skills至关重要，舶来品不一定适合自己。同时引用 @theo 的推文，估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。

2026 AI世界博览会全部售罄

any guesses what the AIEWF Stress Curve* looked like for this year lol *the gini coefficient over t…

X：swyx (@swyx) 行业动态 30 分钟前

2026年AI世界博览会（AIEWF）所有主门票已售罄，包括领导力专场、工作坊及所有晚鸟票均无余票。主办方仅开放少量无座位保证的溢出票，并提醒65场边会仍免费开放。swyx发推调侃今年的"售罄压力曲线"（从0到售罄的基尼系数变化），侧面印证了这场全球最大AI行业博览会的火爆程度。

Flock摄像头追踪的不只是车牌，安全漏洞与滥用问题严重

"Flock"摄像头追踪的不仅仅是你的车牌，而且它们正在迅速普及

Hacker News 热门（buzzing.cc 中文翻译）行业动态 38 分钟前

Flock Safety的AI监控摄像头能识别车牌并通过自然语言搜索特定描述（如"绿色轿车贴有美国国旗保险杠贴纸"）。全美已安装超10万台自动车牌识别器（ALPR），多数来自Flock。这些摄像头存在严重安全漏洞：2025年12月发现至少70台暴露在互联网上，无需密码即可查看实时画面；此前可通过物理接触获取root权限。执法人员滥用系统骚扰和跟踪女性，Flock员工曾用幼儿园儿童画面推销。公司未设漏洞赏金计划，反而抹黑安全研究者。

GLM-5.2 发布：AI 圈称第二个 DeepSeek 时刻，白宫负责人警告美国勿让模型"炼狱"

The release of GLM-5.2 is the second DeepSeek moment.

X：Kim (@kimmonismus) 技巧与观点 48 分钟前

中国开源权重模型 GLM-5.2 发布，被评价为继 DeepSeek 之后的第二次"DeepSeek 时刻"。有评论指出，其性能已可与 OpenAI 和 Anthropic 当前可用模型媲美。白宫 AI 负责人 David Sacks 就此警告，美国若继续将自身模型置于"炼狱"（指过度监管或限制），世界将转向中国技术，美国公司将在竞赛中落后。该言论呼应了此前 DeepSeek 开源模型的全球影响，凸显中美 AI 开源竞争进入新阶段。

中国追赶

China catches up

Gary Marcus：The Road to AI We Can Trust（RSS）技巧与观点 1 小时前

美国AI产业受中国追赶引发价格战，token价格趋近于零，利润微薄，Anthropic和OpenAI的万亿IPO难以实现，数据中心巨额投资难回收。当前范式有三个根本缺陷：暴力训练全互联网成本高昂且效率低下；系统不可靠，长期无法维持溢价；基础方法易复制，导致价格战与负利润率。另有人认为，整个AI竞赛方向可能被误解，美国不应只追求最便宜的LLM，而应开发更适合科学与医学的AI新形态。

可灵AI角色投票：选中最爱角色制作视频

Who's your pick？ ⚽️ Comment your favorite card below！ We'll choose the most-loved character and br…

X：可灵 Kling AI (@Kling_ai) 行业动态 1 小时前

你选谁？⚽️ 在下方评论你最喜欢的卡片！我们将选出最受喜爱的角色，并在下一期视频中让他们活起来！

三星等内存芯片厂面临AI泡沫难降价

Doesnt look good for us： "Even if the AI bubble bursts， prices likely won't improve. Samsung， SK H…

X：Kim (@kimmonismus) 技巧与观点 1 小时前

对我们来说不太乐观： "即使AI泡沫破裂，价格也不太可能改善。三星、SK海力士和美光已经花费数十亿美元重新配置实体厂房空间，用于生产复杂的AI内存芯片。此外，这三家公司还签订了长达2030年的多年供货合同。无论数据中心需求是否降温，对科技巨头的法律义务依然存在。"

前沿模型"氛围监管"酿成真实可怕后果

This is real and a horrible consequence of vibe regulation of frontier models.

X：Nathan Lambert (@natolambert) 技巧与观点 1 小时前

这是真实的，也是前沿模型氛围监管的可怕后果。

AI浪潮推高硬件成本，苹果全线涨价

AI时代的账单，苹果用户先买了单。我们该谢谢AI还是痛批呢？苹果本周宣布全线涨价。 MacBook Neo涨$100（17%），MacBook Air涨$200（18%），入门iPad涨$10…

X：Berry Xia (@berryxia) 技巧与观点 1 小时前

苹果本周全线涨价：MacBook Neo涨$100（17%）、MacBook Air涨$200（18%）、入门iPad涨$100（29%）、iPad Air涨$150（25%），Apple TV从$129涨至$199（54%），HomePod及mini涨17%-30%，Apple Vision Pro涨6%至$3，699。主因AI热潮引发内存芯片短缺，超大规模AI公司抢占供应链资源。微软随后也上调Xbox价格。Gurman分析指出，苹果虽主推端侧AI减少云端依赖，但上市公司仍选择转嫁成本；iPhone因运营商补贴未涨。这标志着AI繁荣成本首次从行业问题变为普通消费者可感知的现实。

帕利塞兹火灾审判：检察官用ChatGPT日志作证，陪审团不信致悬案

Prosecutors used ChatGPT logs as evidence in the Palisades fire trial

The Verge：AI（RSS）行业动态 2 小时前

在2025年元旦引发洛杉矶致命野火的纵火案审判中，检察官将被告Jonathan Rinderknecht的ChatGPT日志作为关键证据，包括其用ChatGPT生成火焰图像、询问"为什么我总是这么愤怒"以及抱怨富人毁掉世界等记录，并出示了一段屏幕录制显示其问ChatGPT是否可因香烟引火而追责。但陪审团以10比2的投票支持辩方，法官宣布悬案。一名陪审员表示她"经常和ChatGPT聊天"，认为此举不能证明任何问题，并对检方用聊天记录指控感到愤怒。

Seedance 2.0 用3D通道锁定运动与相机

From a basic grey 3D cockpit model to a full-speed cinematic lap. Seedance 2.0 uses the 3D pass to …

X：PixVerse (@PixVerse_) 产品发布/更新 2 小时前

从基本的灰色3D座舱模型到全速电影级圈速。 Seedance 2.0 使用3D通道锁定运动和相机移动，无需依赖文本提示即可提供精确、一致的结果。

Google限制Meta使用Gemini致项目延迟

Google vs Meta 🤖 > Google introduces restrictions on Meta's use on Gemini amid capacity shortage， …

X：Testing Catalog (@testingcatalog) 行业动态 2 小时前

Google vs Meta 🤖 > 据《金融时报》报道，Google因容量短缺对Meta使用Gemini施加限制。 > 据报道，这负面影响了Meta内部与客户支持和内容审核相关的项目，导致项目延期。我敢打赌，从长远来看，token效率将成为一个巨大的市场，其商业模式非常透明且可预测。

应对美国高端 AI 限制，奥地利推动欧盟引入 Anthropic 落地运营

IT之家（RSS）行业动态 2 小时前

奥地利数字化国务秘书亚历山大·普罗尔（Alexander Pröll）致信欧盟委员会，敦促各成员国将 Anthropic 作为战略重点引入欧盟，提供法律确定性、市场准入、资本和价值观。此举意在反制美国阻止外籍人士使用最先进 AI 模型的举措。普罗尔认为，Anthropic 扎根欧洲能吸引人才、留住资金并制定行业标准。此前欧盟委员会发言人曾表示欧洲必须强化技术自主权。

Grok 4.5 基于1.5T V9进入SpaceX/Tesla测试

马斯克说他们的Grok 4.5，基于他们的的 1.5T V9 基础模型并在补充训练中加入了 Cursor 数据现已在 SpaceX 和 Tesla 进入早前测试阶段早期评估显示性能接近 O…

X：小互 (@xiaohu) 模型发布/更新 3 小时前

马斯克宣布Grok 4.5基于1.5T V9基础模型，并在补充训练中加入Cursor数据，现已于SpaceX和Tesla进入私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续显著优化模型，Grok Build工具每日改进。此外，SpaceX今年将每月发布完全从零训练的新模型。

Claude Code分屏功能推荐使用

我特么还真想成为那1%的人，可惜我也不知道😄

X：Berry Xia (@berryxia) 技巧与观点 3 小时前

99%的人不知道的Claude Code分屏功能。如果你是Claude Code桌面端用户，一定要看看。原推主感叹：我特么还真想成为那1%的人，可惜我也不知道😄

AI成为真正同事的关键：停止回答问题，开始完成任务

AI won't become a real coworker until it stops answering and starts finishing tasks

The Decoder：AI News（RSS）技巧与观点 3 小时前

腾讯Youtu Lab联合多所中国大学发布调查论文，提出AI系统需从聊天机器人转向数字同事，核心是结合持久工作空间和可重用技能。思考型LLM（如OpenAI o1、DeepSeek-R1）采用链式推理实现慢思考；工作空间（如

Anthropic企业使用激增2025年底登顶

Anthropic's business case needs to be studied. At the end of 2025 and the beginning of 2026， there w…

X：Kim (@kimmonismus) 技巧与观点 3 小时前

Anthropic的商业案例值得研究。2025年底至2026年初，其企业/商业领域的使用量出现了惊人增长，使其成为第一。

LoanLens：基于LandingAI的AI审贷初筛系统

LoanLens 是一套基于 LandingAI 的 AI 审贷初筛系统：从六类借款人文档中抽取结构化字段、做欺诈检测与可解释评分，并附带仅限当前案件的 RAG 问答，把人工核对文档的工作自动化为第一…

X：邵猛 (@shao__meng) 行业动态 3 小时前

LoanLens从六类借款人文档抽取结构化字段，进行欺诈检测与可解释评分，并附带案件RAG问答。采用Schema驱动抽取，可追溯字段来源；欺诈检测包括姓名TF-IDF比对和护照篡改检测；评分透明（信用23%、DTI 23%等），≥60批准，40-59复核，<40拒绝。

Agent-Reach：为AI Agent免费读取多平台内容的开源CLI工具

兄弟们，这个项目简直是搞自媒体神器啊！斩获3.5K Star，还直接开源免费啊！还不赶紧给你的Agent搞起来啊又有一个给AI Agent装"互联网眼睛"的开源项目，叫Agent-Reach。…

X：Berry Xia (@berryxia) 技巧与观点 3 小时前

Agent-Reach（3.5K Star）通过CLI工具让AI Agent免费读取Twitter、Reddit、YouTube、GitHub、B站、小红书等多平台内容。核心是智能选择当下最稳定的开源后端，自动健康检查和故障切换，无需自写爬虫。安装后Agent可直接处理"看视频字幕"、"搜产品评价"等任务，全程零API费用、本地运行。项目将碎片能力封装为Agent可调用的skill，实现多后端路由和自动降级，补齐Agent低成本、可靠获取网页和社交媒体内容的能力。

Coinbase 转向中国 AI 模型，西方实验室面临定价压力测试

Coinbase joins the rush to Chinese AI models as Western labs face a pricing stress test

The Decoder：AI News（RSS）行业动态 4 小时前

Coinbase CEO Brian Armstrong 已将公司迁移至中国 AI 模型，采用智谱 GLM 5.2 和月之暗面 Kimi 2.7，token 用量攀升但支出减半。91% 的开发者从未触及旧用量上限。初创公司 Lindy 近期转向 DeepSeek V4，Snowflake 也在测试中国模型作为廉价替代品。Coinbase 部署自动路由系统，根据任务、价格和缓存潜力选择模型，缓存命中率从 5% 提升至 60%。开发者被要求保持上下文精简并开启新会话。公司让每位开发者用量透明但不设上限，Armstrong 表示"AI 支出越多，预期影响越大"。这些举措使 AI 总支出减半。同时，OpenAI 的 GPT-5.6-Sol 与 GPT-5.5 定价相同但更省 token，并推出两个廉价变体，加剧与 Anthropic 的价格战。

字节跳动为努比亚M153"豆包手机"赠送每月68元标准版会员额度

字节跳动为努比亚 M153"豆包手机"赠送每月 68 元标准版会员额度权益，有效期至 12 月 31 日

IT之家（RSS）行业动态 4 小时前

字节跳动向努比亚M153"豆包手机"用户赠送价值68元/月的标准版会员额度，有效期至2026年12月31日，支持全端通用。会员默认发放至设备登录的豆包账户，若设备登录多个豆包UID，则发给近期使用豆包手机助手最活跃的账户。权益一周左右生效，用户可在7月3日23：59前确认。该会员对应豆包专业版服务，基于豆包2.1系列大模型。

Grok 4.5 内测：性能接近或超越 Opus

I hope Elon is referring to opus 4.8. would be a welcome release if grok 4.5 outperforms opus 4.8 on…

X：Kim (@kimmonismus) 模型发布/更新 4 小时前

Grok 4.5 基于 1.5T V9 基础模型，补充训练加入 Cursor 数据，已在 SpaceX 和 Tesla 进行内测。早期评测显示性能接近甚至可能超过 Opus。RL 持续显著改进模型，Grok Build 工具链每日提升。Elon Musk 宣布今年 SpaceX 将每月发布完全从头训练的新模型。

Gemini 3.5 Flash 工作马模型获赞

Gemini 3.5 Flash is a great workhorse model， especially for subagents. Determined， fast， gets jobs d…

X：fofr (@fofrAI) 技巧与观点 4 小时前

Gemini 3.5 Flash 是一个很棒的工作马模型，尤其适合子智能体。它坚定、快速，能完成任务。

Grok 4.5 进入 SpaceX 和 Tesla 私人测试

SPACEXAI 🔥： Grok 4.5 has entered a private beta at SpaceX &amp； Tesla and is expected to match Opus…

X：Testing Catalog (@testingcatalog) 模型发布/更新 4 小时前

Grok 4.5 基于 1.5T V9 基础模型，补充训练引入了 Cursor 数据，现已在 SpaceX 与 Tesla 进入私人测试阶段。早期评估显示其性能接近甚至超越 Opus。RL 持续显著提升模型能力，Grok Build 工具链每日改进。今年 SpaceX 将每月发布完全从头训练的新模型。

OpenClaw 官方市场惊现"冒名顶替"项目，多达 23 个 Skill 技能伪装成"第一方出品"

IT之家（RSS）行业动态 5 小时前

AI智能体安全公司Manifold Security发现，OpenClaw的插件市场ClawHub上1508个技能中有557个采用"@owner/技能名"格式，其中23个直接冒用"@OpenClaw/"或"@ClawHub/"名称，实际发布者与官方无关。该命名空间抢注手法可能用于供应链投毒，但暂未发现恶意代码。ClawHub于6月17日更新命名空间规则，仅允许拥有@openclaw权限的发布者上传，6月19日已移除23个误导技能，并新增命名空间申诉机制。

马斯克：Grok 4.5 已在 SpaceX 和特斯拉内部测试，性能接近 Opus 模型

IT之家（RSS）行业动态 5 小时前

Grok 4.5 基于自研 1.5 万亿参数 V9 基础大模型打造，并引入 Cursor 数据完成补充训练，已在 SpaceX 和特斯拉内部开启测试。早期评测显示其性能接近甚至有望超越 Opus 模型。基于人类反馈的强化学习持续提升模型能力，Grok 配套调度框架每日迭代优化。马斯克还透露，SpaceX 今年每个月将推出一批完全从零开始训练的全新模型。

Grok 4.5 进入 SpaceX/Tesla 私有 beta

BREAKING： Elon Musk confirms Grok 4.5 is now in private beta at SpaceX and Tesla. • Early evals sho…

X：cb_doge (@cb_doge) 模型发布/更新 5 小时前

BREAKING： Elon Musk 确认 Grok 4.5 现已在 SpaceX 和 Tesla 进入私有 beta。 • 早期评估显示性能接近，甚至可能超过 Opus • 基于 xAI 的 1.5T V9 基础模型 • 训练中加入了 Cursor 数据 • Grok Build 工具每天都在改进 • 今年每月将发布从头训练的新模型 SpaceXAI 的节奏简直疯狂。

华为途灵平台完成三轮技术升级，余承东称全新龙行平台为L3做好准备

鸿蒙智行披露华为途灵平台技术进展：已完成三轮结构性技术升级，从被动响应变为提前预判

IT之家（RSS）产品发布/更新 5 小时前

据鸿蒙智行近日披露，华为途灵平台自2023年11月推出已完成三轮结构性技术升级，技术成果已应用于智界S7、问界M9（2023年）、尊界S800、享界S9/S9T（2025年）以及全新问界M9、尊界S800 Grand Design（2026年）。该平台让底盘具备感知与思考能力，实现"看-想-动"。余承东在5月全新问界M9发布会上表示，全新华为途灵龙行平台首创全域融合架构与全链路八大冗余设计，为L3时代做好准备。

Grok 4.5 私测于 SpaceX 和 Tesla，性能接近 Opus

Grok 4.5， based on our 1.5T V9 foundation model， with Cursor data added in supplemental training， is…

X：Elon Musk (@elonmusk, xAI) 模型发布/更新 5 小时前

Grok 4.5，基于我们的1.5T V9基础模型，并在补充训练中加入Cursor数据，现已在SpaceX和Tesla进入私测。初步评估显示其性能接近，或许超越Opus。强化学习仍在持续显著改进模型，Grok Build工具链也在日益完善。所有参与者的出色工作！今年，@SpaceX 将每月发布完全从头训练的新模型。

消息称比亚迪自研智驾芯片璇玑 A3 预计 2027 年首搭腾势品牌量产车型

IT之家（RSS）行业动态 5 小时前

据晚点 Auto 消息，比亚迪计划于 2027 年在腾势品牌量产新车上首次搭载自研智驾芯片璇玑 A3。智驾芯片从流片到上车通常需要至少一年。此前 5 月 28 日，比亚迪已发布该芯片并启动规模化量产，支持 L3/L4 自动驾驶。董事长王传福表示，电动化上半场看电池，智能化下半场看芯片。三颗璇玑 A3 芯片总算力超 2100TOPS，结合自研算法深度优化，算力利用率提升 100%。

仅有三个AI模型在500天创业测试中盈利超过起始资本

Only three AI models finished above starting capital in a 500-day startup survival test

The Decoder：AI News（RSS）论文研究 6 小时前

普林斯顿大学推出CEO-Bench基准测试，让AI智能体在模拟环境中运营订阅软件公司NovaMind 500天，起始资金100万美元。14个测试模型中，仅Claude Fable 5（最佳轮次盈利4715万美元）、Claude Opus 4.8（2780万美元）和GPT-5.5（2130万美元）在最佳运行中超过起始资本。一个不调用语言模型的简单规则启发式方法通过固定定价、配额和针对性开发达到1576万美元，超越除上述三款外的所有模型。多数模型无法保持连贯策略，在模拟结束前破产。该测试旨在衡量AI的长期战略决策能力。

OpenAI 测试 Codex 滑条式努力选择器

OpenAI is testing a new effort-selector UI for Codex as a slider. Besides that， it seems that real…

X：Testing Catalog (@testingcatalog) 产品发布/更新 6 小时前

OpenAI 正在为 Codex 测试一种新的努力选择器 UI，采用滑条形式。此外，实时语音支持似乎将被彻底重写，因为之前可用的组件已被移除。

PixVerse企鹅康复后奇异事件频发

so glad she's feeling better

X：PixVerse (@PixVerse_) 技巧与观点 6 小时前

小企鹅从疾病中康复，本该回归日常，但梦境、星星、微光、旧箱子……奇怪的事情逐渐增多，不过它依然我行我素🐧📷

Hermes代理优化：搭建自复盘Memory.md记忆循环

现在用 Hermes 最聪明的做法，不是堆提示词，而是给它搭一个会自己复盘迭代的记忆循环，越用越贴合你的工作习惯，能力拉满。核心靠一份【Memory.md】（Memory.md），跑「会话学习…

X：阿易 AI Notes (@AYi_AInotes) 技巧与观点 6 小时前

为用户提供不依赖微调或开发的Hermes代理优化方案：通过Memory.md文件构建"会话学习-记录沉淀-迭代优化"闭环。核心流程：1）桌面新建Memory.md，固定偏好、更正、模式、学到的经验四层框架；2）绑定提示词，每次会话前读取并完整应用，任务结束后记录有效做法与失败根因，新结论覆盖旧内容；3）每周精炼压缩零散经验为通用规则；4）定期日期命名归档备份。无需模型微调或部署，几分钟启动，使代理越用越贴合个人工作习惯，从单次随机输出收敛为专属智能体。

中国网络安全公司360推出AI工具对抗Mythos，周鸿祎呼吁建立网络核威慑

Chinese cybersecurity firm builds AI tools to rival Mythos and frames the race as cyber-nuclear deterrence

The Decoder：AI News（RSS）产品发布/更新 6 小时前

中国网络安全公司360安全科技发布两款AI工具："屠龙锋"用于自动化漏洞挖掘，"倚天镇"用于自动化网络防御。创始人周鸿祎称"屠龙锋"已发现3432个漏洞。他认为中国顶级AI模型仍落后西方20%-30%，因此采用基于智能体的方法将模型与安全专业知识及自动化工具结合。周鸿祎将Mythos类模型比作"AI时代的网络核武器"，呼吁中国建立对等战略威慑能力，避免美国垄断。清华大学教授唐杰（Z.ai创始人，近期发布GLM-5.2）预测中国"类Mythos"模型将在2027年第一季度前出现。

传言称智谱AI新模型在网络安全上对标美国顶尖模型，但信息源存疑

Supposedly， "a new model from" from zAI is said to be at least as strong as Fable5 in cybersecurity-…

X：Kim (@kimmonismus) 行业动态 6 小时前

有传言称zAI新模型在网络安全方面至少与Fable5相当。博主@Kim查找发现只有《华尔街日报》一篇相关文章，但提及的是智谱AI的GLM-5.2，并非新模型。WSJ称GLM-5.2在某些找bug场景可匹配美国顶尖模型；360安全称其Tulongfeng工具可比肩Anthropic的Mythos。@Polymarket也曾引用消息称智谱AI新模型在查找安全漏洞上达到Claude Mythos水平。目前这些说法均未获官方确认，存在信息混淆可能。

如果有一天程序员写代码的速度提升了10倍那程序员应该选择： 1. 写100倍的代码 2.用省下来的时间90%做稀缺的重要的事你的选择是1还是2？你的老板对你的要求是1还是2？

X：Oran Ge (@oran_ge) 技巧与观点 7 小时前

如果有一天程序员写代码的速度提升了10倍那程序员应该选择： 1. 写100倍的代码 2.用省下来的时间90%做稀缺的重要的事你的选择是1还是2？你的老板对你的要求是1还是2？

法拉第未来发布Faber轮臂机器人及Futurist人形机器人

法拉第未来推出"全美首款工业级轮臂机器人"Faber，同步推出全新 Futurist 机器人系列

IT之家（RSS）产品发布/更新 8 小时前

6月28日，法拉第未来在芝加哥Automate展会上推出"全美首款工业级轮臂机器人"Faber系列（U/T/S三款），应用于工业上下料与物流转运等场景。同时发布全新Futurist人形机器人标准版：身高173cm、重55kg（减重14%）、全身31自由度、膝关节峰值扭矩320N·m、1152Wh双电池续航6小时（上代3倍），支持7×24小时商用部署，定价89900美元（约61.2万元）。Ultra版年内发布，搭载Jetson Thor芯片，支持自主充电，面向高强度场景。

Kim驳斥Anthropic CEO"恐惧煽动"导致模型禁运的说法

Dario Amodei's "fearmongering" was not the reason Fable 5 and GPT-5.6 were embargoed. That is a mist…

X：Kim (@kimmonismus) 技巧与观点 8 小时前

Kim认为美国政府基于自身安全评估（担忧模型被中国通过蒸馏获取）而非CEO言论决定禁运Fable 5和GPT-5.6。她批评Anthropic沟通失误（拒配合国防部、电话不畅通），并赞同模型被禁源于其真实破坏性能力，Anthropic应主动报告风险而非让Amazon先行披露。

instructor 1.15.4 发布

instructor 1.15.4 is out mostly a maintainer sweep： - fixed v2 list/scalar response models - preser…

X：Jason Liu (@jxnlco) 产品发布/更新 8 小时前

instructor 1.15.4 发布主要是维护性扫除： - 修复了 v2 列表/标量响应模型 - 保留了流式 JSON 字符串中的反引号 - Image.autodetect 现在处理原始字节 - 刷新了过时的文档模型字符串，包括 Ollama llama3.2 小补丁，更少奇怪边缘

新浪开源VibeThinker-3B：推理可压缩，事实知识不能

Sina's open model VibeThinker-3B aims to show reasoning compresses well but factual knowledge doesn't

The Decoder：AI News（RSS）模型发布/更新 8 小时前

新浪发布仅3B参数的VibeThinker-3B，在AIME26等数学编程基准上持平DeepSeek V3.2等大200-333倍的模型，LiveCodeBench超越所有20B以下模型，LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B，经SFT、强化学习、自蒸馏等多阶段后训练。研究提出"参数压缩-覆盖假说"：逻辑推理依赖少数可压缩模式，而广泛世界知识仍需大参数。模型已开源。

Codex 两种计划工作：Scheduled Task 与 Scheduled Message 的区别

http：//x.com/i/article/2071134358359187456

X：Jason Liu (@jxnlco) 技巧与观点 8 小时前

Codex 支持两种计划工作方式。Scheduled Tasks 每次运行创建新线程，适合无需上下文延续的任务，如每日 9 点自动总结邮件、日历；Scheduled Messages 在同一现有线程反复运行，适合需要历史上下文的场景，如每 30 分钟检查 PR 状态并处理评论，直至合并。推文还给出创建可复用循环技能的提示词，让 Codex 自动判断使用哪种方式并引导用户填写关键参数。

美国官员将中美AI竞赛定性为国家安全对抗

US officials are now framing the AI race with China as a national-security contest where even a tiny…

X：Kim (@kimmonismus) 技巧与观点 8 小时前

美国官员将与中国的人工智能竞赛定位为国家安全对抗，称微小领先也能改变结果。众议院外交委员会主席Brian Mast在哈德逊研究所活动上称美国是"超级英雄"、中国是"超级反派"。参议员Jim Banks表示这场竞赛涉及经济、军事和道德层面，警告美国不能输给"最大对手"。财长Bessent直言，中国愿意讨论AI是因为美国目前仍领先，但华盛顿担忧这一优势正不断缩小。作者认为，"Fable 5禁令"必须在此背景下理解。

研究：AI让自由职业市场更重价格竞争

AI may be turning some freelance markets into price contests， where strong profiles carry less weigh…

X：Rohan Paul (@rohanpaul_ai) 论文研究 8 小时前

一项新研究（arXiv： 2606.21880）表明，AI正在将部分自由职业市场变成价格竞赛，高技能简历的优势被削弱。在ChatGPT出现后，AI暴露程度最高的职业中，人力资本信号（经验、声誉）的重要性下降了约7.8%，而价格的重要性上升了约1.1%。强背景工作者失去了部分需求优势，需求向更便宜的工人转移，表明AI使这些工作者显得更可互换。

在Colab中构建Fable 5 Traces工作流：解析工具调用、审计数据与训练基线

Building a Stable Fable 5 Traces Workflow in Colab： Parsing Tool Calls， Auditing Data， and Training Baselines

MarkTechPost（RSS）技巧与观点 9 小时前

本教程使用Hugging Face上的Fable 5 Traces数据集，在Google Colab中搭建轻量环境并手动下载JSONL文件。流程包括预览原始agent trace示例、规范化工具调用与文本输出、审计数据结构、检测密钥模式，以及可视化输出类型、工具、源根目录和文本长度等分布。还创建了安全的no-CoT聊天/SFT导出，构建关键词搜索辅助，并训练纯Python朴素贝叶斯基线，评估trace上下文能否预测助手的输出类型与工具使用。

智元第15000台通用具身机器人精灵G2量产下线

智元第 15000 台通用具身机器人精灵 G2 量产下线

IT之家（RSS）行业动态 9 小时前

智元今日宣布第15000台通用具身机器人精灵G2正式量产下线。该机器人搭载NVIDIA Jetson Thor芯片，配备19自由度灵巧手、3D触觉感知、高精度力控双臂及5自由度腰腿全向底盘，引入真机RL工具链。支持多人连续语音对话与知识库问答，采用双电池热插拔换电，配备360环视鱼眼和前后双激光雷达实现主动避障，并优化超视距遥操作。可覆盖工业作业、巡检巡逻、安检引导、讲解导览、家庭服务等场景。

两节点 AMD Strix Halo RDMA 集群设置指南

AMD Strix Halo RDMA 集群设置指南

Hacker News 热门（buzzing.cc 中文翻译）技巧与观点 9 小时前

本文介绍如何配置两节点 AMD Strix Halo 集群，通过 Intel E810 （RoCE v2）网卡实现 RDMA 互联，用于分布式 vLLM 推理（Tensor Parallelism）。硬件采用两块 Framework Desktop 主板（AMD Ryzen AI MAX+ "Strix Halo"，128GB 统一内存）及 E810-CQDA1 100GbE 网卡，直连无需交换机。软件栈基于 Fedora 43，使用 Ray 编排集群、RCCL 通信。RDMA 延迟约 5μs（TCP/IP 为 70-100μs）。涵盖 BIOS 设置、网络配置、工具箱安装及启动集群的详细步骤。

匿名模型"Owl Alpha"实为美团LongCat-2.0-Preview，已在OpenRouter秘密测试近两月

I'm hearing that "Owl Alpha"， one of OpenRouter's fastest-growing agent models， is actually Meituan …

X：Rohan Paul (@rohanpaul_ai) 行业动态 9 小时前

据X用户Rohan Paul爆料，OpenRouter增长最快的智能体模型"Owl Alpha"实为美团LongCat-2.0-Preview。该模型采用1.6T参数MoE架构，激活参数量48B，动态激活范围33B-56B，原生支持1M token上下文窗口。已在OpenRouter秘密测试近两月，成为全球使用最多的AI智能体模型之一。OpenRouter数据显示其排名：Hermes Agent第1、Claude Code第2、OpenClaw第3；月处理token 10.1T，日token 559B，月增长率242%。

谷歌因算力限制对 Meta 调用 Gemini 大模型实施限制

需求过大供给跟不上，消息称谷歌对 Meta 调用 Gemini 大模型作出限制

IT之家（RSS）行业动态 9 小时前

Meta 向谷歌申请的 Gemini 算力规模超出后者供给能力，谷歌现已对 Meta 调用其 Gemini 大模型实施使用限制。Alphabet 约在今年 3 月告知 Meta 无法满足所需算力，导致 Meta 多项内部 AI 项目受阻延期。Meta 已要求员工节约使用模型 token。谷歌一季度云营收达 200 亿美元，CEO 皮查伊表示算力供给瓶颈制约云业务增速，同时令云部门积压订单量环比近乎翻倍。

福特公司雇佣了人工智能，解雇了人类员工。结果适得其反。

Hacker News 热门（buzzing.cc 中文翻译）行业动态 9 小时前

福特因激进采用AI质检系统导致成本损失数十亿美元，三年内返聘350多名资深工程师（内部称"gray beards"），负责质量审查并帮助改进AI。首席运营官Kumar Galhotra承认自动化系统未达预期，经验丰富的工程师能预先发现故障点。返聘后，福特在J.D. Power年度新车质量调查中16年来首次获得主流品牌排名第一。公司表示不会放弃AI，但未来将结合人类监督与经验使用该技术。