Seedance 2.0 用3D通道锁定运动与相机
From a basic grey 3D cockpit model to a full-speed cinematic lap. Seedance 2.0 uses the 3D pass to …从基本的灰色3D座舱模型到全速电影级圈速。 Seedance 2.0 使用3D通道锁定运动和相机移动,无需依赖文本提示即可提供精确、一致的结果。
AI 精选资讯 · 共 50 条
从基本的灰色3D座舱模型到全速电影级圈速。 Seedance 2.0 使用3D通道锁定运动和相机移动,无需依赖文本提示即可提供精确、一致的结果。
据鸿蒙智行近日披露,华为途灵平台自2023年11月推出已完成三轮结构性技术升级,技术成果已应用于智界S7、问界M9(2023年)、尊界S800、享界S9/S9T(2025年)以及全新问界M9、尊界S800 Grand Design(2026年)。该平台让底盘具备感知与思考能力,实现"看-想-动"。余承东在5月全新问界M9发布会上表示,全新华为途灵龙行平台首创全域融合架构与全链路八大冗余设计,为L3时代做好准备。
OpenAI 正在为 Codex 测试一种新的努力选择器 UI,采用滑条形式。 此外,实时语音支持似乎将被彻底重写,因为之前可用的组件已被移除。
中国网络安全公司360安全科技发布两款AI工具:"屠龙锋"用于自动化漏洞挖掘,"倚天镇"用于自动化网络防御。创始人周鸿祎称"屠龙锋"已发现3432个漏洞。他认为中国顶级AI模型仍落后西方20%-30%,因此采用基于智能体的方法将模型与安全专业知识及自动化工具结合。周鸿祎将Mythos类模型比作"AI时代的网络核武器",呼吁中国建立对等战略威慑能力,避免美国垄断。清华大学教授唐杰(Z.ai创始人,近期发布GLM-5.2)预测中国"类Mythos"模型将在2027年第一季度前出现。
6月28日,法拉第未来在芝加哥Automate展会上推出"全美首款工业级轮臂机器人"Faber系列(U/T/S三款),应用于工业上下料与物流转运等场景。同时发布全新Futurist人形机器人标准版:身高173cm、重55kg(减重14%)、全身31自由度、膝关节峰值扭矩320N·m、1152Wh双电池续航6小时(上代3倍),支持7×24小时商用部署,定价89900美元(约61.2万元)。Ultra版年内发布,搭载Jetson Thor芯片,支持自主充电,面向高强度场景。
instructor 1.15.4 发布 主要是维护性扫除: - 修复了 v2 列表/标量响应模型 - 保留了流式 JSON 字符串中的反引号 - Image.autodetect 现在处理原始字节 - 刷新了过时的文档模型字符串,包括 Ollama llama3.2 小补丁,更少奇怪边缘
Adrafinil 是一款 macOS 菜单栏应用,仅在 Claude Code、Codex、Cursor、Gemini CLI、Aider、Hermes、OpenCode、Cline、Pi 等 9 种 AI coding agent 持有活跃会话时阻止系统睡眠(包括合盖睡眠)。无 agent 工作时,合盖后 Mac 正常睡眠。它通过各 agent 的钩子系统调用 CLI,往返延迟低于 50ms,支持引用计数断言、热切出(温度阈值强制释放)、空闲释放及进程嗅探。需要 macOS Tahoe 26.4,Xcode 26+ 构建,以签名公证的磁盘映像提供。
我的 OpenAI 哥们刚刚发布了最权威的基准测试。
红魔游戏平板5 Pro公布软件功能:内置AI战术教练,支持赛前赛中提供选英雄、出装等指导;AI魔姬嘴替接入DeepSeek,实现自然回复交流。投屏助手支持1080P 185Hz/4K 144Hz无黑边低延迟投屏;新增剪辑应用和电子书模式(彩墨/黑白两种方案,可指定App开启)。该平板搭载第五代骁龙8至尊版(CPU主频4.6GHz),配备185Hz OLED电竞屏、新思S3930触控芯片(2000Hz瞬时报点率、300Hz多指原生触控采样率、10X超分辨率触控),升级红魔CUBE擎天游戏引擎3.0,支持2K 144Hz超分超帧并发及PC模拟器Steam直连。外观提供氘锋透明银翼/暗夜两款配色,RGB水冷灯效均匀度提升200%。
深圳开鸿数字产业发展有限公司 CEO 王成录宣布,全国首个开源鸿蒙机器人操作系统 M-Robots OS 正式完整捐献至开放原子开源基金会,专属一级根社区同步启动运营。该系统 1.0 版本于 2025 年 4 月发布,今年 5 月升级至 2.0 版本。2.0 版本具备积木式框架、混合部署、自研 M-DDS 分布式通信、硬件能力及算法共享、AI 原生及中间件生态兼容等核心能力,其中本体间音视频时延低至 4 毫秒,应用迁移成本降低 80%。
Codex 本周推出多项体验改进。超长线程处理更流畅,导航栏悬浮可预览和跳转对话回合。设置搜索覆盖更多控制项,外观与主机过滤选项更清晰,自定义提供商设置更易找到。缩放时工具提示、对话框、菜单等不再错位。复制到 Slack 保留 Markdown 格式,大文本粘贴不冻结 UI。此外还新增了专属 Pets 面板。
博主 @旺仔百事通 透露,荣耀 Robot Phone 机器人手机将于 8 月上市,并确认后续有迭代版本。该机型于今年 3 月发布,顶部配备三轴云台相机,搭载 2 亿像素传感器,支持前后翻转;具备 AI 物体追踪、AI 视频剪辑与智能拍摄功能,可实现实时感知与补偿,保证视频稳定。荣耀 CEO 李健此前表示,首款 Robot Phone 将于三季度上市。研发历时一年,修改 5 版才完成雏形。
Naver 于 6 月 26 日正式上线 AI 对话搜索服务"AI Tab",定位为 AI 智能体搜索,旨在引导用户完成购买与预约。该服务整合 Naver 自家电商、地图、Cafe 社区、博客和本地生活服务,挑战谷歌 AI Mode。AI Tab 在回答深度和推理能力上不及 ChatGPT/Gemini,但在韩国本地餐厅推荐、商品发现及信息整理方面体验优于传统搜索。Naver 计划后续推出个性化房地产推荐和健康智能体服务。
Meta AI app for iOS 新增了隐身聊天功能,并为 Glasses 页面提供了新外观。 更新后的页面包含所有主要开关的快捷键,包括实时翻译和对话焦点。
ViDA 团队开源的 BrowserBC 项目,探索更高效的 web agent 运行方式:先用强模型录制一次人类浏览器操作流程,将其蒸馏为可复用技能,再交给更小更便宜的模型执行。一次录制即可泛化技能。在 WebArena-Hard 上,tool calls 降低 27%,成功率从 60% 升至 81%。
Codex Auto review mode,当我让它给同事发送我的.env文件时。
一位老师以通俗易懂的方式讲解大语言模型(LLM),引发网友共鸣,并邀请大家分享看法。原文信息有限,未提及具体模型名称或课程细节。
Claude Code 桌面版更新,支持原生多会话拖拽分屏,将并行 Agent 工作流可视化。用户可在桌面 App 中开多个会话,左侧侧边栏统一管理,拖拽即可排列并排窗格,支持单独弹出窗口。内置终端、文件编辑器、预览面板均可分屏排布,底部同时显示多个会话的输入区。相比此前依赖 tmux 和终端窗口切换,效率大幅提升。
🆕 Codex 质量提升更新本周发布。 从长线程开始:滚动现在更流畅,并且在浏览对话时你的位置保持不变。
Vercel 开源了框架 Eve,将智能体视为一个目录:`agent/instructions.md` 定义系统提示,`agent/agent.ts` 配置模型等运行时参数;工具(`agent/tools/` 下的类型化文件)、技能(`agent/skills/` 下的 Markdown 文件,按需加载)、子智能体(内置 agent 工具实现委托)和人工审批(`needsApproval` 标记)均以文件形式存放,无需注册步骤。Eve 内置持久会话、沙箱、追踪和评估等生产级基础设施。
元宝与QQ浏览器联合推出的元宝高考通可帮助考生填报志愿。输入广东物理类612分等基本信息后,还能填写MBTI性格、就业偏好(直接就业/考研/考公/国企)。系统按"冲稳保"结构推荐院校,标注211/985/双一流标签,展示招生代码、计划人数、往年分数与分差。点击专业可查看校区地址、专业代码、学费。Agent对话支持追问宿舍空调、独卫等细节,信息源来自教育在线、掌上高考等官方平台。针对"既要就业好又不愿太痛苦"的复合需求,从交叉赛道给出分层建议,避免盲目追热门。该工具解决了信息分散难题,但最终选择仍需考生与家庭自主决定。
hf-claude 让你在 Claude Code 中使用超过 100 个开源模型,包括 GLM 5.2、MiniMax-M3、DeepSeek V4 Pro。
广告本地化现在可通过 Runway API 以 Recipe 形式使用。 现在您可以通过单次 API 调用翻译静态广告和图形资产。
Google 正在为 NotebookLM 开发 Collections(集合)支持。 > 用户可以将多个笔记本分组到一个集合中。 > 集合将出现在 NotebookLM 主菜单的一个单独标签页中。 由于笔记本现在在 Gemini 中也作为"项目"运行,这可能有助于用户更有效地组织它们。
DeepSeek V4 进行了一次更新。 新推出了投机解码(Speculative Decoding)框架 DSpark,推理速度提升 80%。 DSpark 已被部署在 DeepSeek-V4(Flash 和 Pro)的真实线上流量中。 报告:《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》 https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
Meta 本周发布 Astryx(Beta),一个基于 React 和 StyleX 的开源设计系统。项目包含 90 多个 React 组件、模板和主题,内置十个可定制主题(default、neutral、chocolate 等),通过 CSS 变量级联实现全局统一样式。Astryx 提供 CLI(astryx/xds)和 MCP 服务器,可输出自描述 JSON 清单,AI 智能体无需解析 --help 即可直接调用命令搭建和文档化 UI。组件具有上下文感知间距补偿功能,消除双重内边距问题。许可证为 MIT。
装上了 @wey_gu 的knowledge mem,配置了MCP AI对话记忆,还有个人知识库还是挺关键的,等我试试体验下。 下载地址见评论区
DeepSeek 联合北京大学发布 DSpark 推理加速框架,已部署于 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 预览版。DSpark 采用半自回归架构与置信度调度验证机制,在同等吞吐量下将单用户生成速度提升 60% 至 85%。在 Qwen3 系列和 Gemma4-12B 的离线测试中,DSpark 平均每轮接受长度优于 Eagle3 和 DFlash。生产环境下,V4-Flash 引擎在 80 token/s SLA 下吞吐量提升 51%,120 token/s 时提升 661%。相关论文、训练代码已在 GitHub 开源。
美满电子(Marvell)6月24日发布Structera X和Structera A两款CXL控制器,集成CDB压缩-解压硬件模块,实现内联LZ4无损压缩。压缩比最高3.64x(Database nci数据),全零页面达64:1。Structera X定位CXL内存扩展,支持DDR5/DDR4,最大6TB/4TB容量,200 GB/s带宽,配备4个ARM Cortex-M7核心;Structera A面向近内存加速,集成16个Arm Neoverse V2核心、64MB末级缓存及4个DDR5-6400通道。两者均支持内联XTS-AES 256位加密,为首批将硬件内联内存压缩写入OCP规格的产品。
阿里千问输入法 macOS 版今日上线官网,支持最快 300 字/分的 AI 语音输入,可自动润色、将口语转为工整文字,并支持 9 种方言,纯净无广告。官方预告 iOS、Android、Windows 版将于近日发布。此前千问团队已于今年 5 月推出千问语音输入法(千问 App 内的组件),具备去语气词、纠错、格式化整理及基于上下文的智能回复等能力,而本次上线的输入法则定位为独立 App,填补千问在移动端 AI 输入法赛道的空白。
谷歌今年 5 月宣布将 Play 商店集成至 Gemini 助手,现已逐步推送。用户可在 Gemini 聊天窗口中直接搜索、安装应用或进行内购,无需离开 Gemini。例如,询问"帮我找一款可以规划每周吃什么的 App",Gemini 会搜索并跳转至 Play 商店详情页。该功能需年满 18 周岁,仅支持个人账号,且 Android 设备需安装 Play 商店。
6 月 26 日爆料显示,苹果 iPhone 18 Pro 搭载的 A20 Pro 芯片将采用 WMCM 封装替代 A19 Pro 的 PoP 方案。DRAM 从芯片顶部移至侧面,以改善高负载下的散热。A20 Pro 支持 96-bit 位宽 LPDDR6 内存,Neural Engine 面积变大,整体封装尺寸与 A19 Pro 接近。
这哥们真是个天才, 直接把大模型 API 的商业模式干穿了,OpenAI 大概率不喜欢这个项目🤣
开发者 @miyumiyuna5 制作了一款实时换脸AI工具,支持直接拖拽任意人物照片到界面,瞬间将直播摄像头中的人物替换为目标形象。该工具无需重新加载模型即可流畅运行,实现低延迟的实时换脸效果,甚至能让大叔秒变美少女。
IT之家 6 月 27 日报道,Anthropic 正测试移动端 Claude Cowork,用户可直接在手机上发起并调整任务。Cowork 是桌面导向的智能体工作模式,可创建文档、生成表格、撰写报告。手机端被定位为远程控制器,用于发起任务、调整方向和查看进度,可能无法获得与桌面端完全一致的能力。Cowork 于 2026 年 1 月发布,代码由 Claude 完成,初期仅向 Mac 端 Claude Max 订阅用户开放。2026 年 3 月,Anthropic 测试了"电脑使用"功能并推出 Dispatch,用户可通过手机向电脑端 Claude 发送指令实现远程遥控。
browser_use 明日上线新云智能体,可制作样式化海报页面,比纯文本更直观,还能做更多。MiniMax 表示期待开发者尝试,好奇其背后模型。
微软计划在 2026 年 7 月为 Windows、macOS 及网页版 Microsoft Teams 推出 Recap 功能。该功能集中展示用户最近 30 天内的会议录制、文字转写、AI 生成摘要、聊天记录、任务、共享文件及发言人标记等,支持搜索、筛选、缩略图/列表视图。基础功能遵循现有访问控制;高级 AI 功能(如智能摘要、音频/视频回顾)需 Microsoft 365 Copilot 许可证。
向 @GoogleAIStudio 中的设计变体说声你好,制作一个应用,迭代它,然后探索变体,将你的想法引向新方向 : )
OpenMontage开源,将视频生产拆为12条pipeline,内置52工具、500+ agent skills。用户自然语言驱动agent完成调研、脚本、素材、剪辑全流程,支持AI与真实素材混合,含预合成验证、后渲染自检等质量控制,渲染引擎为Remotion+HyperFrames。发布单日获3000 Star。
Google 为 AI Studio 发布了设计变体功能! 选中后,该功能会生成多个设计提案,用户可将其应用于自己的 Build 应用。 主题支持也在计划中👀
新增 `CLAUDE_CODE_DISABLE_MOUSE_CLICKS` 环境变量,可在全屏模式下禁用鼠标点击/拖拽/悬停,保留滚轮。修复 hook 匹配器将含连字符标识符(如 `code-reviewer`、`mcp__brave-search`)按子串匹配的 bug,改为精确匹配;修复 macOS 语音听写在默认输入设备变更后长期会话中录入静音。改进 Linux 语音模式区分"无麦克风"与"未安装 SoX",优化 agent 完成列表垂直空间利用及远程会话启动资源清单显示。
团队完成了工作,带点辣味。 OpenAI 设计并制造了首款 AI 芯片:Jalapeño。该芯片由 OpenAI 从零开始设计,并与 Broadcom 合作量产,专为支持 ChatGPT、Codex、API 及未来智能体产品的 LLM 工作负载而打造。芯片是 AI 经济的基础。自研芯片扩展了从产品到模型再到基础设施的全栈平台,将助力扩展智能、服务更多用户并扩大 AI 的普及。
对于 GPT 5.6 Sol,高达 750 tokens/sec。 当前 GPT-5.5 优先和规模层级服务宣称 99% >50 tokens/sec,因此 Cerebras 上的 Sol 声称达到该速率的 15 倍。 这个巨大数字来自专门的推理硬件:Sol 运行在 Cerebras 上,其晶圆级芯片旨在以远少于普通多 GPU 设置的存储和网络延迟来移动模型数据。
一个 GitHub 项目实现了在 Claude、Codex 和 Cursor 中直接进行智能模型路由。
Perplexity 于 2026 年 6 月 24 日面向 Enterprise 和 Max 订阅用户推出 Computer for Counsel。该系统将法律任务自动拆解为子任务,并路由 20+ 个前沿 AI 模型分别处理研究、推理、合同等工作。数据层通过 MCP 协议连接 Midpage(美国案例法 + 引用)、Deel、LegalZoom 等专业法律源,以及 Docusign、NetDocuments、Box、Microsoft 365、Google Workspace 和 400+ 其他工具。每个输出均链接至原始来源,律师可一键核验。Computer for Counsel 并非替代 Westlaw 等数据库,而是叠加其上的研究、起草与工作流层。
应大家要求,Model Sets 现已上线!你可以保存自定义的模型选择,并立即将其应用于所有图表。
应大众需求,Model Sets 现已上线!你现在可以保存自定义的模型选择,并立即将其应用于所有图表。
从绿幕和单个盒子到完整的电影级场景。 Seedance 2.0 保留原始运动和构图,同时无缝生成场景其余部分。 电影级视觉特效,如今大大简化。
Moxt 更新了多agent编排的工作流。 支持自动一群 Agent 帮你协作完成任务,而且还能重复驱动完成更长的任务
一支研究团队通过完整颅骨对活人脑部进行超分辨率超声成像,获得了迄今最详细的脑血管三维图像。该技术利用FDA批准的微泡造影剂实现超衍射极限定位,体积分辨率比CT高100倍。团队已开源完整处理流程和数据集。下一步目标是无需造影剂的神经血管成像,依靠硬件小型化和端到端机器学习从每小时TB级原始数据中提取更多信号。