1/5

5条科技热门 Day 025 | Gemini 3.5 Flash · NVIDIA三模式LLM · ByteDance Lance开源

Day 025 精选 5 条跨源最高热度内容:Google I/O 2026 发布 Gemini 3.5 Flash(速度 4×、成本减半、Gemini Spark 个人智能体上线);NVIDIA 发布 Nemotron-Labs-Diffusion 三模式语言模型(AR+扩散+自投机,GB200 单用户 850 tok/sec,5.9× 提速);ByteDance 开源 Lance 3B 统一多模态模型(图像+视频全任务);Hugging Face 工程师复活 PapersWithCode;Meta Q1 赚 $56B 仍裁员 8000 人付 AI 账单。

2026. 05. 20. 09:07:07

갤러리

Day 025 精选 5 条跨源最高热度内容(2026-05-20):Google I/O 2026 发布 Gemini 3.5 Flash(速度 4×、成本减半);NVIDIA 发布 Nemotron-Labs-Diffusion 三模式语言模型(自回归+扩散+自投机,GB200 上 850 tok/sec);ByteDance 开源 Lance 3B 统一多模态模型;Hugging Face 工程师复活 PapersWithCode;Meta Q1 赚 $56B 仍裁员 8000 人以支付 $1450 亿 AI 预算。

01 / Google I/O 2026:Gemini 3.5 Flash 全面发布,速度 4×、Spark 个人智能体上线

Gemini 3.5 Flash 是 Google 发布的最新前沿级轻量模型,在几乎所有基准(包括 GDPVal)上超越 Gemini 3.1 Pro,速度是同类前沿模型的 4 倍,定价不足同类前沿模型的一半。1
本届 I/O 三大新品:
  • Gemini 3.5 Flash:今日向所有用户全面开放(API + Gemini app),面向智能体编码与长期任务优化;3.5 Pro 下月推出
  • Gemini Omni Flash:任意输入→任意输出的多模态模型,首批支持视频输出,已在 Gemini app、Google Flow、YouTube Shorts 上线
  • Gemini Spark:跑在 Google Cloud 专属虚拟机的 24/7 个人 AI 智能体,基于 MCP 协议接入第三方工具,下周向美国 AI Ultra 用户开 Beta
开发者平台同步升级:Antigravity 2.0 扩展为独立桌面平台,支持管理自主 AI 智能体集群;Gemini CLI 及 Code Assist IDE 扩展将于 6 月 18 日停止为 Pro/Ultra 付费用户以外的请求提供服务。2
링크 미리보기를 불러오는 중…

02 / NVIDIA Nemotron-Labs-Diffusion:首个三模式语言模型,自投机解码 5.9× 加速

Nemotron-Labs-Diffusion 是 NVIDIA Research 发布的三模式语言模型族(3B/8B/14B),同一套权重在推理时可无缝切换三种解码模式:3
模式原理场景
Autoregressive(AR)逐 token 标准解码低并发、高准确
Diffusion并行多 token 解码高并发、高吞吐
Self-Speculation扩散路径草稿 + AR 验证,共享 KV cache单用户极速
关键性能数据:8B 模型在 GB200 上单用户 850 tok/sec(AR 仅 253),相当于 3.3×;与 Qwen3-8B(无 MTP)相比,tokens/forward 提升 5.9×,精度对齐。模型全系已开源至 HuggingFace,下游 SGLang 已支持。4

03 / ByteDance Lance:3B 参数统一多模态,图像+视频理解/生成/编辑一模通吃

Lance 是字节跳动 Research 开源的轻量统一多模态模型,仅 3B 激活参数,支持图像理解、图像生成、图像编辑、视频理解、视频生成全部五类任务,在同类基准上与规模更大的模型竞争。5
亮点:
  • 从零开始训练(无预训练底座继承),在 128 块 A100 的算力预算内完成
  • 采用多任务协同训练(multi-task synergy),各任务相互增益而非互相干扰
  • 完整代码与权重已在 HuggingFace 公开发布
링크 미리보기를 불러오는 중…

04 / Hugging Face 复活 PapersWithCode:ML 社区「论文+代码」索引重回舞台

paperswithcode.co 正式上线——Hugging Face 工程师 Niels Rogge 独立重建了停更已久的 PapersWithCode,使用 AI 智能体解析论文并自动生成排行榜,目前已收录 Qwen 3.5、RF-DETR、DINOv3 等高影响力论文。6
主要特性:
  • Trending 按 GitHub star 增速排序,每日更新
  • Leaderboards 覆盖 MMTEB、COCO val 等主流基准
  • Methods 页收录 RLVR、FlashAttention 等技术原语
  • 支持 Arxiv 以外的外部论文(如 DeepSeek V4)
  • Terminal Bench 2.0 等 Harness 编程 Agent 基准已接入
原 PapersWithCode 于 2021 年被 Meta 收购后基本停止维护。此次由社区自发重建,被 r/MachineLearning 评为「ML 社区的重大里程碑」。
링크 미리보기를 불러오는 중…

05 / Meta Q1 营收 $56B,仍裁员 8000 人以支撑 $1450 亿 AI 资本支出

Meta 宣布裁员约 8000 人(约占员工总数 5%),同期公布 Q1 2026 营收 $56 Billion,创历史新高。这轮裁员主要目的是为 2026 全年 $1,450 亿的 AI 基础设施资本支出腾挪预算。7
背景:Meta 去年已在 AI 领域押注 $600 亿以上,Llama 系列、Meta AI 助手、Reality Labs XR 均列入优先项。此次裁员主要集中在「不够高效」的业务条线,高管称公司正从「规模驱动」转向「AI 效能驱动」的用人逻辑。
「盈利了还在裁,说明 AI 的时代不是人少了工作多,而是用 AI 代替更多人。」——r/artificial 高赞评论

来源:Google Blog · Mashable · HN · Reddit r/LocalLLaMA · Reddit r/MachineLearning · Reddit r/artificial · HuggingFace · arxiv · NVIDIA Research

댓글