AI每日新闻简报 – 2026年01月28日 – ZJR

🤖 AI每日新闻简报

2026年01月28日 | 由AI自动整理发布

📰 今日重点新闻

1. Kimi K2.5 开源发布：视觉代理 SOTA 与 Agent Swarm

月之暗面（Moonshot AI）发布 Kimi K2.5，横扫 HLE、BrowseComp、MMMU Pro、VideoMMMU 与 SWE-bench Verified 等多项基准。支持聊天、图像、视频转美学动态网站。Agent Swarm beta 允许 100 子代理并行，工具呼叫效率提升 4.5 倍。

这标志着中国AI公司在开源领域取得重大突破，特别是在视觉代理和多代理协作方面达到了新的技术高度。Agent Swarm的并行能力使得复杂任务的处理效率大幅提升，为AI应用开发者提供了强大的工具。

⭐ 重要性：高 |
来源：@Kimi_Moonshot

2. OpenAI 发布 Prism：GPT-5.2 驱动的免费科研协作平台

OpenAI 推出 Prism，为科学家打造的云端 LaTeX 原生工作区。GPT-5.2 直接存取论文结构、方程式与参考文献进行上下文辅助，支持无限项目与协作者。目前已向所有 ChatGPT 个人账户开放。

Prism平台的推出标志着AI开始深度介入科研工作流程，不仅提供写作辅助，更能理解论文的结构化内容。这将大幅提升科研人员的工作效率，特别是在文献整理、公式推导和论文写作方面。

⭐ 重要性：高 |
来源：OpenAI

3. Arcee 发布 Trinity-Large-Preview：400B 参数稀疏 MoE 模型

Arcee 推出 Trinity-Large-Preview，400B 总参数的稀疏 MoE（Mixture of Experts）模型，13B 活跃参数。目前在 OpenRouter 限时免费使用，标志着开放前沿模型门槛大幅降低。

稀疏MoE架构使得大规模模型的推理成本显著降低，同时保持高性能。Trinity-Large的发布表明开源社区正在缩小与闭源模型的差距，为更多开发者提供了接触前沿AI技术的机会。

⭐ 重要性：高 |
来源：Arcee AI

4. Grok 4.20 在 PredictionArena 夺冠：唯一盈利模型

xAI 的 Grok 4.20 成为 PredictionArena 唯一盈利模型，账户价值增长 10.76%，领先 Gemini 3.0 Pro 和 GPT-5.2。这一成绩证明了 Grok 在预测任务上的卓越能力。

PredictionArena是一个测试AI模型预测能力的平台，Grok 4.20的胜出表明其在理解和预测复杂事件方面具有独特优势。这对金融、市场分析等需要预测能力的应用场景具有重要意义。

⭐ 重要性：高 |
来源：xAI

5. Google AI 推出 Agentic Vision：图像代理推理

Gemini 3 Flash 实现图像代理推理，通过”Think-Act-Observe”循环生成 Python 代码操纵图像，视觉基准提升 5-10%。这标志着AI从被动的图像识别向主动的图像理解和操作转变。

Agentic Vision使AI能够像人类一样思考如何处理图像，而不仅仅是识别图像内容。这种能力对图像编辑、医学影像分析、自动驾驶等领域具有革命性意义。

⭐ 重要性：高 |
来源：Google AI

6. Manus 发布 Skills 系统：一键将对话转为可重用技能

Manus 允许用户一键将对话转为可重用的专家技能，通用代理可即时变身为流量分析、社群内容等特定领域专家。这一创新使AI助手的能力可以被积累和复用。

Skills系统解决了AI助手”健忘”的问题，用户可以将成功的对话经验转化为可复用的技能包。这使得AI助手能够在特定领域持续进化，为企业和个人提供更专业的服务。

⭐ 重要性：中 |
来源：Manus

👀 值得关注的新闻

新闻标题	推荐理由
Kimi K2.5开源发布	中国AI公司在视觉代理和多代理协作领域取得突破
OpenAI Prism科研平台	AI深度介入科研工作流程，提升论文写作效率
Arcee 400B参数模型免费开放	开源前沿模型门槛大幅降低，更多开发者可接触
Grok 4.20预测能力夺冠	在预测任务上超越GPT和Gemini，展现独特优势
Anthropic揭露诱发攻击风险	AI安全研究发现新型攻击方式，引发安全关注

📊 今日AI动态总结

今日AI领域呈现出”开源与协作”的双重爆发态势。技术开源层面，Kimi K2.5的开源将视觉代理能力推向新高度，Arcee的400B参数模型免费开放标志着开源前沿模型门槛大幅降低；科研协作层面，OpenAI的Prism平台通过GPT-5.2深度赋能科研工作，AI开始深度介入科研工作流程；代理能力层面，Google的Agentic Vision实现图像代理推理，Manus的Skills系统使AI能力可积累和复用，标志着AI正从单一对话工具向具备复杂推理和专业技能的”代理（Agent）”时代加速跨越；模型性能层面，Grok 4.20在预测任务上的胜出展现了不同模型的差异化优势；安全挑战层面，Anthropic揭示的诱发攻击风险提醒我们，模型能力的提升也带来了新的安全思考。整体来看，AI技术正在从封闭走向开放，从通用走向专业，从被动响应走向主动代理。

本文由 ZJR.AI 自动生成发布
每日早上9点更新 | 如有问题欢迎联系我们

AI每日新闻简报 – 2026年01月28日

🤖 AI每日新闻简报

📰 今日重点新闻