时间:2025-06-24来源:爱酱手游网
本站 6 月 21 日消息,本站从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。
Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。其后,月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。
对于每一个问题,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果:
澄清问题(clarification):理解问题时主动反问,构建更清晰的问题空间;
深入思考:每个任务平均进行 23 步推理,自主梳理并解决需求;
主动搜索:每个任务,平均规划 74 个关键词,找到 206 个网址,由模型判断并筛选出信息质量最高的前 3.2% 内容,剔除冗余、低质信息;
调用工具,交付结果:自主调用浏览器、代码等工具,处理原始数据、自动生成分析结论,端到端完成交付。
为了保证输出的质量和信息覆盖度,Kimi-Researcher 采用异步执行方式,用更多时间逐步推理、检索和撰写内容。
用户最终将收到 2 个交付成果。
一份信息详实、可溯源的深度研究报告
报告的平均长度在万字以上;
平均引用约 26 个高质量、可溯源的信源;
所有引用都内嵌在正文中,点击即可跳转,并高亮原文,便于验证与追溯。
一个可交互、可分享的动态可视化报告
结构化排版、思维导图,让趋势、异常等重要信息一眼可见;
无需阅读全文,也能迅速把握整体结构与核心结论;
支持在线生成链接并分享,方便展示。
官方宣布,在专为 AI 设计的高难度 benchmark“人类最后一次考试(Humanity"s Last Exam,HLE)”中,Kimi-Researcher 在完全零结构、无流程设计的设置下,得分如下:
Pass@1 准确率:26.9%
Pass@4 准确率:40.17%
这一表现超过了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%)打平,是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系,Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率,领先该榜中其他模型。
上一篇:香香腐宅2025官方正版下载-香香腐宅2025官方正版下载最新版本v1.23
下一篇:Astell&Kern 推出 SP4000 旗舰 Hi-Fi 播放器:四通道 DAC、1:1 架构,28888 元
网发此文仅为传递信息,不代表认同其观点或证实其描述。同时文中图片应用自网络,如有侵权请联系删除。
标普油气ETF融资活跃,6月23日净买入137万,融资融券余额近3千万
2025-06-25 11:10非独立版本:华为 WATCH 5 鸿蒙 AI 智能手表微信 App 为蓝牙版
2025-06-25 11:09抖漫动漫2025免费版下载-抖漫动漫app官方下载2025免费追番v1.1
2025-06-25 11:08神漫堂免费版下载手机版app-神漫堂免费版下载正式手机版安装v1.2.1
2025-06-25 10:50机械革命推出无界 14X 斗战版, AMD R7 8745HS 处理器,16+512GB 售 2999 元(国补 2399.2 元)
2025-06-25 10:49