人大 DeepAnalyze 免费体验通道开启!上传数据,坐等报告!
……
这些困扰无数分析师、科研人员甚至业务人员的难题,如今有了一个全新的答案:
中国人民大学信息学院、数据工程与知识工程教育部重点实验室范举教授团队正式发布了面向数据科学的 Agentic 大模型——DeepAnalyze,旨在推动数据科学从传统的“工具型分析”迈向“智能体驱动分析”的新范式。目前,DeepAnalyze 的模型权重、代码及训练数据已全面开源,相关研究的论文预印本也已同步上传至 Arxiv。

为帮助更多人工智能与数据科学爱好者快速熟悉上手使用 DeepAnalyze 这一提效工具,2025 年 11 月 27 日,和鲸社区特邀中国人民大学信息学院助理教授,RUC-DataLab 团队骨干张绍磊博士做客和鲸直播间,从数据源到数据分析报告为与会观众一一解密。
过去的大多数类似工具,更像是一个设定好程序的机器人,这要求我们必须提前规划一条完整的工作流。但现实世界的数据远比预设的复杂。混乱的、不完整的数据让分析过程也充满了不确定性,可能中途发现异常值需要溯源,可能某个维度的趋势意外显著,需要临时调整建模策略。真正的数据科学,是一场探索,而非流水线。
- 课程式 Agentic 训练方法:让大模型在真实环境中从单一任务到复合任务渐进式学习,逐步提升能力,避免强化学习在复杂任务上失效。
- 面向数据的轨迹合成框架:自动化合成了 50 万条数据科学的推理与交互数据,为模型在庞大的搜索空间中提供正确路径的指导。
区别于 Jupyter Notebook、Pandas 等传统工具,DeepAnalyze 不仅能执行代码,更能主动规划分析路径、动态调整策略、自我验证结果,真正实现“以智能体为核心”的数据分析范式跃迁。张绍磊博士不仅系统介绍了 DeepAnalyze 的技术架构,还现场演示了其在金融支付数据场景下的端到端分析能力——从上传多源文件到自动生成含风险洞察、可视化图表与总结建议的 PDF 报告,全程无需人工干预。

观众围绕 DeepAnalyze 的分析思路定制、SQL 生成准确性、多 Agent 协同、数据安全与本地部署等话题踊跃提问,张博士一一进行了细致解答。整场直播互动频繁,气氛热烈。
- Notebook 交互:在 Jupyter Notebook 环境中,直接调用 DeepAnalyze,实时观察其生成代码、执行分析、产出结果的全过程。
- Web UI 交互:通过专为 DeepAnalyze 打造的前端界面,直接上传数据文件、输入分析指令,即可坐享一份完整的分析报告。

*免费体验限 7 天时间

让 AI 成为你的数据科学伙伴!和鲸欢迎广大数据从业者、科研人员与 AI 爱好者积极参与开源共建,一起推动自主数据科学的未来!
- 项目主页:https://ruc-deepanalyze.github.io
- 论文链接:https://arxiv.org/pdf/2510.16872
- 代码仓库:https://github.com/ruc-datalab/DeepAnalyze
- 模型权重:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
- 数据集:https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K
- 社区交流:欢迎扫码加入“DeepAnalyze交流讨论群”,参与功能建议、应用分享与协同研发。

渠道合作
