大模型辅助科研编程实录分享:效率飙升!“分分钟搞定”,智能体编排如何加速工作流

行业洞见
报道时间:2025-05-12

随着大语言模型的爆发式发展,AI工具链已深度嵌入科研全流程。基于此,2025年4月12日,和鲸社区联合上海人工智能实验室OpenDataLab平台主办的“大模型赋能科研分享会”圆满落幕。会上,来自香港城市大学的李浩鸣同学以“AI辅助科研编程:从数据分析可视化到应用发布”为题,基于自身实践,向现场及线上参会人员介绍了大模型辅助科研编程的实战案例。


分享嘉宾

微信图片_20250416160748.jpg

李浩鸣 

香港城市大学数据科学专业在读研究生

  • 熟悉数据科学核心方法论,包括机器学习算法、统计建模、深度学习和大语言模型算法等。

  • 熟悉多种编程软件和语言,包括R语言,matlab,SPSS,SQL和php等等,尤其擅长python开发。


分享实录

我今天分享的主题是从大模型赋能应用落地,涵盖从数据分析的可视化到企业级应用案例的演示。我目前是香港城市大学数据科学专业的在读研究生。我比较熟悉数据科学的核心方法论,也参与过数学建模竞赛、创新竞赛等赛事。目前,我在和鲸科技担任市场品牌部的SDR实习生。大家可能会比较疑惑,为什么我学数据科学,却在市场品牌部担任实习生?因为我觉得,工作内容本身所带来的价值与成长更为重要。


今天分享的内容围绕科研与实践展开。我在SDR岗位主要负责沟通客户、赋能销售工作。而如何利用大模型对我们的工作流进行优化,我认为这是一个极具价值的科研课题。接下来,我会通过两个简单的案例,带大家感受大模型的强大之处。


第一部分,是如何利用大模型进行科研数据分析与可视化绘图。这里用到的数据集,是我从公开网站上截取的关于航空公司客户满意度的数据。大家可以看到这些画出来的柱状图,我完全没有敲一行代码,全是通过大模型帮我实现的。现在,我带大家在ModelWhale上在线运行一下。


在这个文件里,我已经上传好了客户满意度的数据集。现在我们先看数据读取,这些代码,如果大家不熟悉,也不用担心,通过和鲸社区已经配置好的代码片段就可以实现,不需要深入了解代码是如何编写的。该数据集包含近 13 万条记录、22 个维度,涵盖分类变量、顺序变量和数值变量。如果按照传统方式,绘制数据可视化图表需要编写大量代码,但这次我全程零代码,仅通过大模型完成。


那如何了解这个数据集里每一个变量的唯一值呢?我通过DeepSeek来帮我实现。我下达的prompt是“如何遍历数据表中每一列的唯一值,请生成代码”。代码运行之后,把统计信息、唯一值和计数同时生成出来。不过,这样直接看数据还是不够直观。于是,我让大模型进一步了解数据集的维度。我将数据集的前十行赋给名为temp的变量,并要求大模型将这个temp以csv文件的形式另存再同一文件夹中。大模型根据这些信息,生成了一系列代码。我选取其中对分类变量进行可视化的代码运行,用户是否满意、客户类型、旅行类型、仓位等级等分类变量都以可视化图表呈现,变得更加直观。


接着,我又截取了一段代码,想对评分变量进行可视化。运行时却报错了,我直接把报错信息发给大模型,它很快就给出了解决方案,原来是Python的seaborn存在兼容性问题,按照大模型给出的修改说明,重新替换代码后,顺序变量的数据可视化图表就顺利生成了。之后,在处理年龄分布、航班距离分布等数据时,虽然也遇到同样的报错,但用同样的方法,都成功生成了对应的图表。上述这些案例说明,大模型能为科研绘图和数据可视化提供高效思路。


接下来,我给大家演示一下在企业场景中,如何利用大模型实现SDR工作流的效率提升。SDR 每天要对接市场提供的优质线索,与客户进行3至5场会议。以往,整理一场会议纪要、提取关键信息并传递给销售,需要数个小时,但借助大模型,整个流程可缩短在几分钟内完成。

微信图片_20250512104441.png

公司常用飞书协作,我设计了两种实现方案:一是调取飞书API实现数据写入;二是构建自己定制化的AI小程序。我以调用飞书API为例,将腾讯会议智能转写、飞书妙记提取的文字作为输入,通过DeepSeek-V3大模型生成 json格式化数据,再调用飞书API自动写入表格。基本功能实现后,我会对代码进行优化,提高代码的可读性,并进行封装,做成应用,这样公司其他同事,哪怕编程基础不太好,也能直接使用。


我给大模型的prompt是:“你是一个资深的飞书应用开发者,如何去实现数据写入的功能?”DeepSeek不仅给出代码,还详细说明关键步骤,如获取 access token、APP token和table ID。这里要特别注意,access token 有效期仅2小时,需要在企业自建飞书机器人应用,并配置APP ID和 APP Secret。


设置好会议主题、日期、重点内容等字段后,我先测试基本功能,数据顺利写入飞书表格。但实际会议纪要更复杂,于是我再次要求大模型扩充代码,实现智能结构化提取。大模型生成的代码添加了调试机制,即使遇到报错也能快速定位。我用一段非标准格式的会议纪要测试,运行后,大模型精准提取关键信息,自动写入表格,效率大幅提升。


这两个案例看似与传统科研项目无关,但从优化工作流、降低人力成本的角度看,它们同样具有科研价值。更多大模型赋能工作流的案例,比如微信客户批量添加、消息自动回复等,大家可以在Github搜索LHMQ878获取详细代码参考。


通过这两个案例,我们看到大模型在会议纪要处理、数据解析等场景中展现出惊人的效率。但随之而来的问题是:当技术能替代大量重复性工作,人类的角色是否会被削弱甚至取代?在我看来,大模型更像是一个 “超级实习生”,它能快速生成多种方案,但无法判断哪种最适合特定客群。因为它本质是数据与信息的重组,而人类需要明确目标,对其进行引导和干预。


微信图片_20250512104451.png

通过大模型,我们可以完成很多辅助工作,比如提高工作效率、撰写文案、生成代码等等。举个实践场景,假如你在凌晨三点需要赶PPT,不妨试试借助大模型,说不定能帮你高效完成。同时,与大模型交流时,提示词至关重要。这里我分享一个三维的提示公式:明确告知大模型你希望它扮演的角色,引导它按照特定方向思考,最后清晰说明你想要达到的效果。


在个人发展层面,人工智能已成为未来趋势,善用大模型的人将更具竞争力。作为学生或科研工作者,我们可以借助大模型快速学习专业知识,实现自我提升。正如Shopify CEO在内部备忘录中所说:“人工智能不再是选择题,而是生存的必须。” 希望大家都能拥抱这股数字化浪潮,让人工智能成为放大人类潜力的工具,而不是被其取代。


以上为实录分享内容~


微信图片_20250512104455.jpg

和鲸已上线系列智能体编排工具,提升多场景协作效率。如您对和鲸平台智能体编排工具感兴趣,欢迎点击这里体验,或联系工作人员体验(备注“智能体编排工具”)。
开启 AI 之旅新篇章,立即体验和鲸 ModelWhale 的云端协作魅力
数以万计的用户正在使用中
电话咨询
商务咨询请致电:
021-8037 0235(转6)
微信咨询
工具使用、办赛需求 欢迎联系我们