人工智能公司开发负责人董召杰介绍,电网图片缺陷库数据多,覆盖了好几十种类型,以前是靠人对着图片找相应类型的精确图片,而现在直接通过对话来找,既省时又省力。
再比如,在对话框输入,“找一个有鸟巢的图片”,系统可以自动检索出来。鸟儿喜欢在电网上筑巢,对电力行业来说并不是什么好事——遇上下雨天可能会倾覆,引发短路,影响电力供应。
算法专家赵必美演示用大模型自动检测图片,输入“帮我看一下这张图片有哪些部件,以及存在哪些缺陷。”很快,大模型便给出了检测结论,在图片中一块非常不起眼的地方,缺失了一块玻璃绝缘子。
电力系统作为重要基础设施,输电通道损坏少,所以缺陷样本稀少,过去的AI模型通常需要几百张的缺陷样本才能完成训练,而计算机视觉大模型仅需要数十张照片就可以完成训练。
传统的AI模型到达一定程度后,准确率很难继续提高,而使用大模型相关技术后,模型的准确率比以往提升了10%,能够更好地识别电线、电房、电站的缺陷。
传统的AI模型往往需要重复和枯燥的大量的数据标注工作,而大模型可实现数据自动化标注,让员工有时间做更有价值的工作。
“电力系统大模型是语义大模型和视觉大模型的融合,电力系统的场景非常复杂,我们为此做了大量的微调(FineTune)工作,按照指示学习的技术原理,以适应多任务的操作。”人工智能公司副总经理、南方电网公司高级技术专家梁寿愚也表示,这意味着,训练出来的电力系统大模型既要懂专业知识,还要能生成解决方案及其步骤。
电力调度:极端情况下秒级出方案胜过老师傅
除了图片检索外,大模型在电力系统中的另一大应用就是电力调度。
在防误操作中,如果遇上线路停电,按照传统的流程机制,要先断开中开关,再拉开边开关,再由程序员将代码“锁定”,这适用于日常已形成流程化的工作。
大模型的不同之处在于,它会针对操作指令做语义分析,结合知识图谱,找到相应任务和设备的操作,因此可以针对一些新的突发状况做灵活处理。
大模型深入产业,也使得企业的知识与经验的传承模式发生深刻的变化:在电力调度中,老师傅将掌握规程的经验,沉淀成为电脑中的模型,通过一段文字呈现出来,大模型根据这句话做语义分析,能够理顺不同主体之间的关联关系。
“AI调度机器人目前比较适合平稳状态下的电力调度,但在极端天气、遭遇攻击、故障处理等情况以及预案演练等场景下如何实现智能决策,还需要进一步研究。”梁寿愚说。电网操作是实时的,绝大多数是秒级完成处理,大规模电网对象接入后,新型电力系统的秒级实时调控是一个世界性难题,调度员在调度台上,常用危险断面控制就有五六百个,不常用的则有上千个,如此庞大的控制指令需要借助大模型拟合快速出策略。
人工智能公司提供了不少特定场景下的小模型,如智能巡检、三维建模等,也由此建设了行业人工智能基础设施,并开始提供大模型的训练基础设施、算法、训练和微调服务,服务于电力的发输配变用调等各个方面。
AI在电力调度上的成效,也确实让人眼前一亮。今年年初,由南网总调和电机工程学会电力系统自动化专委会主办的第四届电力调度AI应用大赛上,基于电网实时运行数据,22支参赛队伍开发、训练及部署了的AI在线调度员,前三名在计算时间、危险断面控制、清洁能源消纳、系统运行成本等维度都超过了人工。
变革:以大模型为入口向终端应用扩散
悄然间,大模型带来的不仅是工作效率的提升,还是工作方式的变革:过去,年轻的工程师拿了一张图片,得找人问一下,或者上传图片到系统上找专业人士来咨询。但实际上这有一定的壁垒——上传到指定线路,专业人士也要有权限、登陆账号,做完一系列操作才能得到结果。
接下来,各业务系统将与电力大模型结合,大模型可以理解为一个大底座,不同的业务系统就像插件一样放上来。比如说,云景系统,是一个全网生产运行的平台,集成了电量、负荷、充电桩工作情况等实时数据,通过插件或接口方式,接入到大模型后,在一个“框里”就能查看,不需要再登陆云景系统。
伴随着技术的进步,大模型的广泛应用能够以较低成本解决好困扰能源行业多年的问题,为行业的进一步发展起到推动作用。同时,大模型在认知智能上的突破,可以让AI比以前更好、更深度地掌握行业知识,成为行业专家,以更高效、更容易理解的方式辅助人类工作。
随着各家科技公司纷纷入局大模型,梁寿愚对此认为,这不意味着大模型门槛就低,行业数据依然是最大的痛点,特别是在搜集文档形成提示样本方面还需要下功夫。以人工智能公司为例,负责整理文档、数据和撰写提示(prompt)这些“脏活”的劳务团队就超过40人,与OpenAI这方面的劳务投入是对应一致的,否则大模型会“学不到电力系统知识,或者学到不应该学的”的东西。
更多的技术公司则陷入“拿着锤子找钉子”的误区——拿着技术去找场景,这显然是一种本末倒置的行为;技术应该帮助提高人的技能并实现降本增效,正如工业场景中的缺陷检测,首先应该是帮助员工,而不是取代员工。
在智慧能源领域,基于百度“文心”系列大模型及领先的深度学习、知识图谱增强等技术,构建了千万级电力文本样本库和电力行业知识图谱,联合训练电力行业NLP大模型,在电力专业分词、电力营销敏感实体识别F1指标分别提升9.27%、13.28%,达到92.376%和94.947%,显著增强了设备及电网运营的自动化、智能化水平。
大模型相关信息:
在过去几个月中,随着ChatGPT在全球范围迅速火爆,国内AI大模型赛道的热度也随之急速升温。各路业界大神纷纷推出自己的大模型产品,百花齐花,各显神通。
谁将打造出比肩ChatGPT的中国人自己的AI应用?谁将成为中国的Open AI?这两个极具挑战性的问题,不断刺激着国内众多互联网大厂和科技大佬们的神经。同时,这两个问题的提出,也预示着中国AI产业发展趋势,已经从1.0版的“分封割据”期,迈入了 2.0版的“战国”时代。围绕“大模型”的发布,国内AI界正在上演着一场“大混战”。
大模型的背后是新一代信息技术的发展和支撑,大模型的应用正在催生各行业新一轮的数字化转型。AI技术在电网数字化转型中起着重要的作用,以下是一些AI技术在电网数字化转型中的应用:
数据分析和预测:AI技术可以处理大规模的电网数据,通过深度学习和机器学习算法进行数据分析和建模,准确预测电力需求、负荷波动、能源供需情况等。这有助于电网做出合理的决策,提高电网的运行效率。
智能优化调度:AI技术可以自动化地进行电力系统的优化调度,通过模拟和优化算法找到最优的供电方案,优化发电机组的运行策略,调整输电线路的配置等。这有助于减少能源浪费和损耗,提高电力系统的效益。
能源管理与智能控制:AI技术可以在实时监测电网状态的基础上,为能源管理系统提供智能化的控制策略。通过对电力设备和用户能源消耗行为的建模和分析,AI可以实时调整能源分配和供应策略,实现能源的最优利用。
智能维护与故障预警:AI技术可以结合传感器数据,对电力设备进行智能维护和故障预警。通过对设备状态数据的监测和分析,AI可以及时发现设备异常和潜在故障,并提供准确的预警信息,有助于实施精准的维修和保养,提高电网设备的可靠性和安全性。
智能交互与用户服务:AI技术可以为用户提供智能化的交互和能源管理服务。通过语音识别、自然语言处理和智能推荐等技术,AI可以实现与用户的智能对话,了解用户的能源需求和偏好,提供个性化的能源消费建议和优化方案。
这些应用说明了AI技术在电网数字化转型中的重要作用,可以帮助电网实现智能化和自动化管理,提高运行效率和系统的整体性能。
在大模型落地的过程中,越来越多的国内企业开始采用开源大模型。
一位南方电网人士透漏,内部现在进行大模型尝试时,“都是基于Llama吧”。Meta公司在今年7月发布了开源可商用大模型Llama 2,包含了70亿、130亿和700亿参数3个版本。另一位南方电网人士称,内部对不同开闭源模型正进行测试赛马。
8月,金蝶发布的财务大模型,也基于开源大模型训练而来。金蝶CTO赵燕锡告诉数智前线,就像手机操作系统有iOS、安卓一样,开源模型要打造生成式AI的安卓系统,国内有像清华ChatGLM,国际上有MPT、Llama,未来是一个多模型合作的想法。
在金融领域落地中,有资深人士告诉数智前线,开源、闭源大模型都有,因为各金融机构体量不一,策略也不一样。很多公司先在一个具体场景下用开源模型做出实际效果,再考虑复制推广,也有几个大行对平台做一些战略性投入,在闭源基础大模型上,建了一个类似于中台的平台,期望将来同时对接多个场景。
“之前我们自己训练了两个不同参数的模型,最近我们也在用开源。”中科深智CTO宋健告诉数智前线。他认为,目前绝大部分文本写作、上下文匹配,130亿参数的模型已够用,而三四百亿参数的模型,在解决很多垂类问题上已经足够,无论国内百川,还是国外的Llama,效果都不错。
一家物联网公司技术高管告诉数智前线,目前开源大模型发展较快,开源社区也发布了很多模型,大部分基于Llama 2微调而来。“我们也测试过很多开源和闭源模型,由于我们的目标市场需要多语言支持,会更多考虑Llama 2。如果是面向国内市场,一些国内的模型也很优秀。”
“选择开源和闭源,实际上各有优缺点。使用开源模型的好处主要是较为自由,包括部署、微调、升级和免费。闭源的好处是有质量保证,免自己部署和应用门槛较低。”上述资深人士介绍。
他选择开源的一个重要原因是认为,目前开源模型的繁荣和水平提高呈现一个明显趋势。他打了一个比喻,开源大模型的水平就好比海平面,闭源大模型相当于一个个岛屿。目前这些岛屿上涨的速度,跟不上海平面上涨的速度,大部分岛屿将会被海水淹没,可能世界上最后就剩下几座上涨比较快的岛屿。
模型本身现在可选的很多,多位业内人士也赞同,开源和闭源不是客户会关心的问题,“极少客户会去指定用哪一款模型”。因为客户并不直接使用基础大模型,最终客户是没有感知的。“客户更关心的是精度、速度和价格。当然最终保证无害性、合法性,这是应用开发商必须解决的问题。”上述物联网行业专家说。
张杰告诉数智前线,因为开源可商用大模型,每一款可能都有自己的优缺点,比如说有些适合做一些分类型的任务,有些性能比较好,有些可能就生成式的任务表现比较好,还是要根据具体场景,一些ROI的需求,选择不同的模型。
“总体来讲,我们觉得接下来大模型非常重要的趋势,就是开源。”中信建投证券武超则称,非标准化的场景,非标准化的算力,这种架构决定开源可能会是一个比较趋同的方向。
大厂们何以会有如此“整齐划一”的动作?
市场需求变化是一个因素。百度智能云AI与大数据平台总经理忻舟告诉数智前线,他们发现市场需求已逐渐进入深水区,仅文心一言一个模型,不能满足客户多样化需求,而如果能把一个平台做好,“会有更多的流量”。
业界观察,7月下旬,百度在对外表述中,已将原来的“文心千帆大模型平台”转变为“千帆大模型平台”,在做“去文心化”。
另一个现实因素是,大厂们单个项目报价普遍在千万元级别,闭源大模型暂时还没能有足够多的大项目落地。
此外,清华ChatGLM建立了有策略的、组合的商业模式,把小模型开源出去,吸引商机和生态,它的闭源大模型也可以为企业提供定制化服务。大模型厂商提供一个开源的但规模较小的大模型供大家使用,也是一种营销模式。
一位熟悉阿里云的资深人士也表示,他猜测,上述这些因素也是阿里开源两款大模型的重要原因之一。“走另外一条路试试看。”
而大模型变现的通路,并不只是模型本身。
数智前线获悉,华为在大模型上的考量,算力是重头之一。7月底到8月初,任正非就大模型有两次讲话,均与算力相关。
先是成立AI算力先遣队,由原煤矿军团团长邹志磊负责。任正非说,有4000个客户想要用华为昇腾平台去训练大模型。华为也将可能在10月成立15个小组去分别服务15个客户。之后,针对华为在《自然》杂志上发表的华为云盘古气象大模型的论文,任正非也谈及要“在新的淘金时代卖铲子”。
无独有偶,忻舟介绍,百度在大模型上的商业模式可分为两个层面。从文心一言这个大模型的角度讲,百度赚的是AI的钱。但千帆同时还是一个支持其他第三方模型的平台,本质上“还是云的思路,赚云的钱”。
此外,开源对生态建设也是百利而无一害。毕竟大模型被认为是智能时代的操作系统,而操作系统比拼的是生态,百度智能云AI平台副总经理李景秋认为,好的开源模型会极大吸引市场上创新公司关注大模型并参与其中,进而带来整个上下游服务生态的完善。
今年7月,阿里云也对外喊出“将促进中国大模型生态的繁荣作为首要目标”的口号。“这就类似于原来开源软件的模式,通过开源来吸引客户,建立产品的社区。”一位大模型领域资深人士表示。
该人士认为,无论国内国外、开源闭源,大模型的发布可能还会更多,具有通用基础能力的大模型,可能会集中到少数几个厂商,但具有行业细分的大模型,比较典型的像医疗、法律、教育,会有更多厂商去做。另外,基于大模型的能力做出来的应用级产品,会逐渐繁荣,形成一个新的生态和软件开发模式,“比如最近比较火的MetaGPT和ToolLLM”。