AI大模型行业应用市场洞察报告

1.AI大模型行业发展驱动因素

 1.1 AI大模型政策驱动

  • 从“十二五”到“十四五”规划,国家从宏观层面上对人工智能新技术、新产业给予巨大支持,顶层设计从方向性引导到强调落地应用与场景创新,进一步细化、深化。国务院于2017年发布《新一代人工智能发展规划》。科技部等六部门也于2022年印发《关于加快场景创新 以人工智能高水平应用促进经济高质量发展的指导意见》对规划进行落实。2024年《政府工作报告》中提出开展“人工智能+”行动。伴随人工智能领域中大模型技术的快速发展,我国各地方政府出台相关支持政策,加快大模型产业的持续发展。近期,北京、上海等地陆续出台大模型产业相关发展支持措施,旨在加速大模型应用落地,助力企业抢占AI发展新高地。
  • 2024年7月,《北京市推动“人工智能+”行动计划(2024-2025年)》(简称:《行动计划》)印发实施。《行动计划》明确,到2025年底,通过实施5个对标全球领先水平的标杆型应用工程、组织10个引领全国的示范性应用项目、推广一批具有广泛应用前景的商业化应用成果,力争形成3-5个先进可用、自主可控的基础大模型产品、100个优秀的行业大模型产品和1000个行业成功案例。依托首都优势行业资源和科技创新能力,围绕机器人、教育、医疗、文化、交通等5个领域组织实施一批综合型、标杆性重大应用工程,促进大模型核心技术突破,增强人工智能工程化能力,提高重点行业的科技水平和服务质量,形成大模型行业应用新生态。
  • 同期,上海市政府官网发布《上海市促进工业服务业赋能产业升级行动方案(2024-2027年)》(简称:《行动方案》)。《行动方案》明确,上海要聚焦人工智能在生产制造、研发设计中的落地应用,开发故障分析、流程工艺等工业语料产品,推动工业大模型发展,促进制造业全流程智能化。强化大模型在药物筛选、分子结构预测、药品检验检测等方面的应用。到2027年,上海将打造不少于100家面向中小企业的数字化、智能化转型服务平台;吸引不少于100家人工智能大模型生态企业在“模速空间”集聚。

1.2 AI大模型技术驱动

(1)技术现状与里程碑

  • 近年来,AI大模型得到快速发展,当前大模型热潮主要由语言大模型相关技术引领。语言大模型通过在海量无标注数据上进行大规模预训练,让模型学习大量知识并进行指令微调,从而获得面向多任务的通用求解能力。
  • 2022 年底,由 OpenAI 发布的语言大模型 ChatGPT 引发了社会的广泛关注。在“大模型+大数据+大算力”的加持下,ChatGPT能够通过自然语言交互完成多种任务,具备了多场景、多用途、跨学科的任务处理能力。2023年,OpenAI多模态预训练大模型GPT-4 发布,其具备多模态理解与多类型内容生成能力。2024年,OpenAI发布视频生成大模型Sora,提出时空碎片和扩散Transformer技术,大模型的多模态生成能力进一步走向成熟。
  • 大模型多模态生态能力的成熟化作为人工智能技术发展的新进展,人工智能现已经进入了以AGI 为代表的新里程碑阶段,而大模型正是通向AGI的最佳路径。AGI 技术能够精准识别人类情绪意图、理解人类语言、学习人类知识并进行类脑推理与创造。以 ChatGPT 为代表的人工智能技术已经具备 AGI 的核心技术和特征,能够自动化地学习任何可以符号化的知识及信息,不断自我优化,充分理解和流畅表达人类语言,同时逻辑推理能力强,实现了具备一般人类智慧的机器智能。

(2) 主流架构与关键技术

  • Transformer 架构是目前语言大模型采用的主流架构,于2017年由Google提出,其主要思想是通过自注意力机制获取输入序列的全局信息,并将这些信息通过网络层进行传递,Transformer架构的优势在于特征提取能力和并行计算效率。Transformer 架构主要由输入部分、多层编码器、多层解码器以及输出部分组成。其中,输入部分包括源文本嵌入层、位置编码器;编码器部分由N个编码器层堆叠而成;解码器部分由N个解码器层堆叠而成;输出部分包括线性层和Softmax 层。
  •  AI 语言大模型的关键技术涉及了基于人类反馈强化学习、指令微调、模型提示等相关技术。基于人类反馈强化学习是指将人类标注者引入到大模型的学习过程中,训练与人类偏好对齐的奖励模型,进而有效指导语言大模型的训练,使得模型能够更好地遵循用户意图,生成符合用户偏好的内容。指令微调是一种帮助语言大模型实现人类语言指令遵循的能力,在零样本设置中泛化到未知任务上的学习方法。让语言大模型理解人类指令并按照指令要求完成任务,即在给定指令提示的情况下给出特定的回应。它的特殊之处在于其数据集的结构,即由人类指令和期望的输出组成的配对,这种结构使得指令微调专注于让模型理解和遵循人类指令。模型提示技术是在大模型输入中设计合适的语言指令提示,来激发语言大模型作为通用任务求解器的潜在能力,主要包括指令提示和思维链提示。

1.3 AI大模型市场驱动

  • 中国AI大模型产业发展源于多领域的广泛需求,例如来自办公、制造、金融、医疗、政务等场景中降本增效、生产自动化、降低风险、提高诊断准确率、提高政务服务效率等诉求。相关领域的创新和发展共同推动着中国AI大模型产业的蓬勃发展,预示着未来更广阔的市场前景。

(1) 办公场景需求

  • 基于大模型的智能办公产品满足日常办公场景中文案生成、PPT美化、数据 分析等各种需求。仅通过自然语言交互,用户便可将繁琐的文字、演示、数据处 理工作交给“助理”,用节约的时间做更有创意的事情。智能文档负责协助用户 构建文章大纲、一键生成模板、生成内容、优化表达、处理和理解文档;智能演 示承担自动排版美化、生成演讲备注、一键生成幻灯片等任务;智能表格通过对话即可生成公式、数据批量处理、自动生成表格。
  • 智能会议方面,大模型可从会议策划、同声传译、会议记录等各环节赋能。会议策划场景大模型根据会议主题等提示词,自动生成会议环节、会议分论坛、会议时间、会议预算等完整策划内容;在大模型能力加持下,同声传译的准确性、及时性和多语言能力得到显著提升;通过大模型处理后,结构清晰、要点明确的会议记录结果使得会后回顾更加高效。

(2) 制造场景需求

  • 研发设计阶段:大模型+EDA/CAE/CAD,将传统研发设计软件效率进一步提升。以大模型+EDA为例,利用云端扩展性实现设计自动化,并确保设计在电气方面准确无误,同时简化系统设计流程,缩短PCB设计周转时间。企业借此缩短研发周期、降低研发成本、提升行业竞争力。
  • 生产制造中:大模型助力数字孪生和机器人,获得强大的感知场景和执行任务能力。利用AIGC 和数字孪生技术,可模拟真实生产环境派出虚拟人代替工人进行危险、故障排查,或是通过仿真设备操作场景,完成沉浸式作业教学。拥有大模型功能的机器人凭借机器视觉技术,可执行路径规划、物体识别等任务。
  • 供应链管理:大模型集成于供应链管理系统中,能重构数字化办公流程,通过自然语言指令实现人机交互,推动企业进行更高效的管理决策、更便捷的数据分析与可视化,在需求端及时预测需求达到降本增效的目的,在仓库和物流端实现智能调度、智能跟踪和智能预警。

(3) 金融场景需求

  • 金融行业存在前、中和后台的业务划分,在数字经济时代的浪潮中,相关业务已被大模型全局赋能提升效率。以银行为例,对话机器人、虚拟助理已经逐渐出现在个性化服务、电子营销、金融欺诈检测、信贷支持等服务场景中。
  • 个性化服务方面,银行大模型以客户数据为依据,为客户提供定制的财务和产品计划;电子营销方面,大模型根据客户行为偏好生成个性化电子邮件;金融欺诈检测方面,大模型赋能专业人员检索大量数据识别欺诈行为;信贷支持方面,大模型通过分析海量生产生活和信用数据,为信贷部门人员生成高质量的信贷方案建议,减少银行贷款收益损失。

(4) 医疗场景需求

  • 得益于近年来医疗大模型的不断迭代,复杂的医疗数据分析任务得以解决。由于患者行为数据的独特性,大模型通过个性化设计,满足患者“千人千面”的医疗服务需求,应用于智慧影像、智慧手术、智慧健康等领域。
  • 智慧影像覆盖CT、MR、DR、US、DSA、钼靶等医疗影像场景,为患者进行早期检测、诊断及健康风险评估;智慧手术功能大幅提高患者病情评价准确度,打牢术前风险评估、术中手术规划、术后预后估计的基础;智慧健康则作为一般患者的贴身健康助手,通过小程序等便捷方式为患者提供高质量导诊服务和个性化健康建议。

(5) 政务场景需求

  • 为提升效率,大模型利用自动化的政策检索、政策比对解决海量政策参考、人工分析比对的耗时问题;为缩小信息参考范围,政策撰写助手结合政策数据权威白名单,并接入政策全量库,避免不可靠信息来源引发舆论风险;为提高政策管理经验共享,大模型引入政策经验知识库,提升政务业务理解和政策管理能力;为规范政策撰写,政务大模型凭借规范化生成、检查功能维护成果的规范性、权威性。

2. AI大模型行业发展现状

2.1 基本介绍

(1) 内涵与特征

AI大模型是人工智能预训练大模型的简称,包含了“预训练”和“大模型”两层含义,二者结合产生了新的人工智能模式,即模型在大规模数据集上完成预训练后,仅需少量数据的微调甚至无需微调,就能直接支撑各类应用。这些模型通常具有多层神经网络结构,并使用高级的优化算法和计算资源进行训练,具有强大的泛化性、通用性和实用性,可以在自然语言处理、计算机视觉、智能语音等多个领域实现突破性性能提升。

AI 大模型的三大特征:泛化性、通用性、涌现性

(2) AI大模型主要类型

  • 按照部署方式划分,AI大模型主要分为云侧大模型和端侧大模型两类。云侧大模型由于部署在云端,其拥有更大的参数规模、更多的算力资源以及海量的数据存储需求等特点,分为通用大模型和行业大模型;端侧大模型通常部署在手机、PC等终端上,具有参数规模小、本地化运行、隐私保护强等特点,型主要有手机大模型、PC大模型。

AI大模型应用路线

  • “基础大模型→行业大模型→终端应用”的大模型应用路线日渐清晰。
  • 基础大模型,也称为通用大模型,是通过基于海量通用数据进行预训练而得到的。其优点在于拥有强大的泛化能力。基础大模型通常利用大算力和拥有大量参数的深度学习算法,在大量无标注的通用数据上进行预训练,从而形成能够“举一反三”的泛化能力,相当于AI 完成了“通识教育”。基础大模型将 AI 的开发应用从“小作坊”带入“大工业”时代,但由于缺乏特定场景的语料和数据集的训练及模型调优,因此在特定场景下的“专业度”还有待提高。
  • 行业大模型是在基础大模型的基础上,进一步融合行业数据、知识和专家经验,从而有效提升模型的表现和可控性。其优点在于更为专业,并对于不同的应用场景具有更强的适配性。目前,在金融、能源、制造、传媒等领域,已经有头部企业与科技公司或科研单位联合发布了行业大模型。

2.2 市场规模

  • 随着AI大模型技术能力的突破,其应用场景必将多元化增长,并且会逐渐从当前的业务类场景向决策管理场景深入。据前瞻产业研究院预测,预计到2028年我国AI大模型行业的市场规模将突破千亿元,五年行业复合增速将超过50%,行业前景巨大。

2.3 竞争格局

(1) AI大模型代表企业

  • 目前,中国AI大模型相关上市企业主要分布在北京,共有20家,主要包括软通动力、千方科技、中科软等。上海市AI大模型相关上市企业共5家,排名第二。
  • 我国具有代表性的通用AI大模型主要包含智源人工智能研究院—悟道大模型、科大讯飞的讯飞星火认知大模型、百度公司的文心一言大模型、阿里巴巴的通义千问大模型等;行业AI 大模型主要涵盖蜜度的文修大模型、容联云的赤兔大模型、用友的YonGPT大模型;同时具有云侧和端侧大模型的端云结合AI大模型主要有vivo的蓝心大模型;端侧AI大模型主要以蔚来的NOMI GPT大模型为代表。国内的百度文心、阿里通义、腾讯混元、华为盘古等大模型体系中均覆盖了基础大模型和行业大模型。
类别AI大模型功能AI大模型案例
AI通用大模型文本生成、语言理解、知识问答、
逻辑推理、数学能力、代码能力、
多模态能力等
智源人工智能研究院—悟道大模型科大讯飞—讯飞星火认知大模型
百度公司一文心一言大模型
阿里巴巴—通义千问大模型腾讯混元大模型华为盘古大模型
AI行业大模型1.金融:文档处理、知识问答、内容生成、辅助决策
2.医疗:医学影像生成、知识问答、辅助决策
3.政务:政策检索、知识问答、辅助决策
4.电商:经营分析、商品推广、商品销售
5.传媒:录音转写、新闻写作、视频剪辑
蜜度一文修大模型
容联云一赤兔大模型
用友—YonGPT大模型
AI端侧大模型物体识别、语言理解蔚来—NOMI GPT
AI端云结合大模型语义搜索、知识问答、文本创作、图片生成、智慧交互等vivo—蓝心大模型

3. AI大模型行业应用发展现状

 3.1 行业应用特征

(1) 由浅入深,大模型穿越边缘场景,向核心场景挺进

  • 2023年,AI大模型在在政务、金融、产业升级等各个行业应用偏向边缘场景,不涉及生产、运营的核心环节,也不面向公众或外部客户使用,仅面向内部员工使用。2024年,得益于大模型在边缘场景价值的成功验证及其技术演进,大模型在深耕边缘场景的同时开始向核心区挺进。在场景价值验证方面,多数需求方认可大模型价值,将计划追加投入。例如某运营商在2023年研发客服大模型并试点上线,由数万名员工内测试用,该运营商计划2024年开始在集团范围内加快规模化商用推广。

(2) 央国企需求旺盛,加快大模型落地应用

  • 央国企守正创新,有较强意愿自上而下推进大模型应用央国企通常具有较强的数据基础设施、算力投入和AI应用基础,为大模型成功落地提供先决条件。在央国企引领下,大模型在产业升级和金融领域快速落地。

(3) 大模型应用搭建难度下降,“动态行业大数据”成为落地新关键

  • 大模型基础能力提升、开发工具逐渐完善,为培育大模型应用提供肥沃土壤。大模型持续迭代,语义理解、上下文长度、多模态等能力愈发完善,有利于开发上层应用。同时,随着行业发展,大模型生态也在逐渐成熟,各类便捷的AI开发工具陆续推出,应用开发难度显著下降。例如百度于今年推出的智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder,可以帮助不具备代码编程能力的人员完成大模型应用开发。
  • 打造行业大模型成为需求方和技术企业的共同关注点。“动态行业大数据”是打造行业大模型的核心,其是指为保证行业大模型的持久生命力,技术企业应具备动态更新行业大数据的能力,而非只掌握一批“静态数据”。拥有“动态行业大数据”的技术企业更容易获得需求方青睐。

(4) 需求方量体裁衣,在采购、部署大模型时特色鲜明

  • 需求方IT能力越强,越倾向采购基础大模型,反之则倾向采购大模型应用。具体来讲,强IT能力的需求方通常倾向采购基础大模型,通过自行微调来开发各类上层应用。IT能力稍弱的需求方通常倾向采购“企业大模型”,即由技术企业基于需求方数据对基础大模型进行微调。IT能力更弱的需求方通常倾向采购大模型应用,实现“开箱即用”,由技术企业对基础大模型进行调整和封装,需求方无需关心。
  • 需求方IT能力越强,越具备在智算中心私有化部署大模型的条件,反之则更依赖大模型一体机和公有云部署。强IT能力需求方通常已自建智算中心,其具备高端GPU资源,支持大模型的训练和推理工作。IT能力稍弱的需求方通常采用大模型一体机,其仍为私有化部署模式,由技术企业对大模型、应用、算力资源进行整合,形成端到端解决方案,便于大模型在需求方快速落地。IT能力更弱的需求方通常倾向公有云部署,此种方式更省心且初始投入较低,有利于需求方低成本快速试错。

 3.2 应用挑战

(1) 人工算力需求持续增长,掣肘大模型落地应用

  • 随着大模型应用地更深更广,算力紧张情况预计仍将延续。特别是大模型在训练环节需要大型算力集群,但市场上存在较多分散算力,难以用于大模型训练,加剧了算力紧张情况。

(2) 知识产权、数据隐私与大模型应用之间的法律平衡点仍在探索中

  • 大模型训练涉及的数据可能包括一些版权保护的作品,从知识产权保护的角度而言,可能需要禁止使用,避免生成侵权回答。但是,这些作品数量众多、来源各异、权属不同,若采用事先授权许可的方式,这一过程漫长、复杂且几乎无法落地操作。
  • 对于数据隐私保护和大模型效率之间存在着一个两难的矛盾⸺既要最大限度地保护数据隐私,又要最大限度地发挥模型的效果。在政务、医疗和金融领域,该矛盾尤为突出。通过开发可信的框架,从而在数据隐私保护、模型效果和训练效率之间取得一种平衡,是业内的重点讨论方向,但仍在探索中。

(3) 大模型幻觉问题影响部分领域落地应用

  • 政务、金融、医疗等领域对大模型输出内容的专业性、准确性有较高要求,对不准确回答的容忍度较低。例如在政务领域,面向公众的政务问答一旦生成错误的答案,将给工作人员带来额外的解释成本。
  • 当前较多大模型技术企业采取引入提示词工程或外挂知识库等方式进行内容校准,在一定程度上可以缓解大模型幻觉问题。但是,这种方式一定程度上限制了大模型的通用泛化能力,难以从根本上解决幻觉问题。

4. 重点领域应用研判及建议

 4.1 重点领域应用研判

(1) 政务领域

  • 政务领域大模型应用场景丰富,但公共属性偏多,商业化落地动力不足。归因于政务领域落地周期长、准确度要求高、经济效益较低等原因,对企业的成本和技术挑战较大,令不少大模型企业望而却步。
  • 政务领域大模型短期内难以具备直接面向公众提供精准政务问答的能力。对问题理解有误、生成内容不准确、关联政策信息过时等问题普遍存在,大模型的幻觉问题短期内难以得到显著改善,在部分业务中尚不满足面向公众提供精准政务问答的条件。

(2) 金融领域

  • 金融领域应用大模型的市场驱动力较强,且结合点较多。金融领域应用主要集中在保险售前助理、智能投研助理、招股书生成编写、智能研报合规审查、智能客服等方向。除此以外,大模型保险理赔受理、大模型智能数据治理、个人/企业信用偿贷能力审查监控等,大模型在金融领域的商业价值将会逐步释放。除商业价值之外,大模型在金融领域的社会价值也开始显露,某银行将大模型与消费者权益保护审查平台结合,利用大模型对理财产品宣传材料实现自动生成审查意见,推荐优秀相似案例作为参考,辅助审查人员开展审查,能有效解决基层审查能力不足的问题,银行方审查速度和审查准确性得到大幅提升。
  • 大模型在金融领域落地尚面临行业监管和算力资源等诸多挑战。金融行业监管严格,对大模型的输出结果准确性、安全性、合规性都具有较高要求,且金融机构数据隐私性较强,难以在机构间共享,大模型产品往往需要进行私有化训练及部署,这对于金融机构的算力资源提出新的挑战。同时,金融机构对私有化部署的依赖会引发大模型知识持续学习等问题。

 4.2 解决建议

(1) 政务领域

  • 鼓励在政务内部优先应用大模型,逐步面向公众开放。短期内在政务领域落地应用方向主要是面向政务工作人员内部使用。在该场景下,应明确大模型作为政务助手的定位引导技术企业重点提升大模型的溯源能力及汇总能力,为用户提供多角度建议以及参考出处,辅助政务工作人员得出结论,通过优先落地内部业务的试点应用为后续实现更高智能化水平的政务大模型打下基础。随着不断测试验证,当模型能力满足一定条件后,逐步探索面向公众上线服务。
  • 加快打造政务标杆案例,形成全行业示范效应。从政务领域选取公文撰写、办公助手等落地效果好、可推广性强的案例进行推广,向社会各界释放政府主动拥抱大模型技术的信号,对齐各行业对大模型效能的认知,带动政务细分领域以及其他行业领域逐步接纳大模型应用。

(2) 金融领域

  • 建立完善的政策和监管环境。制定明确的政策框架和监管指导原则,确保大模型技术在金融领域的应用,既促进创新,又保障金融系统的稳定性和安全性。设立监管沙箱,允许金融机构在一定条件下测试大模型技术的应用,通过实践探索合理的监管框架,为未来的监管政策提供依据。
  • 鼓励金融机构完善大模型基础配置。当前,金融机构已经逐步开展数字化,具备独立的信息数据平台,应持续提升金融机构在大模型应用方向的数字化基础,依托自身数据平台,构建安全高质量金融数据集,保证数据准确有效,数据来源可追溯,生成内容专业、权威。
  • 尝试在对公业务中探索大模型应用。当前大模型在金融领域的应用主要集中在对私业务,可以尝试向对公业务探索。例如将大模型与企业信贷业务进行结合,利用AI Agent技术将大模型、OCR、RPA等技术及组件进行调用,打造信贷助手,协助信贷经理完成资料收集、风险分析等工作。

Leave A Reply