1. 概况与特点
1.1 行业概况
人工智能技术为千行百业赋能,实现各类应用场景落地,现阶段已发展成为主流趋势,AI技术商业价值不断增长,产品形态和应用边界也在持续拓宽。
(1)人工智能行业定义及特征
人工智能定义:人工智能产业是指以人工智能关键技术为核心的、由基础支撑和应用场景组成的、覆盖领域极为广阔的行业群,智能产品是指用人工智能技术赋能的产品。设计过程中需要具备较强的仿真能力和失效模式分析能力。

企业应用AI技术比重持续提升,AI技术商业价值不断增长。据调查,2017年企业应用 AI 技术比重约占 20%,2022 年企业至少在一个业务领域采用AI技术比率增至50%。2018年应用AI产品平均仅1.9个,2022年增至 3.8个,应用数量提升以外,AI商业价值不断增长,企业部署AI动力显著。
机器人流程自动化(RPA)和计算机视觉是人工智能领域每年最常用的技术,自然语言文本理解已经从 2018年的中间位置上升到仅次于计算机视觉的第三位。
(2)人工智能落地场景
人工智能赋能产业发展已成为主流趋势,下游应用场景丰富:基于软件服务、云服务、硬件基础设施等产品形式,结合消费、制造业、互联网、金融、元宇宙与数字孪生等各类应用场景,人智能赋能各个产业发展。
人工智能的产品形态和应用边界不断拓宽:2022年,人工智能产学研界在通用大模型、行业大模型等促进技术通用性和效率化生产的方向上取得了一定突破。商业价值塑造、通用性提升和效率化应用是AI技术助力产业发展、社会进步和自身造血的要义。
1.2 行业发展历程
人工智能行业现处于“核心硬件发展阶段,算力、数据、算法全面突破”时期,产业未来发展将基于大规模数据识别、预测、学习和决策,逐步进入效率化生产阶段。
(1)理论发展
- 感知式AI:始于1950s,让计算机感知和理解现实世界,兴盛于计算机硬件发展与大数据出现。
- 分析式AI:始于1960s,利用逻辑推理等方法进行分析和解决;兴盛于机器学习、数字挖掘技术兴起。
(2)硬件奠基、算法发展
- 决策式AI:始于 1970s,分析之后进行智能决策;近年来才开始真正兴盛。
- 生成式AI:始于 1980s,起源于分析式 AI,生成新的内容;2022年迎来突破。
(3)核心硬件发展,算法突破算力、数据、算法全面突破
- 生成式 AI生成各种数据、图像语音等内容后,决策式AI对生成内容进行分析和决策,实现更加全面和智能的应用。
- 2022年11月,ChatGPT发布点燃AI浪潮。2023年3月0penAl发布 GPT-4,直接升级 ChatGPT多模态能力。
AI产生的商业价值不断增长,企业部署AI的动力显著。企业在业务领域扩大采用 AI 技术,应用的 AI产品数量增加。落地 AI应用对企业业务运营的商业价值与战略意义越来越明确。人工智能的产品形态和应用边界不断拓宽;2022年,人工智能产学研界在通用大模型、行业大模型等促进技术通用性和效率化生产的方向上取得了一定突破。
1.3 行业应用场景
人工智能技术架构逻辑上分为基础层、技术层、能力层、应用层、终端层五大板块,其中核心技术层涵盖AI技术群和模型的融合创新,为各行业领域提供相关产品及服务。
- 基础层:涉及硬件基础设施和数据、算力、算法模型三大核心要素。随着AI 大模型规模的不断扩大,对计算资源的需求也在增加。因此,高性能的硬件设备、海量场景数据、强大的算力基础和升级迭代的算法模型成为了支持AI大模型发展的关键。
- 技术层:主要涉及模型构建。目前,Transformer 架构在AI大模型领域占据主导地位,如BERT、GPT系列等。
- 能力层、应用层及终端层:在基础层和技术层的支持下,AI 大模型拥有了文字、音频、图像、视频、代码策略、多模态生成能力等,具体应用于金融、电商、传媒、教育、游戏、医疗、工业、政务等多个领域,为企业级用户、政府机构用户、大众消费者用户提供产品和服务。

1.4 市场驱动因素
数据、算力、算法三大核心要素推动人工智能技术迭代和商业化落地,中国人工智能企业处于发展初期,基于技术创新及成本控制等优势,中国人工智能行业将快速发展,前景广阔。
(1)中国 AI 产业处于发展初期,成长速度较快,发展空间广阔
国内人工智能产业仍处于初步发展阶段,大多数企业对于人工智能的发展主要以框架搭建和应用解决方案为主。行业内领先企业专业技术能力过硬,其 AI 产品在语音语义、翻译、文字识别等方面有较大优势,能够在智慧城市、智慧交通、智慧安防等细分场景实现商业化落地。

(2)中国企业加强A【底层基础设施的国产化突破
数据方面,中国企业积极提高训练数据标记质量,提高模型的准确程度。同时,中国人工智能企业加强与政府及相关事业单位的合作,取得权威的训练数据,通过数据孪生等方式解决小样本数据不足等问题。
算力方面,政府积极支持AI相关硬件的国产化,华为、寒武纪、商汤科技、地平线等国内企业推出自主研发的人工智能芯片,目前整体市场对海外的人工智能芯片依赖程度略有降低。国产化算力的逐步升高,能够有效支撑AI产业的发展。
算法方面,国内人工智能企业在自然语言处理、智能语音、视觉计算等领域均有所突破能够根据细分场景的痛点持续进行算法优化迭代。
(3)中国企业具备实现AI的商业化落地的商业基础
中国人工智能企业创新能力不断提升,具备优质的工程成本控制能力,并能够结合自身业务特点和场景的理解沉淀,为下游行业提供高效智能的解决方案,帮助企业降本增效。中国企业能够响应新型工业化建设的需求,结合具体的场景加快融合创新,目前在智慧城市智慧安防的落地率和普及率较高。
1.5 市场发展机遇
AI广泛应用于各行各业,未来人工智能的应用需求仍有望实现较大提升,尤其在制造行业和交通行业,AI的渗透率仍有较大增长空间。
(1)制造行业
2021 年中国制造业增加值高达 4.87 万亿美元,占全球的 29.8%,已连续 13 年居世界首位。从 2021 年到 2026 年,中国制造业 IT 市场投资规模将从 7.841.12 亿元人民币增长至1.586万亿元,将成为全球主要经济体中制造业IT支出增长速度最高的国家。
在制造业,中国正从低成本的玩具和服装制造中心,转型成为处理器、芯片、发动机和其他高端零部件等精密制造领域的领导者,人工智能有利于促进制造业从生产执行向制造创新转型,创造超过千亿美元*的经济价值,其中1,000亿美元来自于流程设计研发,利用数字孪生和机器学习模拟、测试和验证生产流程的结果,150亿美元来自于产品研发,验证新产品设计,快速预测设计结果。
(2)交通行业
2022 年中国新能源汽车产销分别完成了 705.8 万辆和 688.7 万辆,同比增长了96.9% 和 93.4%,连续 8年保持全球第一;新能源汽车新车的销量占汽车新车总销量的 25.6%。
新能源车的持续渗透为人工智能在交通领域的渗透的占提供了一片沃土,人工智能有望创造超过 3.800亿美元的经济价值,主要来自于三个方面:自动驾驶(3.350亿)、智能座舱(300亿美元)、运行管理优化(150亿美元)。
2. 技术与应用
2.1 数据为中心的技术路径潜力较大
以数据为中心的AI提高性能,降低成本,发展潜力巨大。无法有效助力AI落地。平台为数据驱动的AI提供了一个统一、集成的环境,简化任务,降本增效作用显著。
以数据为中心的AI拥有巨大的能量和潜力。2022年,吴恩达在接受IEEE Spectrum 采访时表示,模型为中心无法有效助力AI落地。过去十年人工智能最大的转变是向深度学习转变,此后十年将向以数据为中心转百年。随着神经网络架构的成熟,许多实际应用的瓶颈将成为“如何获取、开发所需要的数据”。同时,基于平台的解决方案是目前的一大需求和趋势。
- 以模型为中心的AI应用痛点:资源、成本要求高等
复杂性:模型驱动的 AI 通常涉及具有大量参数的复杂模型。训练和部署这些模型需要大量的计算能力导致硬件和基础设施的成本较高。
训练时间:模型驱动的 AI 中复杂模型的训练需要时间长,特别是深度学习模型。延长训练时间增加了对计算资源的需求,从而导致成本提高。
模型更新:模型驱动的 AI 中的模型通常更复杂,因此为应对不断变化的需求,使用新数据更新或修改需要大量资源,导致更高的成本和更长的开发周期。
可解释/理解性:模型驱动的 AI 中的杂模型通常较难解释和理解,这可能需要额外的资源来开发工具和技术以提高透明度和可信度。
- 以数据为中心的A应用优势显著
提高泛化能力:数据驱动的 AI 强调拥有多样化、高质量的数据的重要性。数据驱动的 AI 可以提高泛化能力,并使模型在新数据上表现更好。
减少对模型复杂性的依赖:数据驱动的 AI 侧重于使用高质量数据来使简单模型实现相似甚至更好的性能,从而降低计算和资源需求。
更容易进行微调:数据驱动的 AI 使通过扩充或优化用于训练的数据来微调模型更容易。无需大幅修改模型架构或重新训练模型即可提高特定任务性能。
迁移学习:数据驱动的 AI 鼓励迁移学习,在大型数据集预训练的模型为较小的特定任务数据集微调。拥有缩短训练时间并提高性能的优势。
2.2 以模型为中心:AutoML
AI开发平台厂商通过提供灵活的服务和简化开发者的操作来改善开发者的体验,增强平台易用性,提升生态开放性,进而提高厂商技术水平。AutoML市场潜力大,应用效率高,是AI领域的重要趋势之一。
(1)AutoML的特征及价值
AutoM 是一种机器学习过程,旨在通过一系列算法和启发式方法实现从数据选择到建立模型的自动化。研究人员仅需输入元知识(卷积运算过程/问题描述等),该算法即可自动选择合适的数据、自动优化模型结构和配置、自动训练模型并可以部署到不同的设备。
- AutoML可以帮助用户更快地构建和优化模型,但仍然存在以下痛点:
自动化过程的透明度:AutoML模型的训练和优化是自动完成的,用户可能无法了解模型的具体操作和过程,从而无法理解模型是如何进行决策的。
计算资源:AutoML需要大量的计算资源,包括GPU和大量的存储空间。这会导致成本上升,使得小型企业或个人无法承受。
模型的可解释性:由于AutoML, 模型通常具有较高的复杂性,因此其结果可能难以解释。这使得用户难以了解模型是如何做出预测的,进而影响用户对模型的信任度。
数据隐私和安全性:在AutoML的过程中,用户必须将其数据上传到云端,这会增加数据泄漏的风险。同时,由于 AutoML 过程是自动完成的,用户无法控制模型如何使用其数据也难以保证模型的安全性。
(2)AutoML技术路径
AutoM 是一种机器学习过程,旨在通过一系列算法和启发式方法实现从数据选择到建立模型的自动化。研究人员仅需输入元知识(卷积运算过程/问题描述等),该算法即可自动选择合适的数据、自动优化模型结构和配置、自动训练模型并可以部署到不同的设备。
- 数据预处理和特征工程自动化:
数据预处理和特征工程是机器学习的重要组成部分。AutoML技术可以通过数据清洗、特征提取和转换等自动化方式,自动发现和生成有用的特征。
- 超参数优化自动化:
超参数是机器学习模型的关键因素之一,它们控制着模型的学习过程和性能,AutoML技术可以通过自动搜索超参数空间中的最佳组合,以提高模型的性能。
- 模型选择自动化:
选择正确的模型可以使结果更准确、更快速地获得。AutoML技术可以自动地从不同类型的模型中选择最佳的模型来适应给定的数据集。
- 模型继承自动化:
模型集成是将多个模型组合起来以提高预测性能的过程。AutoMI蹀飕諄收顳物绋衔洹贪术可以自动组合不同类型的模型以获得更好的结果。
2.3 以数据为中心:MLOps
MLOps 是通过构建和运行机器学习流水线(Pipeline)),统一机器学习(ML)项目研发(Dev)和运营(Ops)过程的一种方法,目的是为了提高A模型生产质效,推动AI从满足基本需求的“能用”变为满足高效率、高性能的“好用”。
MLOpS是 ML的DevOps。借助MLOps,团队的开发与部署效率会得到显著提升。并且MLOps 为系统带来了灵活性与速度。对于个人或企业开发者而言,开发时间与开发成本是搭建AI应用程序的主要考虑指标。借助云原生及弹性分布式运算的架构可为用户在AI 模型的训练与推断层面降本增效。
数据科学家构建的机器学习(ML)模型需要与其他团队(业务团队、工程团队、运营团队等)紧密合作。团队工作为沟通、协作和协调方面提出了挑战,MLOps的目标正是通过完善的实践来简化此类挑战。MLOps为系统带来灵活性与速度:MLOps 通过可靠且有效的 M生命周期管理,减少开发时间并得到高质量的结果:MLOps 从 DevOps 中延续的持续开发(CD)、持续集成(CI)、持续训练(CT)等方法和工具保障 AI工作流程和模型的可重复性,开发者可随时随地轻松部署高精度机器学习模型并集成管理系统可连续监测机器学习资源。

3. 发展要素与趋势
3.1 传统AI模型落地痛点
在应用场景端,AI模型工程化落地慢,部署周期长,迭代缺乏灵活性。项目整体周期较长普遍缺乏部署敏捷性,解决方案交付成本高,生产环境的上线具有不确定性,后续运维成本也较高,亟需人工智能协助转型。

- 跨团队协作难度大
机器学习项目生命周期中涉及业务、数据、算法、研发、运维等多团队,团队间缺乏相同的技术和业务背景知识作为协作基础,从而带来沟通屏障。同时协作工具不尽相同,从而增大协作难度。
- 生产和交付周期长
主要原因:模型文件的生产需要经过不断重复的实验和评估;模型服务需要通过编写服务代码和配置参数,并达到业务需求后,方可部署上线;业务效果的保证需通过在线模型开展服务验证和结果对比。
- 过程和资产管理欠缺
模型生产过程无标准化管理导致 AI 资产的价值无法有效发挥。原因在于生产过程冗长难管理,重复造轮子现象普遍:AI 资产无集中共享机制,优秀实践经验难以沉淀。
3.2 中国人工智能行业发展要素分析
高效率、低成本,规模化的AI基础设施成长迅速,AI基础层资源整体效能水平不断进化,与AI开发平台展基本一致。目前AI服务体系逐步完善,开源框架成为众多AI开发平台的基础。
智能化转型趋势下,企业部署AI项目的需求正经历着变化,各方面要求提高,对AI基础层资源的需求增加。企业对教据质量、模型生产周期、模型自学习水平、模型可解释性云边端多样部署方式、人力成本及资金投入、投资回报率等的要求都逐步走高。在上述需求特点及自动机器学习、AI芯片硬件架构等技术发展的共同推动下,AI基础层资源的整体效能水平也在不断进化,以有效降低需求企业的 AI 开发成本。
人工智能基础层进阶之路历经雏形期、快速发展期和成熟期。1)雏形期,算法/算力/教据各模块多为粗放式的单点工具,新兴产品及赛道逐步出现。2)快速发展期,各赛道活跃度显著提升,参与者积极探索产品形态与商业模式,基础层服务体系逐步完善、资源价值凸显。3)成熟阶段,各赛道内企业竞争加剧,逐步跑出头部企业。同时各赛道间企业生态合作增多,一站式工具平台出现。
在人工智能由技术落地应用阶段向效率化生产阶段转变的背景下,人工智能基础层的各模块工具有望走向集约型的生产模式。该模式主要能赋予开发企业以下价值:
- 开发方式改进
从客户需求分析到解决方案部署形成独立的闭环构建端到端的工作流。在强大算力的支持下,完成数据采集、数据标注、数据治理、数据应用、模型设计、参数调优模型训练、模型测试、模型推理的全栈式流水线生产。。
- 管理效率提升
将数据、算法与算力委托给专业的服务商微实现站式托管,打通三者之间的衔接壁垒。提高交互友好性,让开发者专注于业务。
- 部署成本降低
集成数据、算法、算力的各个软件与硬件,企业可在一个平台内按需选择自己所缺失的模块组件并自由搭配,有效避免因采购不同供应商的产品或服务而带来的隐性成本损失与显性成本损失。