正在阅读:AI推理时代,边缘计算成新战场

AI推理时代,边缘计算成新战场

2025-03-28 13:31:24来源:TechWeb.com.cn 关键词:AI推理边缘计算阅读量:21817

导读:面对新兴的AI推理需求,推理性能、效率以及成本毫无疑问是最核心的问题,而边缘计算在靠近数据生成源的地方进行处理和推理,具有低延迟、数据隐私保护和高效能等优势,被视作AI推理的理想位置,由此将成为竞争的新战场。
  自去年来,从Open AI推出O1推理模型,到Anthropic跟进推出非常依赖推理能力的“Computer Use”的Agent功能,再到DeepSeek R1推理模型在全球火爆,以及英伟达在GTC大会上亮相首款推理模型、首个推理软件等,这些科技巨头的动作一再揭示一个趋势——AI大模型的竞争焦点已经转向AI推理,AI推理时代已经到来。
 
  面对新兴的AI推理需求,推理性能、效率以及成本毫无疑问是最核心的问题,而边缘计算在靠近数据生成源的地方进行处理和推理,具有低延迟、数据隐私保护和高效能等优势,被视作AI推理的理想位置,由此将成为竞争的新战场。
 
  在DeepSeek出现之前,AI大模型的部署与训练需要大量的资金投入和大规模算力的部署、维护,中小企业很难自建生态以进行大模型的开发,同时也受制于AI大模型闭源带来的部署与使用门槛。
 
  而DeepSeek采用大规模跨节点专家并行的模式,利用强化学习来减少人工依赖和数据缺失的问题,通过全面开源的方式,将AI推理资源池成本降到百卡/千卡范围,真正降低AI大模型在行业用户环境中的部署与使用成本,同时,部署方式更加轻量、灵活,为行业提供了全新的解决方案。短短两个月的时间,国内外的科技、金融、政务、能源、通信、汽车、高校等各行各业均已纷纷接入DeepSeek,用于业务提效和AI应用创新。
 
  这让更多人以更低成本享受到了AI的高性能,加速了端侧AI的爆发与普及,同时也推动了AI格局向大规模推理转变。
 
  由于AI推理会为终端用户运行工作负载,响应速度和位置尤为关键,这意味着在边缘或边缘云环境中进行推理更有优势。对于企业而言,靠近节点的边缘云可以有效提高数据交互和AI推理的即时性与效率,并保障信息安全。
 
  具体来看,边缘计算地理分布广泛,更靠近用户,是低延迟体验的必要条件。同时边缘计算通过缩短交互链路,能够大幅降低数据传输开销和成本。以语音数字人场景为例,相较中心云,在靠近用户的边缘侧接入,使得语音数据传输链路短,用户体验明显优于中心推理,而相较设备端,又可以降低对终端设备的依赖,模型能力的优化升级更加简便。
 
  其次,边缘节点容量大、健壮性强、可用性高,叠加边缘推理后,更具智能、更加高效,能够更好支撑企业数字化、智能化;并且边缘计算还能保障业务连续性,通过业务调度能力实现节点故障时的快速切换。
 
  再者,在边缘侧可以提供更多能力,比如边缘缓存,实现交互内容的就近存储,减少网络流量、提升模型的实时性,比如集成安全的边缘防护,增强大模型部署和应用的安全性。
 
  AI推理市场的主要竞争者包括AI硬件厂商、模型厂商以及AI服务提供商,可以看到,参与者们已经在瞄准边缘计算进行布局。
 
  比如硬件层面,苹果、高通等厂商积极研发边缘AI芯片,应用在AI手机和机器人上,支撑边缘端的大模型运行;Arm发布了边缘AI计算平台,可运行超10亿参数的端侧AI模型;国科微推出了AI边缘计算芯片,可适配包括轻量级LLM语言大模型、AIGC生成式模型、CV大模型以及多模态大模型等。
 
  平台服务层面,英特尔推出了基于英特尔锐炫TM显卡的边缘端AI推理解决方案,提升AI推理速度;阿里云推出了边缘容器云,助力开发者实现更快速的AI推理应用的迭代和部署;网宿科技打造了边缘AI平台,提供ServerlessGPU、边缘AI网关、边缘模型微调与推理服务等,帮助企业低成本、高效率地实现AIGC创新。
 
  目前AI推理市场正处于快速发展期,竞争格局尚未完全固化。专家认为,未来市场竞争的核心要素在于成本/性能的计算,即包括推理成本、延迟和吞吐量。
 
  聚焦到边缘计算这一切入点,资源与技术能力将是参与者竞争取胜的关键。
 
  以网宿科技为例,作为边缘计算领域的头部玩家,于2011年就已探索边缘计算,早已形成从资源、产品、能力、安全到应用的一体化布局。资源方面,网宿在全球拥有近3000个节点资源和丰富的GPU算力资源,更贴近业务边缘,具有低时延优势,例如在与大模型交互的链路中,能够将模型交互效率提升2-3倍。
 
  而在技术能力上,网宿沉淀了完备的技术栈,依托异构计算资源的虚拟化和容器化、全球海量节点的编排管理等关键技术,能够支撑大规模模型能力的调度和运营,为企业提供高可用服务;此外,还通过边缘函数自定义更多个性化的功能,结合企业业务场景提供个性化的智能解决方案。
 
  据悉,网宿边缘AI平台已经深入医疗、家居、媒体、互联网等行业,应用于AI辅助开发、AI问答、AIOT、AI评论等场景,比如网宿利用RAG技术构建知识库,并结合边缘AI推理模型,为某医疗企业构建了智能AI问答系统,明显提升了医疗咨询的效率。
 
  可以预见,随着模型技术的不断演进和边缘计算能力的持续提升,AI推理将迎来一场革新,为产业带来更多创新机遇。
我要评论
文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关。

  • AI驱动的边缘计算如何革新工业物联网

    边缘AI是指人工智能算法直接在传感器、机器或网关等边缘设备上运行,而不是依赖于集中式的云服务器。边缘AI为工业情报的新时代奠定了基础,机器的思维速度更快,运营更精细,并且企业保持领先地位。
    边缘AI边缘计算工业物联网
    2025-09-08 09:40:35
  • IDC:到2028年全球边缘计算支出将接近3800亿美元

    报告对边缘计算行业进行了估值,计算出2025年全球边缘计算服务支出总额将达到近 2610亿美元,预计年复合增长率为13.8%,到2028年将达到3800亿美元。
    边缘计算边缘服务
    2025-03-21 13:45:57
  • 边缘计算在人工智能云解决方案中的作用

    边缘计算将数据存储在靠近设备的位置,AI系统直接在网络边缘处理数据。即使没有互联网连接,设备仍可正常运行。这使得可以在几毫秒内处理数据,并提供实时反馈。
    边缘计算人工智能云解决方案
    2025-03-14 13:38:16
  • 边缘AI与云集成:工业维护转型的未来之路

    随着边缘计算、人工智能(AI)和云技术的深度融合,预测性维护正成为推动工业运营变革的关键力量。
    边缘计算云计算
    2025-01-22 09:06:26
  • 2025年物联网格局有望成为创新和转型的格局

    2025年的物联网格局有望成为创新和转型的格局,边缘计算、5G和AI等技术将推动进步。以下是预计将影响2025年的关键物联网趋势及其对工程师和设计师的影响。
    物联网边缘计算
    2025-01-20 11:37:35
  • 到2030年,边缘计算将主导数据处理

    边缘计算作为一种新兴的计算模式,正在迅速崛起,成为数据处理的新枢纽。预计到2030年,边缘计算将超越中央数据中心,成为主导数据处理的核心力量。
    边缘计算
    2025-01-09 10:54:57
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了