直线模组_直线滑台_直线电机_厂家直销_fun88体育登录网站
新闻中心
联系我们
销售热线:
Contact Hotline
182 0069 9999

传真:0769-82878777

E-mail:ys@rbotai.com

公司地址:东莞市长安镇宵边东门中路16号德州工业园A栋
当前位置: 首页 > 新闻中心
新闻中心
 

英特尔携手 Aible 打造创新解决方案助力公司实现低成本智能化升级

来源:fun88体育登录网站    发布时间:2024-07-15 05:59:14


  对于需要运行生成式 AI 工作负载的企业来说,基于英特尔至强处理器的 Aible 无服务器解决方案可帮助其减少相关成本、提高智能化,并有效提升 RAG 及微调效率

  近日,英特尔与端到端 Serverless(无服务器)生成式 AI 和增强型分析方案提供商 Aible 合作,为企业客户提供了创新的解决方案,助力其在不同代际的英特尔 至强 CPU 上运行生成式 AI 与检索增强生成(RAG)用例。此次合作包含了工程优化和基准测试项目,明显地增强了 Aible 以低成本为企业客户提供生成式 AI 结果的能力,并帮助研发人员在应用中部署 AI。在双方的通力合作下,该可扩展、高效的 AI 解决方案可通过高性能硬件帮助客户迎接 AI 挑战。

  英特尔数据中心和AI事业部高级首席工程师 Mishali Naik 表示:“现在,客户正在寻求高效的企业级解决方案以充分释放 AI 潜力。我们与 Aible 的合作,也表明了英特尔正与行业紧密协作,推动 AI 创新,降低客户使用英特尔至强处理器运行最新生成式 AI 工作负载的门槛。”

  至强处理器的生成式 AI 性能:Aible 的解决方案展示了 CPU 如何明显提升从运行语言模型至 RAG 的一系列最新 AI 工作负载性能。基于针对英特尔处理器的优化,Aible 技术采用高效、智能的“端到端无服务器”方法,仅在产生用户请求时才会进行资源消耗。例如,基于用户查询,向量数据库仅需几秒即可激活并检索有关信息,而语言模型同样只需简单启动即可处理并响应用户请求,这种按需操作的运行模式有助于企业降低总拥有成本(TCO)。

  虽然在多数情况下,RAG 功能需通过利用 GPU 和加速器的并行解决能力来实现,但 Aible 的无服务器技术与英特尔至强处理器相结合,可使 RAG 用例完全由 CPU 来驱动。性能多个方面数据显示,多款不同代际的英特尔至强处理器均可高效运行 RAG 工作负载。

  重要意义:Aible 通过无服务器的方式使用 CPU,可在多个客户之间更为安全地共享底层计算资源,从而帮助客户大大降低生成式 AI 项目的经营成本。这种减少相关成本的方式能类比为用户仅需在使用时购买电力,而非直接租赁发电机。此外,随着生成式 AI 需求的增长,性能优化和节能降耗变得愈发重要。Aible 所提供的基于 CPU 的服务,为客户提供了一种经济、高效的解决方案。

  根据 Aible 的基准测试分析,当客户采用基于 CPU 的无服务器解决方案运行 RAG 模型时,成本节省可高达 55 倍 1。大幅度降低的成本证明了 Aible 独家方法的有效性,同时这种无服务器的 CPU 采用方式也减少了通过共享服务或专用服务器构建更为昂贵的、基于 GPU 的基础设施需求。

  此次英特尔及英特尔实验室与 Aible 的合作,共同优化了至强处理器上的 AI 工作负载。值得一提的是,通过优化 Aible 针对 AVX-512 的代码,Aible 在至强处理器上实现了显著的性能及吞吐量提升,这也彰显了战略性的软件优化对于整体效率的影响。

  在 Aible 平台的支持下,RAG 模型与英特尔至强处理器的结合可推动以下应用落地:

  英特尔与 Aible 的合作始于第四代至强处理器的发布。此后,双方针对至强处理器的 AI 工作负载、代码和库进行了一系列优化,并大幅度的提高了 Aible 的产品性能。

  投资者关系关于同花顺软件下载法律声明运营许可联系我们友情链接招聘英才使用者真实的体验计划

  不良信息举报电话举报邮箱:增值电信业务经营许可证:B2-20090237



上一篇:【48812】T型槽渠道槽尺度规范
下一篇:中小企业持续发展 激发经济回升向好新动能