(资料图片)
财联社2月4日电,腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。在真实场景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 QPM 提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比 FlashInfer/FlashAttention 最高提升2.22倍;GroupGEMM 相比 DeepGEMM 最高提升1.88倍;FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。
[责任编辑:linlin]
京东投入超13亿元补贴一线员工
微动态丨腾讯混元AI Infra核心技术开源:推理吞吐提升30%
每日信息:轰28+16+5!文班爆锤火箭,杜兰特作茧自缚,乌度卡也暴露缺陷了
每日观点:内房股午后普遍上涨 龙光集团涨逾7%华润置地涨逾5%
和铂医药-B盈喜后高开逾3% 预期年度溢利至多约9500万美元 今日热搜
出口激增推动人民币9个月升值6%,12月汇率预期6.92美元-通讯
郑中设计:拟使用不超5.5亿元闲置自有资金购买理财产品
新华指数|采购商心态谨慎 干辣椒价格指数小幅下跌
C罗旗下媒体:C罗在球队生活不如意!他可能去美国大联盟!|今日热搜
今日观点!天阳科技:减持股份是股东根据个人资金需求做出的决策
星际荣耀完成上箭状态发动机与星控三号联合匹配试车 SQX-3火箭首飞再进一步
每日视点!长城证券:截至2026年1月30日股东总人数为115471户