瀚博(翰博集团简介)

本文目录一览:

1.瀚博半导体展示国产 7nm 云端 gpu 芯片,集渲染、ai、视频于一体

金磊 发自 凹非寺

量子位 | 公众号 qbitai

他在现场只是播放了一张的演讲内容。

竟引得众人不约而同,纷纷高举手机拍照,会场更是掌声不断

他叫钱军,很多人熟知这个名字,是因为他曾在amd担任高管一职长达近10年时间。

在此期间,钱军还带领团队设计量产了两个业界第一

  • 第一颗7nm图形处理器
  • 第一颗7nm gpgpu架构的ai芯片

而刚才现场之所以会有那般反响,正是因为钱军在2018年所成立的瀚博半导体,搞了一个“大动作”——

预览了国产7nm云端gpu芯片,sg100

据了解,sg100是集渲染、ai和视频于一体的全功能gpu,在吞吐、延时等性能中具备世界领先水平。

至于它所要发力的领域,正是云游戏、云手机、云桌面、云计算等元宇宙关键性应用场景。

例如在现场,钱军便演示了在sg100加持下视频渲染的效果对比:

不难看出,在色彩、帧率、细节、光照等方面,都是要优于世面主流gpu芯片。

并且随着sg100的预览,也就意味着国产gpu玩家队伍,又正式添加一位新成员。

但纵观整场发布会,“业界领先”、“性能数倍”等标签显得格外醒目。

之前以“拥有18年以上高端芯片设计和量产经验”先声夺人的瀚博半导体,再次来到聚光灯下。

适应多样化计算需求:芯片、计算架构、软件平台

在钱军看来,芯片及其衍生的产品,从来不是“单打独斗”的存在。

相反,他认为芯片性能的强大,应当是源自底层计算架构

为此,瀚博半导体在现场率先亮出的便是自研的统一计算架构——vuca(vastai unified compute architecture)。钱军表示:

我们用了中台的概念。核心的ip就类似中台,然后上层有统一的开发平台。可以根据产品和规划和侧重点,设计和推出更符合市场需求的产品。

而这张全景图,可以说是贯穿了瀚博半导体的多项核心技术。

例如架构的底层整合了多款高性能计算引擎,包括高性能ai引擎、可编程的矢量计算引擎,还有硬件化视频解码、具备渲染能力的显示核心等。

在这些计算引擎之上,拥有一个高效统一的存储管理、一致性的接口和低延迟的链接

之所以如此设计,是因为芯片及其产品单单有算力是不够的,接口、数据等因素依旧会成为制约算力效能的羁绊。

除此之外,要想让算力资源效能更大化,它还需要被池化、在云端被集中;因此,瀚博半导体的统一计算架构还设置了完整的虚拟化功能

而配合的统一的底层软件设计、模块化的上层计算算子库和功能模块,则会让芯片及产品在面对不同客户的需求时,变得更加灵活。

整体而言:

瀚博统一架构让计算密集型的ai、视频、渲染任务性能得到最大化硬件加速,同时端到端缩小延时,一体化助力云端实时图形渲染、ai增强处理、视频编解码等需求。

也正是基于这样的统一架构,钱军在现场发布了瀚博半导体的更多新品。

数据中心推理加速卡——载天va10

载天va10是一款用于数据中心的高性能ai计算、推理的加速卡。

从性能角度来看,载天va10所拥有的最大亮点,在于int8峰值算力达400tops

这一数值便一举刷新业界纪录。

但若是仅凭借算力峰值来判断加速卡的强弱,那还是有一些片面,需要的更多的综合性比较。

比如要考虑“算力密度”,算力密度可以从两个维度来讲。

第一是按芯片单元面积将算力平均下来,比如一平方毫米芯片的算力如何。另外一个,是每单元瓦的算力,也即每瓦功耗能够提供多大的算力。

例如载天va10的设计功耗为150w,而在同等条件之下:

  • 最高吞吐率是主流gpu的2倍以上
  • 最高性能延时是主流gpu的6?li>

不仅如此,在低延时场景(低于4毫秒的yolov3检测算法场景)下,载天va10的推理性能,更达到同功耗市场主流gpu的3倍以上。

也正是得益于载天va10的如此性能,它便非常适合“上岗”一些需要高实时性的云端ai场景,例如直播视频增强、智慧交通管理、实时语义理解等。

以智能roi优化为例,载天va10的效果如下:

不难看出,无论是实时处理效率,亦或是色彩增强效果,载天va10都是肉眼可见的更胜一筹。

边缘ai推理加速卡——载天ve1

除了数据中心端,瀚博半导体聚焦在边缘端同样发布了新品,载天ve1

不同于载天va10,载天ve1更侧重的发力点,是在那些大算力的需求场景。

例如车路协同、低速自动驾驶(无人配送车、港口物流园区无人驾驶的车辆)等。

而载天ve1之所以能够“胜任”于这些场景,还是得益于它自身的性能:

  • 在 40~65瓦功耗下,int8峰值算力达100tops
  • 吞吐率达到主流gpu的2倍,但延时不到主流gpu的5?li>

软件平台vaststream

但也诚如刚才所言,硬件性能上的“单打独斗”并不能将其功力全程发挥出来。

因此,瀚博半导体对此的破解之道,便是“软硬一体”——vaststream

据了解,vaststream软件平台,可以加速各类ai应用的部署。

例如计算机视觉、视频处理、自然语言处理、搜索与推荐、算子自定义扩展等。

而其全新软件组件,还提供了系统管理等三大管理工具,方便客户部署。

与此同时,vaststream的基础软件栈功能也变得更加丰富。

主要特性包括统一接口、灵活调度、通用ai计算、多路高效视频转码 ai增强、易编程快迁移、工具链完备等。

至此,不难看出瀚博半导体已经出现一条清晰可见的业务线:

芯片、推理加速卡、一体机的硬件产品,再到软件整合的系统ag九游会j9登录入口旧版的解决方案。

那么对于这位新晋的“gpu玩家”来说,如今也到了回答这个问题的时候:

瀚博要走怎样的一条“gpu之路”?

对于这个问题,钱军其实在现场已经给出了答案:

我们致力于做全球领先的综合算力平台。

而这次预览的gpu,可以说仅是瀚博半导体完整拼图中的重要一块。

这一点,从瀚博半导体的发展路径中便可以了解一二。

钱军在创立瀚博半导体之初,虽然有着数十年深耕gpu的团队,但他们却没有直接切入到造gpu的赛道。

选择的切入点反倒是“ai 视频”,而且这其中的ai更多的是在推理应用侧。

之所以如此,是因为钱军认为视频就像一枚硬币,有着2个维度。

对于已经产生的视频,是一个计算机处理的问题,包括增强、分析等等。

而对于还未出现的视频,那就是一个像素生产的问题,包括渲染等工作。

虽然此前瀚博半导体从未官宣过类似sg100这样的gpu的消息,但与gpu相关的能力其实已经是嵌套在了此前的产品中,只是并未对外宣传。

此举背后的逻辑,就是让产品先用起来,然后再打造一颗独立的高性能gpu。

加之已有的推理卡、软硬件等,便可把“综合算力平台”的拼图拼完整了。

然而把“国产gpu”这条线铺开来看,在瀚博半导体之前,已然是一副势头凶猛的态势。

那么在这样的大环境之下,瀚博半导体正式进入“国产gpu玩家”之列,其所持的杀手锏又将是什么?

对此,钱军表示:

重要的不是只有一个芯片、一个“硬疙瘩”;更重要的是一个软件的生态和合作的生态。

唯有做到高性能、低成本,然后用起来才是硬道理。

one more thing

瀚博半导体此次正式步入gpu市场,一个非常醒目的标签,便是团队拥有在amd数年的造芯经验。

而在2020年成立的摩尔线程,其创始人也曾在gpu巨头英伟达任职长达15年。

两个gpu巨头之间长期的“对垒”,已然是人尽皆知的事情。

但现在,从英伟达和amd出走的人,在国产gpu这条道路上再度“交锋”。

嗯,有点意思。

— 完 —

量子位 qbitai · 头条号签约

关注ag九游会j9登录入口旧版,第一时间获知前沿科技动态

2.瀚博首款ai推理芯片出炉,性能超越英伟达t4,年内即将量产

机器之心报道

作者:泽南

瀚博推出的 ai 推理芯片,性能超过英伟达最新的 a10 与 t4,同时使用成本还更低。

7 月 7 日,在上海举行的首场发布会上,芯片创业公司瀚博半导体展示了旗下最新产品,sv100 系列云端通用 ai 推理芯片和 va1 通用 ai 推理加速卡。刚刚推出的芯片实现了业内领先的性能指标。

瀚博半导体 ceo 钱军在发布会上展示 sv102 芯片。

「我们要做的是服务器级别的芯片,sv100 系列是全方位超过英伟达同类产品的芯片ag九游会j9登录入口旧版的解决方案。」瀚博半导体创始人、ceo 钱军在发布会上说道。

本次推出的产品包括芯片 sv102,以及基于该芯片的 ai 加速卡 va1,即将在今年第四季度投入量产。

云端通用 ai 推理芯片

瀚博推出的 sv102 是 sv100 系列的首款芯片,它面向云端的 ai 的通用化推理任务,int8 算力高达 200tops,其内含多颗瀚博自主设计的 ip 核,配备通用软件栈,对于云计算客户提供了完整的ag九游会j9登录入口旧版的解决方案。

选择推理作为突破点,是瀚博对于市场和业内竞争力分析之后作出的决定。

随着 ai 应用的逐渐成熟,落地业务的增多,目前云服务市场上推理任务的需求逐渐超过训练。相关数据显示,2021 年 ai 推理市场已超过训练市场,未来其差距还会逐渐拉大。高通则认为到 2025 年将有 90?算力将被用于机器学习推理。

而在推理任务上,相对更加专精的 dsa 芯片性能显著超过目前业内普遍采用的 gpu,前者可能会成为芯片领域的下一个发展方向。

瀚博提出的 sv100 系列芯片,对于视频任务进行了特别的优化。当前,计算机视觉任务占据了 ai 市场的大部分,视频流占据数据流的 70?而且比例持续攀升。这些任务需要强大的视频解码能力,对于处理延迟、吞吐量和能耗效率提出了较高要求。

sv102 是一款高性能人工智能与视频处理芯片,深度学习推理性能指标数倍于现有主流数据中心 gpu(如英伟达 t4、a10)。基于瀚博自研的,针对多种深度学习推理负载而优化的通用架构,该芯片支持计算机视觉、视频处理、自然语言处理和搜索推荐等推理应用场景,同时集成高密度视频解码,广泛适用于云端与边缘ag九游会j9登录入口旧版的解决方案,节省设备投资、降低运营成本。

通用 ai 推理加速卡,效率超越英伟达

基于 sv102 芯片,瀚博推出了适用于云服务器的 va1 机器学习加速卡,其提供高效率深度学习 ai 推理加速,在同等能耗下可以实现 2-10 倍于 gpu 的最高 ai 吞吐率,适合实时应用,同时兼备良好的通用性和可扩展性,支持 fp16, bf16 和 int8 数据类型的众多主流神经网络快速部署——包括检测,分类,识别,分割,视频处理,lstm/rnn,nlp/bert,搜索推荐等。

瀚博半导体 cto 张磊向我们介绍了 va1 加速卡的性能指标。

va1 具备强大的视频处理性能:支持 64 路以上 h264,h265 或 avs2 1080p 解码,分辨率支持最高达 8k。另一方面,作为标准半高半长 75w 功率的 pcie 4.0 板卡,va1 适用于绝大多数服务器,被动散热且无需额外供电,可实现高密度的部署。

和英伟达最新发布的安培架构 a10 板卡对比,在 resnet-50(int8)任务上,瀚博芯片在 75w 功率时效率是对手的两倍以上。「即使英伟达的产品运行在 150w,我们的芯片运行在 75w 功率时性能也是超过它的,」张磊介绍道。「在 bert int8 任务上,va1 的性能也是 a10 在 75w 上的两倍,t4 的两倍多。」

如果以整体运行成本 tco 的方式来计算,采用 va1 的服务器整机算力可以达到 t4 设备的 2.5 倍以上,功耗却相对更低,可以节省超过 60?服务器成本。

除了硬件产品外,瀚博也搭建了自己的 vaststream 软件平台,支持 tensorflow、pytorch、caffe2 等主流深度学习框架模型。

今年 6 月,sv100 系列芯片宣布测试成功。瀚博创造的几个数字引人关注:在开始测试后 8 分钟全部点亮,在 40 小时之内,芯片所有功能模块基础测试全部完成。对于全新设计的高端芯片来说,这是一个奇迹。

「我们与重要九游会登录j9入口的合作伙伴快手的合作非常紧密。打造芯片必须理解客户的实际需求,我们打造了高性能的数据中心,会把最新的板卡插在服务器里,跑各类实际应用,验证产品的性能。」钱军表示。据介绍,目前已有多家国内外科技公司正在和瀚博合作,并等待芯片的大规模量产。

除了 sv102 以外,瀚博半导体还计划推出功率为 15w 和 150w 的推理产品,覆盖更多市场。

「我们不是一个国产替代的故事,我们希望打造国际级别的产品。为了这样的目的,我们组建了有能力的团队。」钱军说道。

瀚博半导体于 2018 年底成立于上海,目前在北京、深圳、多伦多等地均设有研发中心。

这家公司的核心团队源自于 amd,部分成员曾设计了业界首款 7nm 制程 gpu。自公司创立起,瀚博一直致力于核心 ip 的自主研发,至今已完成多个 ip、高端设计流程,并拥有完善的数据中心构建能力。目前,瀚博的员工总数已超过 200 人。

在融资方面,2019 年 3 月,瀚博获得了来自真格基金的天使轮融资,2019 年 7 月完成 pre a 轮。2020 年 7 月,红点、快手领投了该公司的 a 轮融资;最近一轮则在今年 3 月,由中国互联网投资基金和经纬中国联合领投,融资金额高达 5 亿元人民币。

瀚博旗下首款芯片的推出,宣告了国内 ai 芯片业内又加入了一股强大的势力。随着各家的 dsa 芯片不断出炉,国内造芯的竞争已经进入了全新的阶段。

3.真格天使项目「瀚博半导体」完成a 轮5亿元人民币融资

donews4月28日消息(丁凡)今日,ai视觉芯片研发企业瀚博半导体宣布完成5亿元人民币a 轮融资,由中国互联网投资基金和经纬中国联合领投,现有股东红点创投中国基金、五源资本、赛富投资基金、耀途资本、天狼星资本和元木资本跟投。真格基金曾参与瀚博的种子轮融资。

瀚博半导体所设计的ai计算芯片能实现ai和视频处理的高度协同。公司目前与国内互联网头部算力公司深度合作。在未来,公司致力于把云端ai 视频处理芯片的ag九游会j9登录入口旧版的解决方案快速推进到多个处于爆发期的下游行业,进一步引领人工智能在应用领域的飞速发展和突破。

此次融资将进一步夯实公司自研芯片和ag九游会j9登录入口旧版的解决方案的全球化商业落地,拓展并布局其它多个高增长应用场景,以及汇聚更多优秀人才加入公司。

本文源自donews

作者头像
xidian创始人
上一篇:火锅食材有哪些(涮火锅必备菜)
下一篇:火龙果性(火龙果的10个禁忌)
网站地图