在我们的日常生活中,搜索引擎的作用可谓举足轻重。截止至2021年6月,我国搜索引擎用户规模达7.95亿,较2020年12月增长2567万,占网民整体的78.7%。
搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。
随着近两年人工智能技术的爆发式进步,算法、算力和数据之间的良性循环,对产业升级和经济变革的影响越来越突出。AI的加入,使得搜索技术迈向了一个新的台阶,帮助用户更方便的获取信息。
对于搜索引擎来说,最重要的是两件事:
第一是智能程度,指的是理解用户意图和文档,然后快速找出答案,这是智能部分。
第二是自然程度(Naturalness),指的是根据用户输入的搜索请求,把搜索结果很自然地展现给用户,整体表现就是搜索非常流畅。
自然语言从搜索引擎出现开始一直到今天为止,都对搜索引擎的智能和自然这两个方面起到了极为重要的作用。
微软公司为进一步提升旗下Bing搜索引擎的智能程度和自然程度,以为用户呈现更优质、切合的内容推荐,准备对其NLP的多项核心技术进行升级,包括机器翻译、问答、信息检索、信息抽取、对话、知识工程,还有自然语言生成、推荐系统等。
而由于NLP技术对标注数据依赖性较高,获取大规模的高质量标注数据永远是个难题。微软为解决这一问题,尝试采用半监督或无监督的方法,包括零样本学习或小样本学习,但虽然未标注数据容易获取,并且数据量很大,但这同时也对其现有算力提出了挑战。并且,为实现更实时高效的技术调优,可在实验室中直接放置的高算力工作站解决方案是其当下的首选。
为支持客户NLP优化中无监督预训练的算力需求,超集信息为其提供了基于AMD EPYC™ 7003系列处理器平台的7卡全液冷高性能静音工作站解决方案——ServMAX® TL73-H3。
TL73-H3采用封闭式设计,基于单路AMD EPYC™ 7003/7002系列处理器,采用CPU和GPU全液冷散热,搭载7张液冷GPU,560GB超大显存,TF32整体性能高达980TFLOPS,整机满负荷运行噪声低于53dB。这不仅为客户提供了强劲的算力支持,极低的噪音值更完美匹配了客户对于算力设备实验室环境下直接放置的要求。
并且,超集信息在此前液冷工作站设计基础上,对TL73-H3的整体结构和空间进行了相应升级,不仅实现了7片全液冷GPU的搭载,设备整体稳定性以及维护便捷度都得到了大幅提升,整机可在30℃环温下稳定运行,为客户带来极佳使用体验。
7片Ampere GPU搭载
超集信息凭借丰富的液冷经验,基于此前的专利金属焊接冷板进一步研发,成功推出了20mm的单宽GPU冷板,这也是TL73-H3能够实现多片GPU搭载的关键所在。当然,全新冷板绝不仅实现了单宽的改造,其还具备以下关键优势:
采用6063T5铝材,具备高导热性
一体化焊接工艺,无橡胶圈密封,具备高气密性,杜绝漏液风险
内部流道采用锯齿工艺,最大程度增加接触面积,提高热量传递效率
在全新冷板的帮助下,TL73-H3实现了单颗280W AMD EPYC™ 7003/7002 CPU+7片NVIDIA Ampere GPU的支持,彻底颠覆了常规风冷工作站的GPU数量限制,突破了传统工作站的计算力桎梏,创下多项极限记录。
杜绝性能瓶颈
以搭载1*AMD 75F3 CPU+7*NVIDIA A6000 GPU的配置为例,在TensorFlow、PyTorch、MxNet框架下的测试,GPU 性能随着数量基本呈线性增长,TL73-H3性能表现优异。此外,我们进行了跨平台的对比测试。TL73-H3(1*75F3 + NVIDIA GPU)对比TL40-X3(2*8368Q+NVIDIA GPU),在1GPU与4GPU的情况下,两者的GPU性能表现几乎没有差 异;TL73-H3(1*75F3 + NVIDIA GPU)对比G428-X3(2*8358+NVIDIA GPU),在1GPU、4GPU、7GPU的情况下, 两者的GPU性能表现几乎没有差异。由此可见,部分客户担忧的单路CPU设计并不会成为限制7片GPU性能发挥的瓶颈。
通过超集信息带的算力升级方案,微软不仅成功实现了NLP多项核心技术的升级,完成了Bing搜索引擎的进一步优化, 全新液冷工作站解决方案的极低噪音更带来了极佳的使用体验,实现了实验室环境下的高效办公。