
“這張海報就是由大模型生成的。”徐立說,“除了聚焦本身發(fā)布的參數(shù)之外,我們今年更多的關注了行業(yè)的場景落地,并以行業(yè)來驅動人工智能的爆發(fā)”。
4月23日,商湯技術交流日在上海臨港正式開幕,延續(xù)著上一次的開場方式,商湯科技董事長兼CEO徐立,依然在正式介紹前展示出了一張幻燈片:海報呈漆面工藝風格,主要景物以山、樹木等靜態(tài)物質(zhì)為主。據(jù)悉,此次商湯科技推出的是全新版本的「日日新5.0」。

商湯科技董事長徐立強調(diào):目前,日日新5.0大模型體系綜合能力全面對標GPT-4,技術領跑加速生成式AI向產(chǎn)業(yè)落地的全面躍遷,實現(xiàn)大模型按需所取。
高達200K的推理上下文窗口,日日新5.0全面對標GPT-4Turbo
2023年,AI浪潮來襲,商湯科技的大模型體系也在“大模型 + 大裝置”的戰(zhàn)略規(guī)劃下,持續(xù)高效的進行著優(yōu)化與升級。
自去年4月商湯「日日新 SenseNova」大模型體系正式問世以來,其已正式推出五個大版本迭代。而今,商湯新一代「日日新 SenseNova 5.0」時隔一年正式問世,對已有的多個大模型進行全方位升級外,還創(chuàng)造了一些「嶄新的面孔」。

據(jù)悉,基于超過10TBtokens訓練、覆蓋大量合成數(shù)據(jù),升級后的“日日新SenseNova 5.0”采用混合專家架構,推理時上下文窗口可以有效到 200K 左右。同時,日日新5.0在自然語言能力(大量中文預料的構建)、綜合推理(包括數(shù)字推理)、代碼生成、多模態(tài)交互等整體表現(xiàn)上「更上一層樓」,全面對標GPT-4 Turbo ,并且常用的客觀評測上達到或超GPT-4 Turbo系列模型。
首先,發(fā)布會上,商湯科技以“高考中紅樓夢的相關撰文需求”展示了日日新5.0的答題能力。測試結果發(fā)現(xiàn),日日新5.0不僅解題速度十分優(yōu)秀,還摒棄了大模型最常應用的傳統(tǒng)撰文套路,以發(fā)散的撰文思維及時下最熱互聯(lián)網(wǎng)“熱點”完成了此次創(chuàng)作。
數(shù)學題目測試中,商湯科技選擇了以“13個小朋友玩老鷹捉小雞,捉住了5只小雞外,還剩幾只小雞”為題干,讓ChatGPT4.0及日日新5.0分別進行回答。測試結果顯示,這兩款大模型在答數(shù)學題的能力上差異顯著。
可見,在數(shù)學能力方面,日日新5.0大模型面對邏輯謎題能夠跳出坑位,給出解決方案。基于此,商湯科技董事長兼CEO徐立強調(diào):“在很多情況下,如果說模行要有行業(yè)上的差異化,把行業(yè)化的數(shù)據(jù),以及行業(yè)化數(shù)據(jù)背后的理解疊加,一定是形成一個差異化的競爭能力”。
其次,多模態(tài)方面,商湯科技以“一頭老象在茂密的森林中”為命題測試了日日新5.0生圖能力,并與行業(yè)內(nèi)領先的一眾“對手”進行對比,測試結果顯示,這幾款大模型在生圖的能力上風格不同,各有千秋。

而在以“人”為主的生圖測試中,相較于之前,日日新5.0多模態(tài)的迭代能力有著十分明顯的提升,在人物細節(jié)構造上(即凌亂的頭發(fā)、復雜的皮膚紋理)都十分出色。反觀其他“幾個友商”都在皮膚及發(fā)型上有不同程度的模糊化加工。
在本質(zhì)上將“合成與理解”放在一起的技術處理上,商湯科技以“未來派建筑,樓頂有一個白色陶瓷LOGO——Sensenova”為命題進行了測試。
從各家大模型的回復中,我們注意到,除日日新5.0外,對于文字嵌入建筑當中均有一定的缺失,包括文字的理解,及LOGO的擺放位置等等。
反觀日日新5.0,除了完全理解“需求”外,甚至對于LOGO細節(jié)處的倒影,及水面波浪式的紋理都做出了具象化的處理。
再有,數(shù)據(jù)推理多模態(tài)能力上。商湯科技以長圖嵌入數(shù)據(jù)分析為例,展示了圖片文字拆分,圖片文字理解,基于長圖思考形成邏輯性回答的能力。

值得注意的是,本次發(fā)布會的演示環(huán)節(jié),依舊采取的現(xiàn)場直播演示,相較于上一個版本,日日新5.0的確在理解能力、邏輯能力以及數(shù)學能力的展示上更加全面及詳細。
大模型之家認為,作為商湯「日日新SenseNova」大模型體系的通用基礎模型,日日新5.0的大幅度升級使得人們在使用模型處理多樣化語言任務時更高效、更準確,讓國產(chǎn)大模型擁有了與 GPT-4 相媲美的使用體驗。
同時,對于整個行業(yè)來說,未來基于此模型基礎上開展的學術研究、技術創(chuàng)新、商業(yè)應用也有了更多機會。
推出企業(yè)級一體機,商湯朋友圈均有新動作
基礎模型升級之外,基于金融、代碼、醫(yī)療、政務等重點行業(yè)邊緣側日益增長的AI應用需求,商湯科技推出了企業(yè)級一體機,主打高性價比、開箱即用、數(shù)據(jù)安全及國產(chǎn)化芯片全適用。
據(jù)悉,一體機為2-42架構(即商湯獨創(chuàng)),可達到2P算力,256G顯存及448GB/s的連接。可同時支持企業(yè)級千億模型加速和知識檢索硬件加速,實現(xiàn)本地化部署,即買即用,降低企業(yè)應用大模型的門檻。相比行業(yè)同類產(chǎn)品,推理成本節(jié)約80%,檢索大大加速,CPU工作負載50%。

此外,商湯科技還推出了創(chuàng)新的端云協(xié)同解決方案,該方案能夠智能地判斷并協(xié)同發(fā)揮端側與云端各自的優(yōu)勢。在需要聯(lián)網(wǎng)搜索或處理復雜場景時,該方案能夠智能地將任務分流至云端處理,而在部分場景中,端側處理的占比甚至超過了80%,從而大幅降低了推理成本,提高了整體效率。
值得注意的是,商湯科技日日新·端側大語言模型的推理速度達到了業(yè)內(nèi)最快水平。在中端平臺上,該模型能夠實現(xiàn)平均18.3字/s的生成速度,而在旗艦平臺上更是高達78.3字/s,為用戶提供了極速的語言處理能力。
而商湯科技的擴散模型,同樣在端側展現(xiàn)了業(yè)內(nèi)最快的推理速度。其端側LDM-AI擴圖技術在某主流平臺上的推理速度小于1.5秒,相較于友商的云端應用,速度提升了驚人的10倍。更值得一提的是,該技術支持輸出1200萬像素及以上的高清圖片,并允許用戶在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能,為用戶帶來了極致的便捷和高效體驗。

而在自身應用方面,商湯“日日新SenseNova 5.0”在秒畫、如影、格物、瓊宇、大醫(yī)、小浣熊家族等產(chǎn)品均有重要更新。
此外,在發(fā)布會中,商湯還邀請了金山辦公、華為、小米、閱文集團等多位生態(tài)伙伴嘉賓,共同探討和交流大模型技術在辦公、金融、出行等不同領域的應用及前景。
金山辦公方面,基于“日日新”大模型的卓越代碼生成及工具調(diào)用能力,助力WPS365打造更高效釋放場景能力的辦公新質(zhì)生產(chǎn)力平臺,為企業(yè)構建專屬的“企業(yè)大腦”。
海通證券方面,其攜手商湯科技共同推出了金融行業(yè)專用的多模態(tài)全棧式大模型。這一合作不僅助力雙方在智能客服、合規(guī)風控、代碼輔助、展業(yè)辦公助手等多個領域實現(xiàn)業(yè)務的實際應用,還共同深入研究了智能投顧、輿情監(jiān)控等行業(yè)前沿場景,成功打通了證券行業(yè)大模型從研發(fā)到落地的全棧式能力。
小米則在旗下最新發(fā)布的SU7中應用了商湯的大模型技術,并基于商湯端云大模型解決方案,以小米小愛同學為車主提供智能化交互體驗。
華為方面則宣布了與商湯聯(lián)合發(fā)布面向金融、醫(yī)療、政務、代碼等行業(yè)的大模型,并強調(diào),雙方將發(fā)揮各自在算力、數(shù)據(jù)、場景等方面優(yōu)勢,共建大模型生態(tài),加速人工智能走深走實。
AI競技,商湯底氣何在?
值此商湯技術交流日之際,截至今日收盤,商湯科技股價上漲1.67%,報收0.61元/股,可見資本對于日日新大模型5.0的看好。
聯(lián)想到實際業(yè)績上,據(jù)3月26日商湯科技發(fā)布的2023年業(yè)績報告顯示:2023年公司整體營業(yè)收入34億元人民幣,其中生成式AI收入達12億元,占集團總收入比例升至35%,實現(xiàn)近200%增長。這也是商湯成立十年以來,以最快速度實現(xiàn)從無到有,并取得超過10億收入體量的新業(yè)務。
對此,商湯集團董事長兼CEO徐立博士曾公開表示,“生成式AI對商湯來說已不僅僅是技術領域的變革性創(chuàng)新,更成為公司的核心業(yè)務。商湯生成式AI業(yè)務的增長,得益于各行各業(yè)對大模型的訓練和推理的廣泛需求,這預示著中國硬科技投資的新周期正式開啟。商湯通過在各業(yè)務層面深入融合生成式AI能力,正在贏得新客戶,并推動效率和生產(chǎn)力的全面提升。”無疑,全新的 AI 2.0 時代下,商湯正加速轉型變革,以通用人工智能(AGI)目標打造全新面貌的“商湯 2.0”。
眼下,AI賽道的戰(zhàn)火已經(jīng)燃燒到了行業(yè)場景的落地上。而能夠引領大眾欣賞世界的大模型,不僅為用戶帶來了更多的想象力,也為整個行業(yè)帶來了更加具象化的商業(yè)應用憧憬。
在此背景下,為了在千行百業(yè)中用好它們,真正實現(xiàn)「行業(yè)場景落地」,一套完整的體系勢必能讓我們事半功倍。而從今日的技術交流日來看,在這一方面,商湯已經(jīng)做好了準備。